基于飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。
本项目是阿里云视觉智能开放平台的人脸搜索M:N的开源替代,项目中使用的模型均为开源模型,项目支持opensearch、milvus和proxima向量存储库,并具有较高的自定义能力。
YOLOSHOW - YOLOv5 / YOLOv7 / YOLOv8 / YOLOv9 基于 Pyside6 的图形化界面
基于深度学习的智能车牌识别,支持14种中文车牌类型。
🚀 基于 OpenCV 的 Webcam 脚本程序,适用于计算机视觉数据采集,实时视频帧收集等。具有安装便捷、操作简单、跨平台等特点。
基于 PyTorch 和 MMCV 的视频理解工具库,支持动作识别、动作定位、时空动作检测和骨骼动作识别等多种任务。
基于 PyTorch 的姿态估计算法库,支持人体、人手、人脸、动物、服装等多类物体的 2D/3D 姿态估计。
基于 PyTorch 和 MMCV 的通用目标检测平台。支撑了 3D 目标检测、旋转框检测、场景文字识别、姿态估计、目标跟踪等算法库中检测算法的实现;支持 2D 目标检测、实例分割、全景分割任务;支持算法多样,涵盖了单阶段、双阶段和级联模型等各任务中的典型算法和各类训练技术;为通用目标检测算法的研发提供了高性能基准
🚀 基于 Gradio 的 YOLOv5 通用目标检测系统,可自定义检测模型、演示便捷、安装简单。