Yolo模型

YOLO（You Only Look Once）是一组实时目标检测机器学习算法，定位和分类图像中的物体。

Yolo 之前R-CNN 和Fast R-CNN。这些方法使用两步流程，先预测边界框，然后使用回归对这些框中的物体进行分类。这种方法速度慢且耗资源。

Yolo v1-v3 由Joseph Redmon等开发：https://pjreddie.com/darknet/yolo/

Yolo v5/v8/v11 由Ultralytics团队研发：https://github.com/ultralytics，没有论文，有网站。

Yolo v6 美团开发：https://github.com/meituan/YOLOv6/

Yolo v4/v7/v9 由Chien-Yao Wang等研发：https://github.com/WongKinYiu

Yolo v10 清华大学：https://github.com/THU-MIG/yolov10

Yolo v12 ：https://github.com/sunsmarterjie/yolov12

YOLO v1-v3

2016 年，Joseph Redmon 和 Ali Farhadi 两位大神开发了第一个 YOLO，它通过新的增强架构克服了传统目标检测算法的大多数问题。

最初的 YOLO 架构由 24 个卷积层和 2 个全连接层组成。同时使用了以下优化技术：

YOLO 模型的本质是将目标检测视为回归问题。YOLO 方法是将卷积神经网络 (CNN) 应用于整个图像。该网络将图像划分为区域并预测每个区域的边界框和概率。

存在的问题：

基于Pytorch构建。

Redmon J , Divvala S , Girshick R ,et al.You Only Look Once: Unified, Real-Time Object Detection[C]//Computer Vision & Pattern Recognition.IEEE, 2016.DOI:10.1109/CVPR.2016.91.
Redmon J , Farhadi A .YOLOv3: An Incremental Improvement[J].arXiv e-prints, 2018.DOI:10.48550/arXiv.1804.02767.