【中篇】从 YOLOv1 到 YOLOv8 的 YOLO 物体检测模型历史

时间:2024-06-10 07:08:33

YOLO 型号之所以闻名遐迩,主要有两个原因:其速度和准确性令人印象深刻,而且能够快速、可靠地检测图像中的物体。上回我解释了Yolo v1, 今天从Yolov2开始。

YOLOv2:更好、更快、更强

在这里插入图片描述
2017 年 7 月一个闷热的星期二下午,雷德蒙(Joseph Redmon, Yolo创始人)再次走上舞台。

在演讲中,雷德蒙分享了题为《YOLO9000:更好、更快、更强》(YOLO9000: Better, Faster, Stronger )的论文,并介绍了一个能够识别超过9000个类别的物体检测系统。这个名为 YOLOv2 的模型在 PASCAL VOC2007 数据集上的平均精确度(AP)达到了令人印象深刻的 78.6%,超过了其前身 YOLOv1,后者仅为 63.4%。这些发现彰显了 YOLOv2 在物体检测和识别方面的先进能力,为计算机视觉领域的未来发展铺平了道路。

该系统在多个方面进行了改进。

这些改进包括对卷积层进行批量归一化,以提高收敛性并减少过度拟合。增加了高分辨率分类器,从而提高了高分辨率输入的性能。架构改为完全卷积层,包括一个名为 DarkNet 的骨干层,其中包含 19 个卷积层和 5 个最大池化层,现在使用锚框预测边界框。