YOLOv1

缺点

  • 对小目标检测效果不好
  • 提取的region太少了,7*7*2
  • 坐标定位不准确

YOLOv2 - Better,Faster,Stronger

Better

  • Batch Normalization
  • 引入 Anchor Box 来预测Bouding box
  • 维度聚类,使用K-means聚类bounding box,可以找到更好地box宽高

Faster

  • 借鉴VGG,NIN思想,多次使用1*13*3等较小的卷积核以及使用全局平均池化,设计出darknet-19模型,大大节约计算量

Stronger

  • COCO数据集少,ImageNet数据集多,使用wordtree结合了两个数据集的标签,使得能够检测9000多种目标

YOLOv3

改进

  • 特征提取器,设计Darknet-53,融合了darknet-19和残差网络等,更高效地提取特征
  • 使用了多尺度预测,类似于 FPN(Feature Pyramid Network-特征金字塔网络),三层不同scale的特征一起做bbox regression
  • 分类预测使用二元交叉熵损失,边界框bbox regression 使用 平方和距离误差损失