YOLOv2/v3的改进
YOLOv1
缺点
YOLOv2 - Better,Faster,Stronger
Better
- Batch Normalization
- 引入 Anchor Box 来预测Bouding box
- 维度聚类,使用K-means聚类bounding box,可以找到更好地box宽高
Faster
- 借鉴VGG,NIN思想,多次使用
1*1
和3*3
等较小的卷积核以及使用全局平均池化,设计出darknet-19模型,大大节约计算量
Stronger
- COCO数据集少,ImageNet数据集多,使用wordtree结合了两个数据集的标签,使得能够检测9000多种目标
YOLOv3
改进
- 特征提取器,设计Darknet-53,融合了darknet-19和残差网络等,更高效地提取特征
- 使用了多尺度预测,类似于 FPN(Feature Pyramid Network-特征金字塔网络),三层不同scale的特征一起做bbox regression
- 分类预测使用二元交叉熵损失,边界框bbox regression 使用 平方和距离误差损失