Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.
anchor
anchor boxes是学习卷积神经网络用于目标识别过程中最重要且最难理解的一个概念。这个概念最初是Faster R-CNN中提出,此后在SSD、YOLOV2、YOLOV3等优秀的目标识别模型中得到了广泛的应用。
一些目标检测方法
1、滑动窗口
这是比较原始的目标检测方法,给定一个固定尺寸的窗口,根据设定的步伐,一步一步的从左至右、从上至下滑动,把每个窗口输入到卷积神经网络中进行预测和分类,这样做有两个缺点:
- 由于窗口尺寸固定,因此不适合形变较大的物体
- 窗口较多,运算量大
2、区域建议
这是R-CNN系列中核心的思想,以Faster R-CNN为例,模型中使用了两个神经网络,一个是是CNN,一个是RPN(Regional Proposal),区域建议网络不负责图像的分类,它只负责选取出图像中可能属于数据集其中一类的候选区域。接下来就是把RPN产生的候选区域输入到分类网络中进行最终的分类。
3、anchor box
anchor box第一次是出现在Faster R-CNN的论文里,要理解anchor box ,首先要理解两个问题:
- 一个窗口只能检测一个目标
- 无法解决多尺度问题。
目前anchor box的选择主要有三种方式:
- 人为经验选取
- k-means聚类
- 作为超参数进行学习
YOLOV3
三尺度输出:
多尺度检测方法,
num_epochs = 60, learning_rate = 0.00025, warmup_steps=20000, lr_decay_epochs=[20,40],
Baseline设置:参考COCO