cs5

2022年01月23日 标签1 标签7 前端技术

Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.

anchor

anchor boxes是学习卷积神经网络用于目标识别过程中最重要且最难理解的一个概念。这个概念最初是Faster R-CNN中提出,此后在SSD、YOLOV2、YOLOV3等优秀的目标识别模型中得到了广泛的应用。

一些目标检测方法

1、滑动窗口

这是比较原始的目标检测方法,给定一个固定尺寸的窗口,根据设定的步伐,一步一步的从左至右、从上至下滑动,把每个窗口输入到卷积神经网络中进行预测和分类,这样做有两个缺点:

  • 由于窗口尺寸固定,因此不适合形变较大的物体
  • 窗口较多,运算量大

2、区域建议

这是R-CNN系列中核心的思想,以Faster R-CNN为例,模型中使用了两个神经网络,一个是是CNN,一个是RPN(Regional Proposal),区域建议网络不负责图像的分类,它只负责选取出图像中可能属于数据集其中一类的候选区域。接下来就是把RPN产生的候选区域输入到分类网络中进行最终的分类。

3、anchor box

anchor box第一次是出现在Faster R-CNN的论文里,要理解anchor box ,首先要理解两个问题:

  • 一个窗口只能检测一个目标
  • 无法解决多尺度问题。

目前anchor box的选择主要有三种方式:

  • 人为经验选取
  • k-means聚类
  • 作为超参数进行学习

image-20210526201745015

image-20210526114012834

image-20210526153007639

image-20210526165004244

image-20210526165030765

YOLOV3

Inked2018100917221176_LI

三尺度输出:

多尺度检测方法,

num_epochs = 60, learning_rate = 0.00025, warmup_steps=20000, lr_decay_epochs=[20,40],

image-20210601121911677

image-20210602110652148

image-20210602230117311

image-20210602234512919

image-20210604092252757

Baseline设置:参考COCO