先来放个我的笔记图

下面是关于传统目标检测算法综述的笔记图,关于相关的文字描述想要copy的可以直接到下一部分,之前偷懒就没有放上来,现在直接copy放到后面了。用图说明一下来源哈,感谢配合。

在这里插入图片描述

实质步骤

滑动窗口+传统机器学习分类器

基本框架

传统的目标检测框架,主要包括三个步骤:
(1)利用不同尺寸的滑动窗口框住图中的某一部分作为候选区域;
(2)提取候选区域相关的视觉特征。比如人脸检测常用的Harr特征;行人检测和普通目标检测常用的HOG特征等;
(3)利用分类器进行识别,比如常用的SVM模型。

滑动窗口法

在传统的目标检测算法中,第一步需要对输入图片进行候选框的提取。但候选框是如何产生的?又是如何进行筛选的呢?
在传统的目标检测算法中,候选框主要依赖于滑动窗口法。

滑动窗口法

A. 基本原理:采用不同大小和比例(宽高比)的窗口在整张图片上以一定的步长进行滑动,然后对这些窗口对应的区
域做图像分类,从而实现对整张图片的检测。
B. 缺点:
a. 设计的复杂性:由于不知道检测的目标大小是什么规模;所以需要设置不同大小和比例的窗口去滑动,而 且还要
选取合适的步长
b. 计算量大,效率低
c. 对分类器要求高
C. 具体步骤:
首先对输入图像进行不同窗口大小的滑窗进行从左往右、从上到下的滑动。每次滑动时候对当前窗口执行分类器(分
类器是事先训练好的)。如果当前窗口得到较高的分类概率,则认为检测到了物体。对每个不同窗口大小的滑窗都进
行检测后,会得到不同窗口检测到的物体标记,这些窗口大小会存在重复较高的部分,最后采用非极大值抑制
(Non-Maximum Suppression, NMS)的方法进行筛选。最终,经过NMS筛选后获得检测到的物体。

图解

在这里插入图片描述
用图请说明来源,感谢配合。

特征提取

卷积————》特征提取,对每个窗口中的局部信息进行特征提取;传统的方法中包括:基于颜色、基于纹理、基于形状的方法,以及一些中层次或高层次语义特征的方法,这些方法有些是需要学习得到的。如:抽取基本的直方图特征,常见的纹理特征,
(1)底层特征:颜色,纹理这些最基本的特征;
(2)中层次特征:基于底层特征利用机器学习的方法进行特征挖掘特征学习过程之后的特征,包括PCA特征,LDA学习之后的特征,等等一些基于优化理论来完成的特征学习;
(3)高层次的特征:将低层次和中层次特征进行进一步的挖掘和表示,比如对于一个人可以采用是否带帽子戴眼镜等等语义特征进行表示。目标检测算法中通常使用的方法集中在低层次和中层次两种,也就是基于手工设计的特征和基于学习的特征两大类。

分类判定+非极大值抑制

在特征提取后,需要对候选区域提取出的特征进行分类判定。

单类别目标检测

只需要区分当前的窗口中所包含的对象是背景还是目标。

多分类目标检测

在单类的基础上,进一步的区分当前窗口中对象的类别。
在经过对复选框判定后就会得到一系列的可能为检测目标的候选框,这些候选框可能会存在一些重叠的状况,这时需要一个NMS来对候选框进行合并,最终得到需要检测的目标也就是算法最终输出的结果。

常见的传统目标检测算法:

(1)Viola-Jones【人脸检测】
(2)HOG+SVM【行人检测】
(3)DPM【物体检测】
(4)Sofe-NMS

Viola-Jones

下面是关于Viola-Jones的相关笔记图。
在这里插入图片描述

Logo

瓜分20万奖金 获得内推名额 丰厚实物奖励 易参与易上手

更多推荐