英语原文共 12 页,剩余内容已隐藏,支付完成后下载完整资料
通过分段线性支持向量机在图像中进行人体识别
Qixiang Ye,IEEE会员, Zhenjun Han, IEEE成员, Jianbin Jiao, IEEE会员,Jianzhuang Liu, IEEE高级会员
摘 要
图像中的人体识别困难在于视图角度和人的姿态是变化的。在此篇论文中,我们提出了用分段线性支持向量机(PL-SVM) 的方案去解决这个问题。这个方案是去寻找一个分段的判别函数并以此来建立一个非线性的分段边界,以此从多维度的特征空间背景里来区分多个角度和多个姿态的人体。分段线性支持向量机训练被设计用来进行特征空间的迭代过程以及线性支持向量机训练,其目标在于使局部的线性支持向量机裕度最大。每个分段的支持向量机模型,其在对应的具有特殊的视图和姿态的人群所对应的子空间内是可靠的,在分段线性支持向量机中包含有一个带有块定位功能和柱状图梯度功能的级联探测器。通过大量的实验表明本方案在精准度和计算效率方面都不逊色于几种现有的向量机方案,而且我们的方案在低分辨率的人群背景下对人体区域的识别中表现最好。
关键词:分类,对象识别,分段线性,支持向量机。
第一章 绪论
在机器人技术,娱乐应用,监控,以及驾驶中周围行人预警为例的各种图像传感的应用中,一个重要的问题便是在图像和视频里能识别出人体。近些年来,在普通摄像视角以及静态背景的视频中的人体识别已经的被广泛的提到,但在摄像视角多变,背景变化复杂,更可怕的是在人体有许多不同的姿势也有很多不同的角度的情况下,对人体的识别依旧是一个大问题。现今的人体识别方案中,对特征识别和如何设计分类器仍是两大难点。能识别人体的可视化特征描述符就由此诞生了,比如Haar-like特征集[5],HOG [6], v-HOG [7], 基于皮质特征的Gabor滤波器[8],协方差特征[9],局部二值模式 (LBP) [10],HOG-LBP [11],小边特征[12],Shapelet特征[13],局部感知域[14],多尺度方向特征[15],自适应的局部轮廓特征[16],Granularity-tunable Gradients Partition (GGP) 特征符[17],pose-invariant特征符[18],一个最近的研究表明运用多种不同的视觉特征如动作和厚度信息会使其有更出色的表现[19]。
在标签样本中提取到的特征常常被送到一个分类器中用作训练在几个具有里程碑意义的人体识别方案中线性支持向量机是最常用到的,但是当需要去识别多角度多姿态的人体时,线性支持向量机的表现往往不尽人意,在实验中观察到,从不同的角度观察多姿态的人体时,很难进行线性的分类从而形成了差异。一个要求能够用线性支持向量机正确地将多视角多姿态的人体分类的算法往往导致过度拟合。一些非线性的分类方案,就提供了解决这个问题的一些选择。比如核函数的方案。此外,核技巧在高维度特征中的应用则会放大维度灾难。
另一方面,有些方案中使用分治算法来解决多视角多姿态问题,其方案是先将阳性训练分解为许多亚类,然后训练多个模型用以识别[21],[22]。在[21],[22]中树状结构和金字塔状增强型分类器是为了识别图片中多视角的人体而提出的。使用这种分治算法可以减少训练过程的经验误差进而可以在某些情况中表现更出色,但是有些情况下这个算法依然会带来更高的结构性风险以及更高的假阳性情况。
另一个解决多视角多姿态识别问题的方案是将人体分区识别[2],[23],[24],将人体的每个部分看作为一个小的低维度非线性的变形量,因此可以更好地用线性分类器来识别。
在[2]中提出了一种DPM模型来进行人体识别。人体部分和其空间偏差用含有潜变量的支持向量机结构来建模,当进行训练和识别时执行一个局部的搜索操作来优化每个部分的模型,这种方案叫做局部变型。使用局部变形可以避免受到角度和姿态的影响。在[24]中对于DPM的延伸是用来共享多种混合的组件模型和对象类的一部分。这导致了更多的精简模型库的产生并使多组分间共享训练样本成为可能,从而减少了有限规模的训练集的影响。DPM方案提供了一种被用于对象识别的简洁的框架,代表了人体识别方案中的最高水平。但是对于低分辨率的人体对象来说该方案就显得力不从心了,因为低分辨率的图片并不会起到优化的作用。
在机器学习的研究中分段和局部支持向量机吸引了许多注意力[25]–[27], [28], [29],这归功于他们在全局核心支持向量机中的优异的表现。在[26]中,作者推导了分段支持向量机的结构风险的上界,但是如何去构建一个分段支持向量机的判定边界却没有更详尽的讨论。在[28]中设计了跨越距离最小化算法(CDMA)来计算非核支持向量机的硬间隔。在[29]中针对多种情况下扩展二进制支持向量机提出了多种类的支持向量机的想法。多种类的支持向量机是用来求出多种分级贝叶斯法则的近似解本文提到的拉格朗日函数支持向量机方法利用分段有识别力的函数来构造一个非线性的分类边界从而可以从多个负值挑出多重正值。在多重向量机的训练中拉格朗日乘数用以解决目标方程的对偶问题在拉格朗日函数支持向量机的训练中,在最近点分析(NPA)中,运用了包含凸包的迭代线性支持向量机,这保证了最终的分类器有最大的余量。在[27]中程等人提出轮廓支持向量机去接近局部的线性分类用距离预计算集群中心最近来判断该样本属于哪个局部支持向量机。尽管轮廓向量机在非线性识别以及低分辨率特征空间中的样本划分中有优势但其样本划分策略仍受到维度灾难的困扰。另外,轮廓支持向量机的最大性能在分类器的训练过程中并没有被考虑到。
在此篇论文中,行人识别是高维度特征空间里边的一个非线性问题分段线性向量机方案最开始是被用作多视角多姿态人体识别的,本文中的分段线性向量机在本质上是不同于其他的用于向量空间划分以及模型训练的分段向量机的。当训练分段线性向量机的时候当从属度达最大化时此特征空间被为各个子空间。每个子空间可以比线性向量机能够更好地判别。这种方法可以确保比只使用一个线性向量机有更小的经验风险。训练分段线性向量机是对训练样本和特征空间的一个迭代除法。迭代的收敛性通过其单调增加和分段线性向量机的有界性来实现的。而且这也保证了分段线性向量机有最大的余量,因此其结构风险很小。这更加保证了其推广能力以及分段线性向量机的工作表现,更提供了一种简单并有效的方式来处理多视角多姿态的人体识别问题。一种新的特征叫做块定位(BO),是被用作当今流行的HOG特征的补充。BO和HOG特征用两个串联的分段线性支持向量机来连接,来改善人体识别的效率以及准确性。
本文的其余部分的组织结构如下。使用推荐的分段线性支持向量机进行人体识别的方法在第三节中有介绍,在第四部分提供了实验结果,第五部分则是结论。
II. 分段线性支持向量机
本节介绍了分段线性支持向量机以及训练方法并给了一个训练的样本X={()},n=1,...,N,其中是一个样本的特征向量表示样本的符号,N表示样本的数量,分段线性支持向量机模型
一个K阶线性向量机组成的分段线性支持向量机,是用一个分段线性函数来描述的。
(1)
在代表第k个法向量为极限为的局部线性支持向量机。在(1)中表示被一个训练样本的子集占用的第k个子空间如图1所示。在(1)中(x)是样本x对于的归属度。从概率的角度,归属度被表示为
(2)
是当样本x输入为k阶的线性支持向量机输出为正值的概率,可能性被定义为支持向量机的函数输出遵循
(3)
其中和是两个参数其计算方法是在其训练子集采用最大似然估计[30],被称为参数化的样本到超平面的距离。通过(2)和(3)可知这个距离越大,其概率也越大,进而其相关支持向量机的从属度也相应提高,以上结论由图2得出。
在遵从(1)和(2)中的从属度最大化准则的条件下,每个线性支持向量机负责一个子空间以此来分级,整个特征空间的非线性分级的最终边界是由线性超平面组成的。
图1
线性分段支持向量机和特征空间分割的示意图,每个子空间由虚线分隔,,分别代表正的子空间所对应的支持向量机1,2,则对应负值部分。不同的正值的子空间对应着不同姿态和不同视角的样本。分段线性向量机的分级区域边界由实线段给出。
图2:样本到超平面距离参数之间的关系分类概率和从属度。
如图1所示,当这一准则被用于使用迭代的方法来区分特征空间以及分配正值样本时,参数化的到超平面的距离会被放大,然后支持向量机的余量也将逐步扩大。这是符合最大余量的原则,确保分段线性支持向量机在实质上保持最初的支持向量机方法。
当执行分类任务时,(1)可被转换为一个分段线性支持向量机的判别函数。
F(x ) = Sign ( f (x )) (4)
并据此使用一个符号函数来进行判别和检测。给定一个训练集我们需要解决如下的多目标规划问题来解决训练分段线性支持向量机的问题。
图三,最初的人类样本划分在一个三维流形嵌入空间。以不同的颜色表示不同的样本点的子集。
上述目标函数假设所有的分段线性支持向量机中的局部向量机都是同等重要的。表示k维样本子集中的样本指数。lambda;是一个参数来平衡训练误差和支持向量机的余量。xi;是一个松弛因子,F(x)表示分段线性支持向量机的一个分段判别函数该函数由(4)来定义。
因为一个局部的支持向量机的一个成分,被破坏了。(5)是一种待定线性约束的程序问题。
它也可以被视为一种隐性支持向量机与隐性样本成员。为了解决(5)所产生的问题,迭代训练过程在以下部分中描述。
B.训练分段线性支持向量机
在训练之前,尽管所有的负值被分配到一个子集,人体的样本最初用在流形嵌入空间中用k聚类算法进行区分,就像图三中所表示的一样。已经被聚集成初始的子集,人体样本被分配到相同的子集均具有较小的差异,这可以让样本的划分比起随机区分来有更好的表现。
局部线性嵌入式算法(LLE)[31]用来构建人体的流形。LLE算法可以通过将低维度样本以及临近保持嵌入算法下的高维度样本定位到低维度的空间中来估算其数值。给定一组高维特征空间中的人类样本,LLE开始寻找基于欧几里得距离最近的相邻的值。然后通过LLE算法确定最优局部凸组合最近的相邻元素来表示每个原始样本。最后它通过求解一个稀疏特征向量问题获得一个嵌入式空间。更具体地说,d与最小的非零特征值相关的特征向量提供有序组一个正交基[31],如图3所示。d被设置为3来保证其简便的可视性。
使用嵌入式空间进行聚类来代替传统的高维特征空间是为了让计算更加简便。一个流形中的相似的视角及姿态以及其嵌入空间的拓扑结构是对其原始空间的一个近似解。因此,我们可以在开始的时候就用将其在嵌入空间聚类的方法将其进行区分。下一步开发以下迭代训练过程来获得问题的最优近似解。
C.训练收敛性的分析
分段线性支持向量机中的每个线性支持向量机是用相邻贯序最小优化的方式来进行训练的。其优化过程使用了如下的函数:
其中表示样本指数为k的子集。表示样本子集的数量。分段线性支持向量机训练的收敛性是通过最近点的算法(NPA)[32]来进行分析的。通过建立一个正的凸包和一个负的凸包来表示k的子集。如图四中的多边形所示。并使isin;,isin;。这样可以使
然后求解和的问题就变成了k阶支持向量机的求解问题了。如果(omega;,bk)是k阶线性向量机,通过使用最大余量的的这个结论。和最近的点对与法向量的点的关系(u,v)可以推导出:
很容易知道k阶的支持向量机的余量等于最近的点对u,v之间的距离。当在算法1的训练过程中执行样本的重新分配任务时,样本被重新分配到支持向量机的一个子集中并使其余量最大。根据(2)-(3)数据仿真样本到该支持向量机的超平面的距离也是最大的。另外,算法的第2.3步是用来保证最近的点对之间的距离不会减小。这保证了训练中最近的点对之间的距离是增加的(或者是单调不减的)因此支持向量机的余量单调增加,又因为其余量是有界的所以该训练是收敛的。
算法1支持向量机的训练
定义:t:迭代次数。:正的迭代样本的迭代次数,:在迭代t时重新分配样本比。
- 初始化
- 迭代
- 输出
图四表示有两个子集的支持向量机的训练。其中代表闭环的归到子集1代表开环的归到子集2.被标为1.2.3.4的样本以及u组成了子集1中的正的凸包。第5.6.7.8.个样本组成了子集2中的正的凸包。假设在当前的迭代过程中,得到了两个距离最近的点对。然后它们被用来生成支持向量机1和支持向量机2中的超平面。在算法I中在经历了第2.1、2.2和2.3步骤之后,根据这些样本的从属度在局部向量机中最大的原则将其分到四个子集中。在图片(4b)中可以看出样本1.2.5.7被分到子集2中,样本3.4.6.8和u被分到子集1中。
图四,插图说明样本的重新分配问题,以及两个支持向量机训练中凸包的变化在其中和四个最近的点对。(a)当前迭代中凸壳及其对应的支持向量机。(b)样本重新分配后的子集(c)在下一次的迭代中凸包以及他们所对应的支持向量机。
图5,HOG 和 BO特征提取方法(a)人的样本(b)HOG细胞(c)HOG在一个方块中的特征提取。(d)在一个细胞中的BO特征提取方法。
Ⅱ.人体识别
分段线性支持向量机的提出可以将两种类型的人体识别进行合并级联探测器的目的在于提高识别的性能。
Ⅲ.结 论
鲁棒性视图和姿态的变化在人
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[146064],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。