英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料
基于分块PCA方法改进的面部识别技术
Rajkiran Gottumukkal, Vijayan K.Asari
VLSI Systems Laboratory, Department of Electrical and Computer Engineering, Old Dominion University, 231Kaufman Hall, Norfolk, VA 23529-0246, USA
Received 13 September 2002; received in revised form 3 November 2003
摘要:本篇论文提出了一种基于分块主成分分析的人脸识别算法。这个算法与传统的PCA算法相比提高了人脸图像在光照方向和面部表情剧烈变化下的识别率。这种技术是将人脸图像分成小的子图,并使用PCA算法处理这些子图。因为即使是在姿态,光照方向,面部表情变化时人脸的部分面部特性也不会变化,所以本文在处理人脸图像时通过分块PCA方法适应上述几种变量的变化。传统PCA方法和分块PCA方法的准确性可以通过使用标准人脸数据库在表情,光照,和姿态变化的情况下进行评估。
关键词:主成分分析;脸部识别;模块化主成分分析;姿态不变性;光照不变性
1 引言
人脸识别是一个很困难的问题,因为同一个人的不同的人脸图像相当于是掺杂了众多变化的大体相同的脸部形状。人脸图像会随着面部表情,年龄,角度,光照条件和噪声而改变。人脸识别系统的任务就是使用一种方式识别这些变化量不太相关的人脸图像。
自动人脸识别系统被视为计算机视觉和模式识别领域的一个基础性问题,许多来自不同领域的科学家在研究它。Chellapa等人在1995年提交了一份关于统计方法,神经网络方法和特征方法的调查。目前,主成分分析在正面人脸识别方面有着较好的表现。主成分分析是一种统计方法,是将人脸看作其特征向量的一个子集,即特征脸(Sirovichand Kirby,1987; Turk and Pentland,1991;Moghaddam and Pentland,1997;Martinez,2000;Graham and Allinson,1998)。
PCA也已经被用于指纹设别(Murase等人1981),人造目标识别(Murase and Nayar,1995),工业机器人(Nayar 等人1996)和移动机器人(Weng,1996)。但是测试结果显示在姿态变化30°和光照极度变化的情况下使用PCA方法人脸图像识别率不尽如人意。
本文研究的主要目标是改善人脸识别在受到面部表情,光照和头部姿态变化影响后的准确度。如前文所述,PCA方法已经是人脸识别领域非常流行的技术,但是这种技术在光照和面部姿态变化非常大时并不十分可靠。在本设计中为了提高PCA技术在面部表情,光照和姿态变化条件下的识别准确性,我们提出了分块PCA方法,即传统PCA方法的一个延伸。在分块PCA方法中,人脸图像被分成较小的子图像,并使用PCA方法处理每个小子图。而传统PCA方法是对整个人脸图像进行处理,因此大范围姿态或光照的变化会严重影响识别率。对于分块PCA方法,原始图像被分成子图,姿态或光照的变化只会影响部分子图。所以我们希望这个方法可以比传统PCA方法能有更好的识别率。Pentland等人在1994年提出过一个相似的方法叫做特征空间。在这个方法中PCA方法应用于面部图像的眼睛和鼻子。
本文组织如下:第二节介绍传统PCA方法。第三节阐述分块PCA方法。第四节介绍用于测试人脸识别方法的人脸数据库。第五节介绍当人脸图像设置在强光照和姿态变化下传统PCA方法与分块PCA方法各自的模拟结果。最后,在第六节做出总结。
2 PCA方法的回顾
PCA方法已被广泛应用于人脸识别领域。其主要内容是通过使用从整体人脸(Sirovich and Kirby, 1987)中提取出来的加权组合的特征向量(特征脸),实现整体人脸近似重建,再把选定的图像用被看成全局面部特征的特征图像进行扩展。这个工作的深入延伸是Kirby和Sirovich(1990)的人脸特征图像固有对称性。
人脸数据库中的所有人脸图像用很长的向量,而不是普通的矩阵来表示,这样就构造出了整个图像空间,其中每一个图像就是一个点。由于人脸都有相似的结构(眼睛,鼻子和嘴,方位等等),所以描述人脸的向量都有相互的联系。我们可以看到同一类的人脸图像位于图像空间的某一位置周围,因此人脸图像可以用一组由人脸图像训练生成的协方差矩阵产生的特征向量表示。构造特征图像(我们研究的是特征脸)的目标是要找到一个可以用短的向量描述人脸图像的更低维空间。图1以图形的方式解释了这个想法。
图1 图像空间与面部空间坐标系
2.1 计算特征脸
假设人脸数据库的人脸图像是的,这些图像就可以被表示为维的向量,或维空间的一个点。一组图像相当于一组在高维空间的点。
因为脸部图像在结构上是相似的,这些点不会随机的分布,所以可以使用低维子空间进行描述。PCA给出了这个低维子空间的基向量(称作面部空间)。每个基向量的长,同时协方差矩阵的特征向量与原人脸图像相一致。
,,...,为一组人脸图像训练集。平均脸定义为:
(1)
每个脸偏离平均脸的程度用向量表示,协方差矩阵为:
(2)
协方差矩阵的特征向量可以计算出来,同时选择最大特征值对应的特征向量作为有意义的特征向量。根据这些特征向量,在训练组中每一幅图像的分量通过下式可得:
(3)
其中是最大的特征值对应的特征向量,从1变化到。
2.2 分类
测试图像通过以下操作放入面部空间
(4)
权重组成一个向量,描述了每一个输入面部图像的特征脸的贡献。这个向量可以用来使测试图像与预先确定的脸部类相匹配。一个简单的技巧是通过计算的距离,其中是第类的均值向量。当时,这个测试图像可以认为是第类的,其中,是阈值。
3 分块PCA方法
基于PCA的人脸识别方法在多姿态和光照变化的情况下不是非常有效,因为PCA处理每一幅图像的全部信息时是同时用一组权值进行表示。在上述条件下的权重向量与正常姿态和光照条件下图像的权重向量有很大不同,因此很难正确的识别。但是如果人脸图像被分成较小的区域,同时计算每一个区域的权重向量,这些权重将会更加具有人脸本地信息的代表性。当只有姿态或光照一种因素变化时,只有部分人脸区域会变化,其他区域将会与正常人脸图像区域保持一致。所以脸部区域权重不会受到变化的姿态和光照的影响,将紧密地与同一个人在正常情况下的脸部区域权重相匹配。因此可以通过分块PCA方法提高识别率。但本文预想,如果人脸图像被分割成非常小的区域,将可能丢失人脸的全局信息,分块PCA方法的准确性也就会变差。
在这个方法中,每一幅在训练集中的图像被分成N个小的图像。因此每个子图的大小将是。这些子图用数学表示为:
(5)
其中从1到,是训练集中图像的数量,从1到,是子图的数量,和从1到。图2显示的是将人脸图像使用(5)式在N=4时分成四个子图的结果。
图2 分割为4小块的面部图像
所有训练子图的均值图像可以通过下式计算出来:
(6)
下一步是通过减去均值来标准化每个训练子图:
(7)
由标准化子图,可以计算协方差矩阵如下:
(8)
接下来我们发现,的特征向量与最大特征值相关联。我们把特征向量记为。通过特征向量计算权重如下所示:
(9)
其中取值为1,2,hellip;,,从1到,为每个人的图片数量,从1到,为训练集中人的数量。同样也可以使用特征向量即如下所示的方程计算测试子图的权重。
(10)
在训练集中每一类均值权重集通过类的权重组计算出来。如下所示:
(11)
下一步通过如下所示计算出最小距离
(12)
(13)
,为一个特定的值。在训练集对应的人脸类是最接近测试图像的。因此测试图像被看作属于第人脸类。
4图像数据库
在UMIST和Yale两个图像数据库下评估传统PCA算法和分块PCA算法的表现。UMIST数据库图像有不同的姿态,Yale数据库图像有不同的光照强度和表情。在这两个数据库中的所有图像都进行了规范化,并剪切成64*64像数。
4.1 UMIST姿态数据库
在测试中本文采用了UMIST人脸数据库的一部分,选择了20个不同的人,每人10张图像。每个人的每个图像都是在不同的姿态和正常的表情下采集的。取出一个人的十张图像,只有八张用于训练,其余的两张用于测试识别率。图3(a)和(b)显示了一个人的一组分别用于训练和测试的图像。在选择训练和测试图像时,测试这两个算法选择的测试图像的头部姿态角,要与训练图像头部姿态角度不同。在这样选择的训练图像和测试图像下,PCA算法和分块PCA方法可能表现不佳,但是本文的目标是通过保证测试图像与训练图像在头部姿态角度不同的条件下比较两方法的性能。
图3 用于训练的(a)图和用于测试的(b)图
4.2 Yale表情和光照数据库
Yale 数据库有15个成人的165张图像,每个人11张图像。这些人脸图像面部表情和光照强度是变化的。这些图像有正常,悲伤,高兴,困乏,惊讶和眨眼的表情。也有光源在中心,左边,右边的图像。除了这些,还有戴眼镜与不戴眼镜的图像。取出一个人的11张图像,只有8张用于训练,其他的三张用于测试识别率。图4(a)和(b)分别显示了一组一个人用于训练和测试的图像。选择训练图像和测试图像的以方便比较两种方法的表现,其中测试图像光照不均匀,有局部遮挡。
图4 用于训练的(a)图和用于测试的(b)图
本文还进行了一些实验,从每个人的11张用于训练和测试识别率图像中去掉一幅图像。重复11次,每次去掉不同的图像。这种测一次去掉一个图像的方式在下文将会提及。
5测试结果
本文测试了不同数量特征向量的PCA和分块PCA算法的性能。虽然特征向量越多识别率也就越高,但是计算成本的增长也是与特征向量的数量呈线性关系的。图5显示了在不同数量特征向量下PCA和分块PCA的识别率。图5所示的是通过使用Yale人脸数据库测一次去掉一个图像的方式测试的结果。阈值不能用于此测试,因为只有正确识别或错误识别两种情况。也可以从图5中观察出来,随着的增加,PCA和分块PCA的识别率都在增加,其中当时,识别率基本没有大的增长。当N=4,16,64,256,和1024时也得到了类似的结果。分块PCA方法的测试结果也已与Pentland等人(1994)所描述的分块特征空间进行了比较,据测试分块PCA算法有着更好的识别率,且不需要检测特定部位如眼镜,鼻子和嘴。
图5 不同M下PCA与分块PCA方法的识别率
在本文余下部分的测试都是在下进行试验的,即特征向量对应着协方差矩阵20个最大特征值。本文测试的目的是用姿态和光照变化的人脸图像比较两种算法,的变化将会对两种算法有相同影响。如图5所示,因而在测试中只考虑前20个特征向量。
当子图的尺寸小于或等于4*4(Ngt;=256),可以从协方差矩阵得到的特征向量的数量将小于20,因此协方差矩阵大小小于或等于16*16。即当的特征向量是被考虑的。例如当N=256时,16个特征向量是被考虑的。对于N=4096,该算法逐像素降低了训练图像和测试图像的像素值。我们使用PCA方法和分块PCA方法重构测试图像。在PCA方法下,图像重构为
(14)
测试图像使用分块PCA方法以类似的方式重构如下:
(15)
图6 (a)取自UMIST数据库的测试图像经过PCA方法重构后的图像;(b)数据库原始图像;(c)取自UMIST数据库的测试图像在N=4时经过分块PCA方法重构后的图像
图7 (a)取自Yale数据库的测试图像经过PCA方法重构后的图像;(b)数据库原始图像;(c)取自Yale数据库的测试图像在N=4时经过分块PCA方法重构后的图像
图6和图7显示了来自UMIST和Yale数据库测试集的一张人脸图像使用这两种方法的重构图像。在这些图中,分块PCA方法重构的图像与PCA方法重构的图像有明显的区别。
5.1 姿态变化的结果
在这个实验中,本文使用UMIST数据库图像比较两种方法在大范围姿态变化下的识别率,虚假识别率和错误拒绝率。训练和测试图像按照4.1节所讲进行选择。此外,我们从4到4096改变N,观察N对人脸识别的影响。由于数据库中所有图像的大小都是64*64像素,N最大可以取到4096,即一个子图就是一个单个像素。图8显示了分块PCA方法在N变化下的识别率,虚假识别率和错误拒绝率。对于PCA,它的识别率为0.3,虚假识别率为0.625,错误拒绝率为0.075。
图8分块PCA方法在N变化下的识别率,虚假识别率和错误拒绝率。对于PC
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[28739],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。