英语原文共 4 页,剩余内容已隐藏,支付完成后下载完整资料
基于LBP特征的CNN人脸识别方法
Hongshuai Zhang1Zhiyi Qu1Liping Yuan1GangLi2
1. School of Information Science amp; Engineering, Lanzhou University
2. Technology Reconnaissance Detachment of Public Security Bureau Lanzhou
Lanzhou, China
zhanghsh15@lzu.edu.cn, quzy@lzu.edu.cn,yuanlp15@lzu.edu.cn,1305852142@qq.com
摘要:人脸识别是一种基于人的面部特征信息的生物识别技术。 其在计算机信息安全、医疗、安全监控、人机交互和财务安全中具有广泛的应用价值。面部特征提取是人脸识别技术的关键,它与人脸识别算法的选择与识别有关。局部二值模式是一种纹理描述方法,用于描述灰度范围内图像的局部纹理特征。近些年来,许多研究人员已成功将其应用于人脸识别中的面部特征描述和识别,并且取得了显著成效。卷积神经网络是深度学习最具代表性的网络结构之一,其在图像处理和识别领域取得了巨大成功。
关键词:人脸识别;局部二值模式;卷积神经网络
一 人脸识别介绍
人脸识别是生物识别研究的内容之一,是模式识别领域的前沿课题。 虽然研究课题已有30多年的历史,然而目前,人脸识别正成为模式识别和人工智能领域的热点。
人脸识别系统作为一种重要的个人识别方法,可广泛应用于监狱管理、囚犯识别、刑侦、安全验证、信用卡验证、医药、档案管理、视频会议、机器交互系统、文档验证、安全监控和渠道控制等方面。与指纹、手掌、视网膜和虹膜等其他识别方法相比,人脸识别具有直观、友好和方便等特点。
二 相关工作
2.1 人脸识别的研究现状
近年来,随着人脸识别研究的深入,人脸识别方法越来越多。 常用的人脸识别方法可以概括为基于几何特征的方法,基于统计特征的方法和基于神经网络的方法[1]。具体如下:
- 基于几何特征的方法: 基于几何特征的方法是最早的和传统的人脸识别方法。 当使用该方法时,面部由几何特征向量表示,并且分类器在模式识别中设计有层次聚类的思想。 基于几何特征的人脸识别方法符合人脸识别的机制,易于理解,只需要为每个图像存储几何特征向量,并且只占用小空间[2]。
- 基于统计特征的方法:当已知或可以推导出面部图像特征分布的统计特征时,基于统计特征的方法可以用于面部识别。
- 基于神经网络的方法:神经网络方法不仅可以用于检测面部,还可以用于识别面部。目前已经提出了许多不同的神经网络来改进面部识别的效果。经常使用的是多层感知器和反向传播神经网络。神经网络方法具有很强的适应性和鲁棒性,可以有效地应用于不同姿势、不同光线和复杂环境下等。然而,这种方法存在一些局限性:大量的神经元导致训练时间过长,并且样本的依赖性非常强,这可能导致模型在训练过程中不收敛。
2.2 本文的主要工作
本文的主要工作是研究基于局部二值模式(LBP)的人脸提取特征方法和基于卷积神经网络(CNN)的人脸识别方法。
在本文中,我们提出LBP特征图作为CNN的输入,以提高对CNN的学习和理解,这将为CNN学习数据的选择提供指导。
2.2.1 图像LBP特征
LBP(局部二值模式)是用于描述图像的局部纹理特征的运算符。 它具有旋转不变性和灰度不变性的优点。它首先是由T. Ojala,M.Pietikauml;inen和D. Harwood于1994年提出用于纹理特征提取。此外,提取的特征是图像的局部纹理特征[3]。
原始LBP算子被定义为3 * 3窗口,窗口中心像素作为阈值,如果周围像素值大于中心,则与8像素灰度值相邻并进行比较像素值,像素标记为1,否则为0.这样,可以比较3 * 3邻域中的8个点产生8位二进制数(通常转换为LBP代码,即256进制),并且获得窗口的中心像素的LBP值并由该值反映该区域的纹理信息。如下图2.1所示:
图2.1 LBP操作为3 * 3窗口,LBP代码为169
显然,提取的LBP算子可以在每个像素点获得LBP“编码”,然后提取原始LBP算子用于图像(记录每个像素的灰度值)之后,原始LBP特征仍是“图片”(记录每个像素的LBP值)。结果如图2.2所示:
图2.2 (a)是原始图像(b)是LBP特征图
LBP应用,如纹理分类和人脸分析,一般不使用LBP模式作为特征向量进行分类和识别,而使用LBP特征直方图作为特征向量进行分类和识别[4]。
从上面的分析我们可以看出,这个“特征”与位置信息密切相关。 直接在两张图片上提取这个“特征”,并且不加区别地分析“位置不对齐”并产生很大的错误。 后来,研究人员发现一个图片可以分为几个子区域,为每个像素的每个子区域提取LBP特征,然后在每个子区域建立LBP直方图的统计特征。使用这种方式,每个子区域可以用统计直方图来描述, 整个图片由多个统计直方图组成。然后,我们可以使用各种相似度测量功能,之后可以确定两个图像之间的相似性。
2.2.2 卷积神经网络(CNN)简介
卷积神经网络是深度学习中最具有代表性的网络结构之一,已成为语音分析和图像识别领域的热点[5]。它的权重共享网络结构使其更类似于生物神经网络,从而降低了网络模型的复杂性并减少了网络模型参数的数量。这种方法的优点是当输入是多维的时,网络的输入更明显,因此图像可以直接输入到网络,这避免了传统识别算法中的复杂特征提取和数据重构。乘积网络是一种多层感知器,专门设计用于识别对平移、缩放、倾斜或其他形式的高度不变的二维形状。
卷积神经网络的重要思想框架是局部区域感知、分担重量和空间抽样。CNN的三个特征是空间中输入数据的失真非常稳健。CNN一般使用卷积层和采样层交替设置,即一层连接到采样层的卷积层,采样层后跟卷积层...这个卷积层提取特征,然后组合形成一个更抽象的特征,最后,形成图像对象的描述特点。CNN末尾可以是全连接层[6]。
卷积神经网络(CNN)的基本思想就是这样,但具体实现有多个版本。本文指的是深度学习工具箱DeepLearnToolbox。CNN结构图如下如图2.3所示:
图2.3 CNN示意图
上图的神经网络具有28 * 28输入层,两个卷积层、两个池化层和全连接输出层。 输入28 * 28图像通过第一卷积层进行卷积,生成6个24 * 24特征矩阵,然后通过第一个卷积层采样生成6个12 * 12特征矩阵,然后生成第二个8times;8特征矩阵,通过对第二层的卷积特征进行采样来生成12times;4特征矩阵,最后12个4times;4特征矩阵完全连接到两个神经元,它们是输出矢量2 * 1。
本文将在MATLAB中构建一个良好的CNN,实现对面部的识别。基于CNN的人脸识别流程图如图2.4所示:
图2.4 CNN人脸识别流程图
在该模型中,本文首先使用训练数据集训练CNN生成分类器,然后使用测试数据集测试分类结果。本文的训练数据集和测试数据集如下表2.1和表2.2所示:
表2.1 训练数据集
训练数据 |
阳性样本 |
阴性样本 |
数量 |
500 |
2000 |
表2.2 测试数据集
测试数据 |
阳性样本 |
阴性样本 |
数量 |
200 |
400 |
三 基于LBP特征的CNN方法
从识别的角度出发,将局部统计方法应用于基于LBP特征的人脸识别,忽略了LBP特征图的位置信息。LPB特征是图像纹理方向的最基本单位,并且匹配两个面的统计方法将导致不完整的信息。基于CNN的人脸识别方法,CNN输入的是图像,是从像素级学习。 在CNN的学习过程中,特征提取从最低级别的特征开始。
鉴于以上原因,本文提出了一种改进CNN训练的方法。这种方法可以克服基于统计方法的单一LBP特征识别,LBP特征作为CNN输入,CNN可以学习获取LBP特征图之间的位置特征。第二LBP特征映射是原始图像的纹理特征高于像素级别,并且CNN比学习中的像素级别更好地学习图像的特征。
3.1 基于LBP特征的CNN人脸识别
本文提出了一种基于LBP特征组合和CNN的人脸识别方法。 通过使用面部图像的LBP特征图作为CNN的输入来训练CNN。下面详细描述基于CNN的LBP特征的人脸识别实现。流程图的实现如下图3.1所示:
图3.1 基于LBP的人脸识别流程图
在该模型中,本文首先处理LBP图像以及生成图像的LBP特征图,然后使用图像的LBP特征图作为CNN输入来训练CNN。同样,在测试识别图像中,首先提取图像LBP特征图,然后进入CNN分类器进行识别。
3.2 两种模型的实验结果比较
在分类器设计过程中,如何评估分类器非常重要。良好的评价指标对优化分类模型更有利; 同时,良好的分类器评估指标要求它充分反映分类器解决问题的能力,也更容易向用户和客户展示交互。在分类问题中,可以将实例确定为以下四种类型之一:
1.准确率:判断整个样本集的能力,即准确率越高越好。 准确率=(TP TN)/(TP FN FP TN)。
2.灵敏度:将阳性样本预测为阳性样本的能力,灵敏度= TP /(TP FN)。
3.特异性:阴性样本预测阴性样本的能力,特异性= TN /(TN FP)。
4.ROC曲线是指接收器操作特征曲线,它是反映连续变量灵敏度和特异性的综合指标。 ROC曲线通过映射揭示灵敏度和特异性之间的关系,(1特异性)作为绘制成曲线的横坐标,曲线下面积越大,诊断准确性越准确,对特异性更敏感,更高。在ROC曲线上,最靠近图左上角的点是灵敏度和特异性的临界值。
下面解释了ROC曲线上的几个关键点:
1.(TPR = 0,FPR = 0)模型,它将每个实例预测为负类;
2.(TPR = 1,FPR = 1)模型,用于将每个实例预测为正类;
3.(TPR = 1,FPR = 0)理想模型。
一个好的分类模型应该尽可能接近图的左上角,随机猜测模型应该位于连接点的主对角线上(TPR = 0,FPR = 0)和(TPR = 1,FPR = 1)。
ROC曲线(AUC)下方的区域提供了另一种评估模型平均性能的方法。 如果模型是完美的,则其AUC = 1,如果模型是简单的随机猜测模型,那么其AUC = 0.5,如果模型比另一模型好,则其曲线下面积相对较大。
下表3.1为3中平价值数对比:
表3.1 3种评价指标对比
评价指标 |
Accuracy |
Sensitivity |
Specificity |
CNN |
91.83% |
89.50% |
93.00% |
LBP CNN |
95.33% |
90.50% |
97.75% |
通过比较两种方法的准确性,敏感性,特异性。 改进后的方法明显优于原算法。 如下图3.2所示:
图3.2 ROC曲线对比图
通过比较两种模型的ROC曲线,发现改进的ROC曲线更接近左上角,因此改进的方法优于原始方法。AUC1 = 0.9745,AUC2 = 0.9792。 通过AUC比较,基于LBP的CNN分类功能训练更好。最终结论是基于LBP的CNN人脸识别优于CNN人脸识别。
四 结论
本文提出了一种基于LBP特征和CNN的人脸识别模型。首先,将图像转换为LBP特征图,然后将LBP特征图用作CNN的输入以训练CNN。在面部识别然后进入CNN识别,通过比较两类分类的准确性、敏感性和特异性,所提出的分类方法的效果优于前一种分类的效果。根据ROC曲线和AUC分析,基于LBP和CNN的人脸识别方法优于CNN人脸识别。
当CNN输入是图像时,CNN学习的知识是像素级特征,其是低级的、未经处理的特征。 当LBP特征图用作CNN的输入时,CNN学习的知识是处理图像的边缘的知识。通过对比实验数据,我们可以看出,与原始知识相比,CNN更容易学习和理解处理过的知识,人脸识别更好。因此,在培训CNN时,我们需要在处理后选择知识。
参考文献
[1] K.Jain, A Ross, S.Prabhakar. An int
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[19799],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。
您可能感兴趣的文章
- 为非政府组织OG慈善基金会设计的基于社区的救灾管理系统外文翻译资料
- 基于UML建模的医疗系统电子健康服务软件外文翻译资料
- 开发一种具有增强现实功能的智能手机应用程序, 以支持护理学生对心衰的虚拟学习外文翻译资料
- 在开发 Web 应用程序中应用 Vue.JS 框架外文翻译资料
- 基于MES系统的生产车间信息管理研究外文翻译资料
- 基于Vue.js和MySQL的电子商务平台的设计与实现外文翻译资料
- 详细的Spring配置和SpringBoot外文翻译资料
- 基于NS2的DSR和AODV协议的性能比较研究外文翻译资料
- 不同仿真参数下NS2的TCP吞吐量性能外文翻译资料
- 基于Spring Boot和VUE的车辆管理系统实现外文翻译资料