基于LBP特征的CNN人脸识别方法外文翻译资料-文献翻译网

英语原文共 4 页，剩余内容已隐藏，支付完成后下载完整资料

基于LBP特征的CNN人脸识别方法

Hongshuai Zhang¹Zhiyi Qu¹Liping Yuan¹GangLi²

1. School of Information Science amp; Engineering, Lanzhou University

2. Technology Reconnaissance Detachment of Public Security Bureau Lanzhou

Lanzhou, China

zhanghsh15@lzu.edu.cn, quzy@lzu.edu.cn,yuanlp15@lzu.edu.cn,1305852142@qq.com

摘要：人脸识别是一种基于人的面部特征信息的生物识别技术。其在计算机信息安全、医疗、安全监控、人机交互和财务安全中具有广泛的应用价值。面部特征提取是人脸识别技术的关键，它与人脸识别算法的选择与识别有关。局部二值模式是一种纹理描述方法，用于描述灰度范围内图像的局部纹理特征。近些年来，许多研究人员已成功将其应用于人脸识别中的面部特征描述和识别，并且取得了显著成效。卷积神经网络是深度学习最具代表性的网络结构之一，其在图像处理和识别领域取得了巨大成功。

关键词：人脸识别;局部二值模式;卷积神经网络

一人脸识别介绍

人脸识别是生物识别研究的内容之一，是模式识别领域的前沿课题。虽然研究课题已有30多年的历史，然而目前，人脸识别正成为模式识别和人工智能领域的热点。

人脸识别系统作为一种重要的个人识别方法，可广泛应用于监狱管理、囚犯识别、刑侦、安全验证、信用卡验证、医药、档案管理、视频会议、机器交互系统、文档验证、安全监控和渠道控制等方面。与指纹、手掌、视网膜和虹膜等其他识别方法相比，人脸识别具有直观、友好和方便等特点。

二相关工作

2.1 人脸识别的研究现状

近年来，随着人脸识别研究的深入，人脸识别方法越来越多。常用的人脸识别方法可以概括为基于几何特征的方法，基于统计特征的方法和基于神经网络的方法[1]。具体如下：

基于几何特征的方法：基于几何特征的方法是最早的和传统的人脸识别方法。当使用该方法时，面部由几何特征向量表示，并且分类器在模式识别中设计有层次聚类的思想。基于几何特征的人脸识别方法符合人脸识别的机制，易于理解，只需要为每个图像存储几何特征向量，并且只占用小空间[2]。
基于统计特征的方法：当已知或可以推导出面部图像特征分布的统计特征时，基于统计特征的方法可以用于面部识别。
基于神经网络的方法：神经网络方法不仅可以用于检测面部，还可以用于识别面部。目前已经提出了许多不同的神经网络来改进面部识别的效果。经常使用的是多层感知器和反向传播神经网络。神经网络方法具有很强的适应性和鲁棒性，可以有效地应用于不同姿势、不同光线和复杂环境下等。然而，这种方法存在一些局限性：大量的神经元导致训练时间过长，并且样本的依赖性非常强，这可能导致模型在训练过程中不收敛。

2.2 本文的主要工作

本文的主要工作是研究基于局部二值模式（LBP）的人脸提取特征方法和基于卷积神经网络（CNN）的人脸识别方法。

在本文中，我们提出LBP特征图作为CNN的输入，以提高对CNN的学习和理解，这将为CNN学习数据的选择提供指导。

2.2.1 图像LBP特征

LBP（局部二值模式）是用于描述图像的局部纹理特征的运算符。它具有旋转不变性和灰度不变性的优点。它首先是由T. Ojala，M.Pietikauml;inen和D. Harwood于1994年提出用于纹理特征提取。此外，提取的特征是图像的局部纹理特征[3]。

原始LBP算子被定义为3 * 3窗口，窗口中心像素作为阈值，如果周围像素值大于中心，则与8像素灰度值相邻并进行比较像素值，像素标记为1，否则为0.这样，可以比较3 * 3邻域中的8个点产生8位二进制数（通常转换为LBP代码，即256进制），并且获得窗口的中心像素的LBP值并由该值反映该区域的纹理信息。如下图2.1所示：

图2.1 LBP操作为3 * 3窗口，LBP代码为169

显然，提取的LBP算子可以在每个像素点获得LBP“编码”，然后提取原始LBP算子用于图像（记录每个像素的灰度值）之后，原始LBP特征仍是“图片”（记录每个像素的LBP值）。结果如图2.2所示：

图2.2 （a）是原始图像（b）是LBP特征图

LBP应用，如纹理分类和人脸分析，一般不使用LBP模式作为特征向量进行分类和识别，而使用LBP特征直方图作为特征向量进行分类和识别[4]。

从上面的分析我们可以看出，这个“特征”与位置信息密切相关。直接在两张图片上提取这个“特征”，并且不加区别地分析“位置不对齐”并产生很大的错误。后来，研究人员发现一个图片可以分为几个子区域，为每个像素的每个子区域提取LBP特征，然后在每个子区域建立LBP直方图的统计特征。使用这种方式，每个子区域可以用统计直方图来描述，整个图片由多个统计直方图组成。然后，我们可以使用各种相似度测量功能，之后可以确定两个图像之间的相似性。

2.2.2 卷积神经网络（CNN）简介

卷积神经网络是深度学习中最具有代表性的网络结构之一，已成为语音分析和图像识别领域的热点[5]。它的权重共享网络结构使其更类似于生物神经网络，从而降低了网络模型的复杂性并减少了网络模型参数的数量。这种方法的优点是当输入是多维的时，网络的输入更明显，因此图像可以直接输入到网络，这避免了传统识别算法中的复杂特征提取和数据重构。乘积网络是一种多层感知器，专门设计用于识别对平移、缩放、倾斜或其他形式的高度不变的二维形状。

卷积神经网络的重要思想框架是局部区域感知、分担重量和空间抽样。CNN的三个特征是空间中输入数据的失真非常稳健。CNN一般使用卷积层和采样层交替设置，即一层连接到采样层的卷积层，采样层后跟卷积层...这个卷积层提取特征，然后组合形成一个更抽象的特征，最后，形成图像对象的描述特点。CNN末尾可以是全连接层[6]。

卷积神经网络（CNN）的基本思想就是这样，但具体实现有多个版本。本文指的是深度学习工具箱DeepLearnToolbox。CNN结构图如下如图2.3所示：

图2.3 CNN示意图

上图的神经网络具有28 * 28输入层，两个卷积层、两个池化层和全连接输出层。输入28 * 28图像通过第一卷积层进行卷积，生成6个24 * 24特征矩阵，然后通过第一个卷积层采样生成6个12 * 12特征矩阵，然后生成第二个8times;8特征矩阵，通过对第二层的卷积特征进行采样来生成12times;4特征矩阵，最后12个4times;4特征矩阵完全连接到两个神经元，它们是输出矢量2 * 1。

本文将在MATLAB中构建一个良好的CNN，实现对面部的识别。基于CNN的人脸识别流程图如图2.4所示：

图2.4 CNN人脸识别流程图

在该模型中，本文首先使用训练数据集训练CNN生成分类器，然后使用测试数据集测试分类结果。本文的训练数据集和测试数据集如下表2.1和表2.2所示：

表2.1 训练数据集

训练数据	阳性样本	阴性样本
数量	500	2000

表2.2 测试数据集

测试数据	阳性样本	阴性样本
数量	200	400

三基于LBP特征的CNN方法

从识别的角度出发，将局部统计方法应用于基于LBP特征的人脸识别，忽略了LBP特征图的位置信息。LPB特征是图像纹理方向的最基本单位，并且匹配两个面的统计方法将导致不完整的信息。基于CNN的人脸识别方法，CNN输入的是图像，是从像素级学习。在CNN的学习过程中，特征提取从最低级别的特征开始。

鉴于以上原因，本文提出了一种改进CNN训练的方法。这种方法可以克服基于统计方法的单一LBP特征识别，LBP特征作为CNN输入，CNN可以学习获取LBP特征图之间的位置特征。第二LBP特征映射是原始图像的纹理特征高于像素级别，并且CNN比学习中的像素级别更好地学习图像的特征。

3.1 基于LBP特征的CNN人脸识别

本文提出了一种基于LBP特征组合和CNN的人脸识别方法。通过使用面部图像的LBP特征图作为CNN的输入来训练CNN。下面详细描述基于CNN的LBP特征的人脸识别实现。流程图的实现如下图3.1所示：

图3.1 基于LBP的人脸识别流程图

在该模型中，本文首先处理LBP图像以及生成图像的LBP特征图，然后使用图像的LBP特征图作为CNN输入来训练CNN。同样，在测试识别图像中，首先提取图像LBP特征图，然后进入CNN分类器进行识别。

3.2 两种模型的实验结果比较

在分类器设计过程中，如何评估分类器非常重要。良好的评价指标对优化分类模型更有利; 同时，良好的分类器评估指标要求它充分反映分类器解决问题的能力，也更容易向用户和客户展示交互。在分类问题中，可以将实例确定为以下四种类型之一：

1.准确率：判断整个样本集的能力，即准确率越高越好。准确率=（TP TN）/（TP FN FP TN）。

2.灵敏度：将阳性样本预测为阳性样本的能力，灵敏度= TP /（TP FN）。

3.特异性：阴性样本预测阴性样本的能力，特异性= TN /（TN FP）。

4.ROC曲线是指接收器操作特征曲线，它是反映连续变量灵敏度和特异性的综合指标。 ROC曲线通过映射揭示灵敏度和特异性之间的关系，（1特异性）作为绘制成曲线的横坐标，曲线下面积越大，诊断准确性越准确，对特异性更敏感，更高。在ROC曲线上，最靠近图左上角的点是灵敏度和特异性的临界值。

下面解释了ROC曲线上的几个关键点：

1.（TPR = 0，FPR = 0）模型，它将每个实例预测为负类;

2.（TPR = 1，FPR = 1）模型，用于将每个实例预测为正类;

3.（TPR = 1，FPR = 0）理想模型。

一个好的分类模型应该尽可能接近图的左上角，随机猜测模型应该位于连接点的主对角线上（TPR = 0，FPR = 0）和（TPR = 1，FPR = 1）。

ROC曲线（AUC）下方的区域提供了另一种评估模型平均性能的方法。如果模型是完美的，则其AUC = 1，如果模型是简单的随机猜测模型，那么其AUC = 0.5，如果模型比另一模型好，则其曲线下面积相对较大。

下表3.1为3中平价值数对比：

表3.1 3种评价指标对比

评价指标	Accuracy	Sensitivity	Specificity
CNN	91.83%	89.50%	93.00%
LBP CNN	95.33%	90.50%	97.75%

通过比较两种方法的准确性，敏感性，特异性。改进后的方法明显优于原算法。如下图3.2所示：

图3.2 ROC曲线对比图

通过比较两种模型的ROC曲线，发现改进的ROC曲线更接近左上角，因此改进的方法优于原始方法。AUC1 = 0.9745，AUC2 = 0.9792。通过AUC比较，基于LBP的CNN分类功能训练更好。最终结论是基于LBP的CNN人脸识别优于CNN人脸识别。

四结论

本文提出了一种基于LBP特征和CNN的人脸识别模型。首先，将图像转换为LBP特征图，然后将LBP特征图用作CNN的输入以训练CNN。在面部识别然后进入CNN识别，通过比较两类分类的准确性、敏感性和特异性，所提出的分类方法的效果优于前一种分类的效果。根据ROC曲线和AUC分析，基于LBP和CNN的人脸识别方法优于CNN人脸识别。

当CNN输入是图像时，CNN学习的知识是像素级特征，其是低级的、未经处理的特征。当LBP特征图用作CNN的输入时，CNN学习的知识是处理图像的边缘的知识。通过对比实验数据，我们可以看出，与原始知识相比，CNN更容易学习和理解处理过的知识，人脸识别更好。因此，在培训CNN时，我们需要在处理后选择知识。

参考文献

[1] K.Jain, A Ross, S.Prabhakar. An int

剩余内容已隐藏，支付完成后下载完整资料

资料编号：[19799]，资料为PDF文档或Word文档，PDF文档可免费转换为Word

原文和译文剩余内容已隐藏，您需要先支付 30元 才能查看原文和译文全部内容！立即支付

免费ai写开题、写任务书：免费Ai开题 | 免费Ai任务书 | 免费降AI率 | 免费降重复率 | 论文免费排版

注册

找回密码

基于LBP特征的CNN人脸识别方法外文翻译资料

您可能感兴趣的文章

登录

注册

找回密码

您可能感兴趣的文章