使用视觉动态的反欺骗人脸检测外文翻译资料

 2022-10-26 10:23:37

英语原文共 16 页,剩余内容已隐藏,支付完成后下载完整资料


使用视觉动态的反欺骗人脸检测

摘要——为了防止一个人脸识别系统被欺骗手段攻击,即通过使用一个受害者的打印图片(也称为打印攻击)或者这个人的一段重放视频,因此让人脸识别系统变得鲁棒性是至关重要的。在区分一个活体的,来自于打印媒体或者重放视频的有效途径的一个关键的属性是利用视频内容中的动态信息,比如眨眼,嘴唇动,和面部动态。我们在人脸反欺骗上推进了一种方法,通过应用一种最近发展的叫动态模式分解DMD的算法作为一种通用的、完全数据驱动的方法来捕捉上面的活体线索。我们提出了一种分类管道,由DMD,局部二进制模式LBP和带有直方图交叉核的支持向量机SVM组成。DMD的一个独特的属性是它能方便地表示整个视频的时间信息。管道DMD LBP SVM被证明是有效和便于使用的。事实上,只有LBP的空间配置需要被调整。这种方法的有效性已经在三种公开可用的数据库上得到证实:打印攻击,重放攻击和CASIA-FASD数据库,取得了和当前最新方法的比较性的结果,遵守各自发表的实验协议。

关键字——DMD,欺骗,重放攻击,打印攻击,CASIA-FASD,LBP,SVM。

一. 介绍

研究范围

生物识别技术的使用在安全领域和用于认证目的中具有公认的重要性。然而,生物识别技术的广泛使用却被安全问题所阻碍,例如数据库篡改[1]和传感器篡改(或者说展示攻击)[2],和许多其他的被Ratha[3]等人描述的攻击。然而,数据库篡改可能导致非法的个人授权,或者拒绝合法用户,传感器篡改能导致未经授权的用户访问权限,因此,严重影响生物识别系统的安全性和可用性。在这篇论文,我们关心如何让一个人脸识别系统面对演示攻击时具有鲁棒性;具体地说,打印攻击基于打印的面部图像,重放攻击通过使用一个平板电脑或手机回放视频序列来实现。这里的重要创新点是利用面部动态信息,而不是使用对于活体面孔的先验知识,如眨眼和嘴唇动[4]。由于攻击类型是未知的,并且各不相同,知识驱动的方法无法适用于识别大量的攻击。每一种新的攻击潜在的需要算法设计人员来开发一种特定的线索,这种线索对于指定的攻击是特殊的。数据驱动的方法,通过给定一个足够宽的训练数据和攻击类型,能自动学会区分有效视频和攻击视频。

为了可靠地提取面部动态信息,我们提出了动态模式分解的一个改进版本。由于DMD广泛用于流体动力学建模,我们推断DMD也能在一个包含人脸图像的典型视频序列中捕获到诸如头部云顶、眨眼和唇动等的复杂动态。然而,在这之前DMD并没有被用于分类任务。由于这个原因,我们提出了一个基于DMD的分类管道,它涉及到一个基于纹理的描述器,再加一个判别式分类。我们的实验显示DMD确实能捕获独特的特点,它们能清楚地区分打印视频和重放视频。

生物识别系统攻击的背景

生物识别系统的攻击可以被广泛地归类为数据库篡改和传感器攻击:

传感器攻击也称为演示攻击[6],是针对欺骗一个生物特征传感器。演示攻击的一种常见类型是欺骗,即使用假的生物数据来欺骗一个生物识别系统[2]。处理假指纹的欺骗尝试可以追朔到1998年,当时Wills和Lees[7]表明他们测试的设备六分之四对于假指纹的攻击都是无效的。Matsumoto[8]也做了实验,利用基于胶基的指纹来欺骗生物识别系统。Thalheim[9]进一步演示,指纹,虹膜和人脸识别系统都容易遭受到重放视频的攻击。

对于人脸识别系统,主要有两种类型的演示攻击,即打印攻击和重放攻击。一个打印攻击,即通过向摄像机展示一张打印的图片来实现[10]。事实上,这种攻击非常容易实现,因为要得到一个目标者的照片很容易。随着社交媒体的广泛使用,很少的使用者会考虑到一个简单的上传他们的图片与之相关联的影响[10]。重放攻击,另一方面,通过展示一个事先录制的目标者的视频来欺骗生物识别系统。这种视频通过使用一个手持移动平板来播放。再一次,随着高质量消费级摄像机和社交媒体网络的广泛使用,这种类型的攻击很容易进行远程和逻辑访问一个通过人脸识别系统来保护的控制系统。

我们排除了这个研究,重放攻击需要攻击者知道一个生物识别系统的体系结构。这些攻击假设攻击者可以拦截生物特征传感器和其特征提取器之间的通信通道,从而获得一个原始的生物识别图像;或者拦截特征提取器与特征匹配之间的通信,从而获取一个提取出来的生物特征集。进一步假设,攻击者能重放或者重新复制数据(原始图像或生物特征)到各自的通信通道来得到进入一个安全系统的途径[11]。这些攻击都更难于去实现,其效果会被那些通过保卫通信通道的系统抵消掉;因此,他们都超出了这项研究的范围。

DMD的动机

从视频数据中提取相关的组件或模式是一个相当大的挑战。对于复杂流动行为要获取一个深刻和准确的理解需要降价模型的一种形式[12]或模式分解[13]。我们感兴趣的模式分解的形式通常使用在计算流体力学(CFD)上[14]。特别的,动态模式分解(DMD)是一种开发用于从非线性复杂流体流动产生的经验数据中提取相关模式的数学方法。这些模式提供了复杂流动行为的一种降阶表示,叫做相干流结构。这些相干流结构的提取在计算流体力学(CFD)中具有重要意义。在面对反欺骗人脸检测时,我们推测DMD有发掘面部动态的潜力,这些面部动态捕获了有效人脸视频中的生命迹象同时提取欺骗视频中的人造痕迹比如镜面和平面效果。镜面模式经常被视为图像中的不必要的人造效果,它的效果类似于云纹丝的纤维。平面的效果是一张图片,而不是3D外观,不是一张真实人脸。

DMD的工作方式类似于主成分分析(PCA)。然而DMD包含了考虑数据中的动态信息,PCA缺乏这种属性[15]。Tirunagari[16]在从复杂流动中提取开尔文两侧的不稳定性方面比较了PCA和DMD。他们显示了在分析复杂流体流动上,DMD要优于PCA。这与文献中的实验和数值流场数据问题是一致的[15]。事实上,DMD不仅能有效提取动态信息,因此,动态特征,它也能捕获空间相干结构。Schmidt[17]在流体流动图像序列上使用了DMD,并且描绘了在给定的时间间隔它如何能检测到刻画流体行为的动态相干结构[15]。Schmid[15]介绍了一种DMD变异,通过考虑时空快照的线性映射的一种近似,然后检测相关频率。然而,这种方法依赖于获取的快照。DMD要解决的问题包括:决定方腔流,计算柔性膜后的尾流结构,并确定在一个喷射两缸之间传递的实验中观察到的不稳定性[15]。

同样,我们推测,在人脸识别视频中提取相关模式可以提供有效视频和欺骗视频之间的一个很好的可分性。尤其是,对于生物识别应用例如重放和打印攻击,在它们中,观察是在一个连续模式中所进行的。在视频序列中的连续图像而不是从视频中提取图像的单个快照,我们提出了一种改进的DMD方法,它对于处理大尺寸视频计算效率高。这构成了我们在处理照片和视频攻击的建议的独创性。

受控场景

视频剪辑1 视频剪辑2

图表1.来自于有效视频和受控场景下的视频剪辑的四个帧,显示了眨眼和唇动。最底下一行显示了他们相应的第一种动态模式图像。

我们在图表1中展示了DMD的有效性。最顶上两行的图像显示了相应的提取帧,来自于包含有效途径的两个视频中的每一个。由于在这些视频中的人正在说话和不可避免的眨眼,我们能观察到相应的第一种DMD模式,它强调了嘴唇动和眨眼上的动态变化。然而,眨眼没有第二个视频明显。于是,对于这个问题来验证DMD的有效性是很有必要的。

贡献

虽然许多工作直接指向解决关于打印攻击和重放攻击的问题,还有公共可用数据库的发展,例如打印攻击数据[18],重放攻击数据库[19]和CASIA-FASD数据库[20],这里对于人脸识别的反欺骗措施仍然有很大的发展空间。尤其是,在这之前并没有关于DMD在打印和重放攻击上的使用。我们的第一种贡献,因此,是介绍DMD在人脸反欺骗识别上的使用。由于DMD并没有用于过视频序列的分类,我们提出了一个系统管道,由DMD,LBP和SVM组成。这个组合是理想的,因为DMD能捕获一张固定大小的图像上的视觉动态,LBP能有效捕获动态模式,SVM是一种理想的通用分类器,它最大限度地减少了分类错误的经验风险。扩展的实验也会进行:(i)一个打印数据库[18],包含50个不同人的200个有效视频和200个使用打印图片的欺骗视频;(ii)重放视频,包含50个不同人的200个有效视频,1000个使用打印图片、平板攻击和移动手机攻击的欺骗视频;(iii)CASIA-FASD数据库包含50个不同人的150个有效视频和450个攻击视频。

我们的第二种贡献与让DMD变得更实用相关。首先,我们实现了DMD的一个快版本。而原始DMD使用QR分解[21](矩阵在一个正交矩阵Q和一个上三角矩阵R的分解)和奇异值分解(SVD)方法[22],我们提出使用LU分解[23](矩阵作为下三角矩阵的乘积矩阵和一个上三角矩阵)。其次,在我们改进的DMD中,当我们对DMD图像作为时使用复合模式的绝对值。第三,我们建议使用零相位角准则来选择DMD模式的最佳模式。总之,我们证明了DMD用于分类的实用性和用于从欺骗视频中分离出有效视频的有效性。

我们最后的贡献是简化了现有人脸反欺骗方法的分类系统,通过将它们分为数据驱动或基于线索的方法。对于每一种分类,一些方法被进一步列举(见图表2),并且被显示在表1的相关文献所支持。这样,我们能充分利用在文献中提出的不同解决方案的优势来提高二维人脸识别技术的活体检测任务。

组织

第二部分,展示了使用我们所提出的分类方法分类出的已有的方法。第三部分,展示了DMD的改进版本和它在反欺骗人脸检测上的应用。所挑选的人脸欺骗数据集的简要概述展示在第四部分。第五部分展示了包括结果的实验过程,第六部分是总结和未来方向。

二. 现有方法

根据Chakka所说[24],应对2D人脸识别系统的反欺骗手段通常被分为运动,活体和纹理分析。运动通常表示运动特征,比如光学流[4,25]。活体分析代表一个生物样本的活体特征的检测,比如头部动作和嘴唇动作,还有眨眼。最后,纹理分析代表纹理描述器的使用,用于从欺骗视频中区分出有效视频。

我们认为这样的分类是模糊的,不利于确定每种技术的能力。例如,一个依赖于运动的活体分析方法经常使用诸如光学流的运动描述器的使用。结果,争辩这种方法到底属于活体检测还是运动分析是无益的。

相反,我们提倡将现有的方法分解成主要的成分,采用这种方式可以充分利用所提出的不同方法的力量来提高2D人脸识别技术的活体检测任务。我们提出的这种广泛的分类方法将一种方法分类成数据驱动的或者基于线索的。这种分类方法和潜在的子分类,特定的方法显示在表2。然而基于线索的方法依赖于直觉或者观察,数据驱动的方法倾向于使用通用的图像处理算法,这些算法适用于广泛的计算机视觉任务。值得注意的是,基于线索的和数据驱动的属性是不互相排斥的。事实上,一种基于线索的方法也许依赖于通常的纹理描述器,比如LBP或者运动描述器,比如光学流。因此,将一种方法分类成仅仅基于纹理的或者基于运动的并不会帮助理解这种方法工作属于哪种成分,它的工作原理,假设是什么和什么时候可能会失败。通过分解一种基于线索属性和数据驱动属性的方法,一种方法的成功或者失败能被清晰地验证。这种分析的结果显示在表1。

图表2.现有文献中具体方法的分类

表 Ⅰ

现有反欺骗人脸方法的分类

基于线索的方法

我们进一步来区分两种类型的线索,即活体线索和特定攻击特性/线索。

活体线索。我们将活体线索定义为依赖于生物特征的生命力迹象。对于2D人脸识别,这些线索是眨眼,嘴唇动,和面部表情的变化。根据作者的说法,比如Tronci[30]、Li[1]、Tan[27]、 Peixoto[28]、Pan[33],还有其他潜在的作者,这些线索要么隐含的要么是明确的。然而,这种方法对于基于打印人脸图像的攻击是有效地,对于基于视频的重发攻击可能会完全失败,因为一个视频能捕捉到上述提到的所有人脸活体线索。在公共领域上获取面部视频和人脸视频是很容易的,比如Facebook,因为用户自己经常会上传自己的视频,因此攻击者采用基于视频的重放攻击的可能性是非常高的。为了解决这个弱点,我们需要寻找额外的特定攻击的线索,正如下面所描述的。

特定攻击的线索是那些不依赖于面部属性,对于攻击方法是特定的线索。这方面的一个例子是镜面效应,而其是次要的和视觉上不必要的人造效果,由两个叠加的模式产生的。在2D攻击面前,这种效果是由从另一个播放设备上重新捕获图像所造成的。Pinto[5]的研究中就指出了这种效果。有趣的是,非人脸信息比如镜面效应能从面部区域上获取,但是仍然被视为一种特定攻击的线索。另一种对于平面媒体比如一张打印人脸图像或者显示在数字平板上的人脸图像比较特殊的线索是重捕获图像的平面性。这种线索的第一次使用要归功于Bao[32]。

基于线索的方法的通用性。因为基于线索的方法利用了特定攻击设置或者方法的特殊性,这种方法也许并不适用于其他攻击方法。因此,这种方法也许会产生最初研究中报告的更差的结果。事实上,一些文献[5]表明,那些旨在利用打印媒体攻击的基于线索的方法也许对基于视频的重放攻击或者3D模具并不起作用。例如,Li[1]的方法,即基于面部大小差异和不变的面部姿势及表情,对于假设不成立的情况也许并不起作用。一种使假设无效从而击败对策的方式是通过旋转或者弯曲具有高分辨率的打印的人脸照片,正如Pinto[5]所建议的那样。另一种例子是Pan的方法[33],它基于这样的线索,人脸区域和人脸外的区域(即背景内容)是有差异的。由于图像的背景从一段视频到另一端视频各不相同,这种方法也许会失败。而且,用一个3D模具,一个攻击者也能通过穿孔一个三维模具来模拟眨眼。事实上,尝试复制Bao的方法[32]和Kollreider的方法[

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[153875],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。