基于广义噪声模型的自然图像摄像机模型识别外文翻译资料

 2022-07-26 16:04:34

Camera model identification based on the generalized noise model in natural images

ThanhHaiThaia,lowast;, FlorentRetraintb, Reacute;miCogranneb,1

Abstact

The goal of this paper is to design a statistical test for the camera model identification problem. The approach is based on the generalized noise model that is developed by following the image processing pipeline of the digital camera. More specifically, this model is given by starting from the heteroscedastic noise model that describes the linear relation between the expectation and variance of a RAW pixel and taking into account the non-linear effect of gamma correction. The generalized noise model characterizes more accurately a natural image in TIFF or JPEG format. The present paper is similar to our previous work that was proposed for camera model identification from RAW images based on the heteroscedastic noise model. The parameters that are specified in the generalized noise model are used as camera fingerprint to identify camera models. The camera model identification problem is cast in the framework of hypothesis testing theory. In an ideal context where all model parameters are perfectly known, the Likelihood Ratio Test is presented and its statistical performances are theoretically established. In practice when the model parameters are unknown, two Generalized Likelihood Ratio Tests are designed to deal with this difficulty such that they can meet a prescribed false alarm probability while ensuring a high detection performance. Numerical results on simulated images and real natural JPEG images highlight the relevance of the proposed approach.

Keywords:

Digital forensics Camera model identification Hypothesis testing Natural image model Nuisance parameters

1. Introduction

Digital forensics has received a great attention from law en-forcement agencies and academic researchers in the past decade. Because of dramatic advancement in computing and network tech-nologies, the accessibility and transmission of digital images have been increased remarkably. Digital images can be easily edited, al-tered or falsified because of a large availability of image editing software tools. Consequently, the reliability and trustworthiness of digital images have been questioned when used as evidence in le-gal and security domains. Reliable forensic methods are urgently needed by law enforcement agencies to restore the trust to digital images.

1.1. State of the art

Generally, digital image forensics involves two key problems: image origin identification and image forgery detection (see [1] and the references therein for a detailed introduction). The prob-lem of image origin identification aims at verifying whether a given image was acquired by a specific camera, or at determin-ing camera models/brands as well as types of imaging mechanism (e.g. scanners, cell-phone cameras, or computer graphics). The im-age forgery detection aims at detecting any act of manipulation such as splicing, removal or adding in an image.

There are two approaches to address these problems. Active approach such as digital signatures [2]and digital watermarking [3]has some limitations because a dedicated information has to be embedded during the creation of an image, which increases the production cost of digital cameras, and the credibility of in-formation embedded in the image remains questionable. Passive approach has been increasingly studied in the past decade since it does not impose any constraint and does not require any prior in-formation. Forensic analysts have only the suspect image at their disposal and must explore useful information from that image to gather forensic evidence, trace the acquisition device and detect any act of manipulation. Passive approach is based on internal traces left by the camera in a given image. These internal traces can be provided by investigating the image acquisition pipeline; see [4,5]for an overview of the structure and processing stages of a typical digital camera. Every stage from real-world scene acqui-sition to image storage can provide clues for forensic analysis.

In image origin identification problem, it is important to dis-tinguish the problem of camera instance identification and the problem of camera model/brand identification. More specifically, fingerprints used for camera instance identification should capture individuality, especially cameras coming from the same model. For camera model/brand identification, it is necessary to exploit finger-prints that are shared between cameras of the same model/brand but discriminative for different camera models/brands.

In general, passive forensic methods proposed for the image origin identification problem can be divided into two fundamen-tal categories. Methods in the first category rely on the assump-tion that there are differences in image processing techniques and component technologies among camera models. Lens aberra-tion[6], Color Filter Array (CFA) pattern and interpolation algo-rithms [7–10], and JPEG compression [11]are considered as influ-ential factors for camera model/brand identification. Using these factors, a forensic feature set is provided and used in a machine learning algorithm. The main challenge is that the image process-ing techniques remain identical or similar, and the components produced by a few manufacturers are shared among camera mod-els. Moreover, as in all applications of machine learning, it is diffi-cult to select an accurate feature set.

Methods in the second category aim at identifying unique char-acteristics or fingerprints of the acquisition camera device. Sensor Pattern Noise (SPN) is caused by imperfections during the manu-facturing process and non-uniformity of photo-electronic conver-sion due to inhomogeneity of silicon wafers. This is the unique fingerprint which the methods are

全文共31536字,剩余内容已隐藏,支付完成后下载完整资料


基于广义噪声模型的自然图像摄像机模型识别

ThanhHaiThaia,lowast;, FlorentRetraintb, Reacute;miCogranneb,1

摘要

本文的目的是设计相机模型识别问题的统计测试。该方法基于通过跟随数码相机的图像处理流水线开发的广义噪声模型。更具体地说,该模型是从描述RAW像素的期望和方差之间的线性关系并考虑伽马校正的非线性效应的异方差噪声模型开始给出的。广义噪声模型更准确地表征了TIFF或JPEG格式的自然图像。本文与以前的基于异方差噪声模型的RAW图像识别相机模型相似。在广义噪声模型中指定的参数用作相机指纹以识别相机型号。相机模型识别问题是在假设检验理论的框架下进行的。在所有模型参数完全已知的理想情境下,提出了似然比测试,理论上建立了其统计性能。在实践中,当模型参数未知时,设计了两个广义似然比测试来处理这种困难,使得它们能够在确保高检测性能的同时满足规定的假警报概率。模拟图像和真实的自然JPEG图像的数值结果突出了提出的方法的相关性。

关键词:数字取证 相机模型识别 假设检验 自然图像模型 滋扰参数

1.介绍

近十年来,数字取证受到了执法机构和学术界的广泛关注。因为计算机和网络技术的巨大进步, 数字图像的可访问性和传输性显著提高。数字图像可以很容易地编辑,改或伪造的因为一个大的可用性的图像编辑软件。因此,数字图像的可靠性和可信性已被质疑时,作为法律和安全领域的证据。法律迫切需要可靠的取证方法 执法机构恢复信任数字图像。

1.1.目前研究状况水平

一般来说,数字图像取证涉及图像原点识别和图像伪造检测两个关键问题(参见[1]及其中的参考文献)。图像原始识别的问题旨在验证给定图像是否由特定相机获取,或者确定相机型号/品牌以及成像机制(例如扫描仪,手机相机或计算机图形学)。图像伪造检测旨在检测任何操作行为,例如拼接,删除或添加图像。

解决这些问题有两种方法。主动方法如数字签名[2]和数字水印[3]有一些限制,因为在创建图像时必须嵌入专用信息,这增加了数码相机 的生产成本,并且嵌入式信息的可信度在形象上仍然值得怀疑。过去十年来,被动方法越来越多地被研究,因为它不施加任何限制,也不需要任何以前的形成。法医分析师只有可疑的形象可供选择,并且必须从该图像中探索有用的信息,以收集法医证据,跟踪采集设备并检测任何操纵行为。被动方法是基于给定图像中照相机留下的内部痕迹。这些内部痕迹可以通过调查图像采集管道来提供;参见[4,5],了解典型数码相机的结构和处理阶段。从现实世界场景获取到图像存储的每个阶段都可以为法医分析提供线索。

在图像原点识别问题中,重要的是分辨相机实例识别的问题和相机模型/品牌识别的问题。更具体地,用于相机实例识别的指纹应该捕获个性,特别是来自相同模型的相机。对于相机型号/品牌识别,需要利用相同型号/品牌的相机之间共享的手指打印,但对于不同的相机型号/品牌来说是不同的。

一般来说,为图像来源识别问题提出的被动法医方法可以分为两个基本类别。第一类中的方法依赖于相机模型中图像处理技术和组件技术存在差异的假设。透镜像差[6],滤色器阵列(CFA)图案和插值算法[7-10]和JPEG压缩[11]被认为是相机模型/品牌识别的影响因素。使用这些因素,在机器学习算法中提供并使用取证功能集。主要的挑战是图像处理技术保持相同或相似,并且几个制造商生产的组件在相机模型之间共享。此外,在机器学习的所有应用中,选择精确的特征集是很困难的。

第二类中的方法旨在识别采集相机装置的独特特征或指纹。传感器图案噪声(SPN)是由于制造过程中的缺陷和由于硅晶片的不均匀性导致的光电转换的不均匀性引起的。这是唯一的指纹,方法主要是基于识别相机单元。读者参考[12]第一版本的这项工作,[13-15]增强版本。 SPN的两个主要组成部分是固定模式噪声(FPN)和光响应非均匀性(PRNU)噪声。 [16]中用于相机单元识别的FPN可以通过从输出图像中分割暗帧来补偿。因此,FPN不是一个强大的指纹,不再在以后的作品中使用。在[13-15]中直接利用的PRNU也可以用于[17]中提出的相机型号识别,基于从TIFF或JPEG格式的图像中获取的指纹包含后续的痕迹,采集过程(例如去镶嵌),其携带关于相机模型的信息。由于干扰非独特操作(例如,去马赛克和JPEG压缩),从给定图像可靠地提取该噪声的能力是该类别中的主要挑战。

1.2. 论文的主要贡献

本文解决了基于被动方式的相机型号识别问题。在文献中,大量的以前的作品都是基于机器学习方法来解码检测器。主要缺点在于,该框架需要昂贵的训练阶段,其包括来自各种来源的许多具有不同特征(例如,图像内容或相机设置)的图像,以表示实际情况,这在实际的法医情况中可能几乎不可用。所有机器学习方法的另一个缺点是,他们的统计表现的评估仍然是一个开放的问题[18]。在这个框架内,他们的表现只是在大型图像数据库上经验性地进行评估,很难保证规定的误报率。

相反,本文提出的方法是基于假设检验框架[19]。虽然假设检验的应用通常比使用机器学习方法的分类器的训练更复杂,但是这种第一种方法具有无可争议的优点。通常,这种方法允许相对于期望标准优化的统计测试的解除,例如最小化假警报概率和最大化检测能力,并且经常允许建立最佳测试的理论优先级,这是误报和错误检测的概率。此外,假设检验通常对每个参数如何影响最佳统计测试的性能的问题提供了宝贵的见解。

然而,应用假设测试框架的主要挑战之一是需要精确的统计图像模型,因此可以设计出高性能的检测器。在我们以前的作品中,假设检验框架已经被利用来解决相机模型识别的问题[20,21]。更具体地说,在该框架内提出的第一种相机模型识别方法[20]已经使用异方差噪声模型来针对RAW图像。噪声模型通过将噪声方差表征为RAW像素的预期的线性函数,考虑了原始图像采集过程中泊松噪声的贡献[25,26]。然而,在大多数实际取证应用中,RAW格式几乎不可用,大多数相机以JPEG格式直接输出数字。因此,对于更实际的应用,我们最近提出了使用JPEG图像的离散余弦变换(DCT)系数的相机模型识别方法[21]。这些作品利用了通过研究和建模典型数码相机图像处理流程中涉及的主要步骤获得的[23,22]中提供的最先进的DCT系数统计模型[22]。

重要的是要注意,[20]中提出的前一种方法与[21]中的后一种方法之间的两个主要差异在于:1)前者利用空间域中的噪声统计,而后者则基于统计学DCT系数随各种摄像机处理算法结合不同的传感器噪声而变化,2)这些方法具有不同的图像格式,即前者的RAW格式,后者的JPEG格式。

应该注意的是,据我们所知,在假设检验理论的框架内,还没有研究空间域中渲染自然图像(而不是RAW)的相机模型识别的问题。在空间域中使用像素的主要优点是,无论文件格式和压缩方案如何,该信息始终可用。因此,本文的目的是研究渲染图像和使用空间域中的像素的最佳检测器的设计。

如上所述,为了应用假设检验理论,它需要模型来表示空间域中的渲染图像。最近,在我们以前的研究中已经进行了渲染数字图像的空间域中的噪声统计学研究[24]。由于异方差噪声模型能够准确地表征RAW图像,因此建议从该模型开始,并考虑后期捕获过程的影响,以开发尚未在文献中提出的所谓的广义信号依赖噪声模型。该噪声模型描述了输出像素的选择和方差之间的非线性关系。广义噪声模型可以准确地表征原始渲染图像,参见[24]中的更多细节。与[20]类似,本文利用广义噪声模型,在渲染图像的相机模型识别假设检验框架内设计统计测试。主要贡献如下:

bull;该方法基于广义噪声模型,其准确表征了经过入侵后采集过程的渲染数字图像的统计特性。在广义噪声模型中指定的三个参数(,,)被用作相机模型识别的相机指纹。

bull;在假设检验框架中说明相机模型识别问题,本文提出了在所有模型参数已知的理想情境下由似然比检验(LRT)给出的最优检测器。该最佳检测器作为相机模型识别问题的任何统计测试的上限。

bull;在实际的上下文中,模型参数是未知的。本文提出了两种广义似然比测试(GLRT)来处理未知参数的难度。分析了GLRT的统计性能。此外,提出的GLRT允许我们保证规定的虚假警报率和独立于图像内容的决策阈值的设置,这在操作环境中至关重要。数值实验还显示,与轻铁相比,GLRT的功率损失可以忽略不计。

广义似然比测试(GLRT)来处理未知参数的难度。分析了GLRT的统计性能。此外,提出的GLRT允许我们保证规定的虚假警报率和独立于图像内容的决策阈值的设置,这在操作环境中至关重要。数值实验还显示,与轻铁相比,GLRT的功率损失可以忽略不计。
1.3.文件的组织
本文的结构如下:第2节提出了广义噪声模型,并提出了进一步利用相机模型识别的相机指纹,第3节假设检验理论框架下的相机模型识别问题,并假设所有模型参数都是预先知道的,研究理论LRT。实际上,在检查数字图像时,这些参数是未知的。第四节设计了两个GLRT来解决未知参数的难度。第5节提出了两个提出的模拟和真实自然JPEG图像的GLRT的数值结果。最后,第6节包括论文。

2.摄影指纹

本节简要介绍了数码相机图像处理流水线的主要步骤,并提出了[24]中提供的广义噪声模型。基于这种噪声模型,提出了一种新的相机指纹,用于相机型号识别。

典型的图像处理流水线包括两个阶段:RAW图像采集和采集后处理(例如去马赛克,白平衡和伽马校正),参见[4,22,23]中的更多细节。输出图像是全色高质量图像,简称TIFF图像。也可以执行JPEG压缩以便于存储和传输。在TIFF或JPEG格式的自然图像中的噪声统计研究已经在我们以前的工作中完成[24]。首先,可以通过考虑在采集过程中损坏图像的噪声源来建模RAW图[20,25,26]。通常,RAW图像模型由解决光子散射噪声和暗电流的泊松部分和用于剩余静止干扰的高斯部分组成。读出噪音为了简化起见,由于大量的入射光子,可以利用泊松分布的高斯近似,这导致异方差噪声模型

xi sim; N (mu;xi ,amu;xi b), (1)

其中xi表示RAW像素,mu;X表示随机变量X的期望值。该模型将像素的变量作为像素的选择mu;xi的线性函数。 在以前的工作[20]中提出了参数(a,b)作为RAW图像的相机模型识别指纹。

然后,提出从异方差噪声模型开始研究TIFF图像中的噪声统计。 假设去马赛克和白平衡的操作是线性的[4],一个简短的计算表明,白平衡像素仍然遵循高斯分布

yi sim; N (mu;yi ,tilde;amu;yi tilde;b), (2)

图1. 使用不同的相机设置从Canon Ixus 70相机 [27]发布的JPEG图像上的预测参数。

图2:Canon Ixus 70模型不同设备发布的JPEG图像上的估计参数(〜a,〜b)[27]。

由于去马赛克和白平衡的操作,(,)与参数(a,b)不同。然后通过考虑伽马校正的非线性效应,将所谓的广义噪声模型作为

其中zidenotes输出像素,sigma;2X表示随机变量X的方差,gamma;是校正因子(通常为gamma;= 2.2)。从(3)可以看出,在自然图像中,噪声是非平稳的和信号依赖的。在[24]中显示,通用噪声模型与表征具有中等到高品质因子(QFge;70)的JPEG图像也是相关的。模型参数(,,)可以通过最大似然法(ML)来估计,详见[24]。

对于相机型号识别问题,有必要评估相机指纹对于不同摄像机设置和不同设备每个摄像机型号的可变性,并验证其对不同摄像机型号的辨别性。图1显示了估计参数(,)佳能Ixus 70cam时代的JPEG图像的不同相机设置,图2显示了佳能Ixus 70模型不同设备获取的JPEG图像上的估计参数(,)。此外,图3示出了不同相机模型的参数的差异性[24]。值得注意的是,参数(,)对不同相机型号的场景和相机设置是不变的。应该注意的是,不同摄像机模型的估计伽玛因子之间的差异有点小(见表1的细节)。参数(,,)与相机指纹相关,用于识别相机型号。

  1. 相机型号识别问题的最佳检测器

分析两款相机型号S0和S1。每个摄像机模型Sj,jisin;{0,1}的特征在于三个参数(~aj,〜bj,gamma;j)。由于明显的原因,假设(〜a0,〜b0,gamma;0)=(,,gamma;1)。在二进制假设检验中,检测图像Zis由相机型号S0或相机型号S1获取。测试的目标是确定两个以下假设:forall;kisin;{1,...,K},forall;iisin;{1,...,nk}其中sigma;2k,j = f(mu;k; ~aj, 〜bj,gamma;j)是相对于假设Hj的期望mu;k的噪声方差。如前所述,本文着重于设计一个允许我们保证规定的误报率的测试。因此,让我们的假报警概率上限为速率alpha;0的测试类。这里mu;=(mu;1,...,mu;K)是平均向量,PHj [E]代表假设Hj,jisin;{0,1}下的事件E的概率,而超过(mu;,〜a0, 〜b0,gamma;0)必须被理解为任何模型参数。在Kalpha;0类的所有测试中,它的目的是找到一个最大化功率函数beta;delta;的测试delta;,由正确的检测概率定义:

beta;delta;= PH1 [delta;(Z)= H1]。 (7)

问题(6)突出了相机型号识别的三个基本困难。首先,即使所有模型参数(mu;,〜j,〜bj,gamma;j)都是已知的,所以在文献中从未研究过最强大的测试,即LRT。第二个难题在于未知图像参数的实现。最后,相机参数(~aj,〜bj,gamma;j)也是未知的,因此假设Hjbecomes复合。

假设相机型号S0是可用的,因此法医分析人员可以访问其特性或其指纹,即其相机参数(〜a0,〜b0,gamma;0)可以是已知的。因此,他们可以通过检查被调查的图像Z是否包含指纹(〜a0,〜b0,gamma;0)来作出决定。换句话说,提出了当替代假想H1组合时,即相机参数(,,gamma;1)未知时,解决问题(6)。可以注意到,无论什么(,,gamma;

全文共8823字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[144584],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。