英语原文共 20 页,剩余内容已隐藏,支付完成后下载完整资料
彩色图像篡改检测的新发展(论文)
在本文中,提出了一种无源彩色图像盲篡改检测的高效框架。从给定的测试图像中提取统计特征,并对给定的测试图像应用多尺寸块离散余弦变换导出的一组2-D阵列。图像特征是从Cr通道(YCbCr色彩空间中的色度通道)中提取出来的,因为它对彩色图像篡改很灵敏。在最近为篡改检测建立的彩色图像数据集的基础上,用支持向量机器来评估图像特征的有效性。增强特征选择用来降低特征维数以便使检测精度更好和计算复杂度降低。实验结果表明,应用于上述数据集,本文提出的框架具有明显的优势。
关键词:彩色图像篡改检测,多尺寸块离散余弦变换,特征函数矩,马尔科夫过程,支持向量机,增强特征选择
I.引言
一句古话,“不要以封面判断书”,其根源可追溯到数字革命之前。不管怎样,在现代社会,图像篡改正在强调这一点的重要性,正如拼接是一种常见的方式来扭曲图像的语义内容,可能会导致公众对现场背后的真实性的误解。
图像拼接是图像伪造的基本操作,其以采用简单的剪切和粘贴操作为特点,取出图像的一部分并将其放在同一幅或另一幅图像上而没有任何后处理,如消光完美混合。术语“图像篡改”实际用于包含其他后期处理,使得对图像的伪造不那么明显的“图像拼接”。图像篡改可能使一般人难以区分出真实图像和篡改图像;因此,一个自动分类系统将能够处理图像篡改检测,比人眼靠谱得多。
图像伪造检测通常可分为主动[2]和被动[3]。前者通过检查在图像采集时刻或图像分配之前嵌入的数字水印的变化来检测图像的完整性; 不幸的是,这种方法要求图像捕获设备配备标准化的水印功能,但尚未实现。 相反,后者仅利用图像本身的知识进行伪造检测; 被动检测方法无疑是积极的。在机器学习下框架,本文介绍了一种有效的被动盲图像篡改检测方法。
在过去几年里,已经出现了许多图像拼接/篡改检测技术。Ng et al[4]考虑像素值的突然变化的存在而对其重点观察用于图像拼接检测,使用由更高阶矩谱和图像的二值性特构成的特征用于灰度图像数据集[5]达到了72%的检测精度。约翰逊和法里德[6]设计了一个检测图像伪造的方案,检测图像中的照明不一致性,然而,他们的方法检测不到在相同水平的环境光下拍摄的两张图片组成的拼接图像。Hsu and Farid[7]利用几何不变量和相机特征一致性交互地检测拼接图像。Fu et al.[8]提出使用希尔伯特黄变换和特征函数的时刻(MCF)作为拼接检测的特征,准确度为80%。Chen et al.[9]提出了二维相位一致性和MCF的特征的小波子带进行图像拼接检测有82%的准确度。Shi et al.[10]采用了一个自然图像模型包含从测试图像中提取的统计特征和通过对测试图像进行多尺寸块离散余弦变换(MBDCT)生成的2-D阵列。统计特征包括小波子带的MCF和差异二维阵列的马尔可夫转移概率。这个检测率达91.9%。 Dong et al.[11]分析了拼接造成图像像素相关性的不连续性,他们的统计特征是从图像游程长度和图像边缘数据提取的。Qu等人[12]提出了一种检测拼接图像的方案是基于图像拼接留下尖锐的边缘的前提,因此,他们的方法可能无法检测到进行了边界模糊的篡改图像。
上述方案中的大多数是基于灰度图像或彩色图像的亮度分量,其忽略用于检测拼接图像的其它有意义的信息。Wang等 [13]采用图像色度来增强彩色图像篡改检测。 它们的特征源自图像色度阈值边缘图像的灰度共生矩阵(GLCM),并且在彩色图像篡改检测数据集的早期版本中表现良好[14]。
在本文中,基于图像篡改前后图像的频率分布变化的分析的自然图像模型,提出了被动盲彩色图像篡改检测的有效统计特征。这种自然图像模型是从给定的测试图像及其由MBDCT生成的相应的2-D阵列导出的。共有266个图像特征从Cr通道提取,YCbCr色彩系统中的色度通道对彩色图像篡改最敏感。这一看法也与[13]中的观察结果一致。在[13]中,来自Y和来自任何色度通道的特征的性能差异很大,但在这项工作中只是略微的;然而,这里的Cr通道的选择指出色度通道对图像颜色篡改检测的重要性。特征的有效性通过支持向量机(SVM)在彩色图像数据集上进行评估[14]。根据模式识别理论[15]的经验法则,SVM训练中一类训练图像数与图像特征数的比值被认为太低;因此,增强特征选择(BFS)[16]被应用于选择合理维度的最优特征子集50,以增加比率。特征维度的降低不仅对所提出的统计模型在预定数据集上的性能进行更可靠的评估,而且还减少了计算训练和测试分类器的复杂度。实验结果表明,所提出的特征的性能明显优于现有技术[13]。
本文的其余部分组织如下:第二部分提出所选的特征; 实验情况和结果见第三节,第四节得出结论。
II.建议的图像特征
对[13]中彩色图像拼接检测的图像色度有效性的研究鼓励我们将这些知识应用到我们的特征集中。也就是说,我们的特征是从一个图像色度通道中提取的。 原来对隐写分析与拼接检测的差异和相似性的研究[17]开辟了利用通用隐写分析中使用的功能来处理篡改检测的机会。[17]中的图像模型在[5]中实现了92.2%的精度。这就形成了自然图像模型的概念,其在高维空间中独特地表示原始图像。
我们的自然图像模型是基于[10]的基础上,从以下两种组合中得出:(1)从图像像素2-D阵列得到的特征以及从MBDCT系数2-D阵列导出的特征;(2)基于力矩的特征函数(基于力矩的)的特征和马尔科夫特征。
众所周知,块离散余弦变换(BDCT)在去相关和能量压缩方面具有优越的能力。图像篡改改变了原图像的频率分布,这种变化可以由BDCT 2-D阵列的系数反映出来。原图像种类繁多,粘贴图像碎片和图像伪造技术都是使得引入篡改图像的变化复杂多样的关键因素。因此,具有多种块大小,MBDCT 2-D阵列的系数与单块大小的BDCT阵列相比可以更多有效地捕获复杂的改变。 在[10]中已经示出,以块大小为2times;2,4times;4和8times;8生成的每个BDCT 2-D阵列在篡改检测率方面彼此补充。
A.基于力矩的特征
基于力矩的特征将来自一阶统计信息(1-D直方图的特征函数)和二阶统计量(2-D直方图的特征函数)的信息结合起来捕获篡改操作。粘贴图像碎片到被篡改图像上类似于在图像上添加独立噪声。假设噪声的特征函数的幅度不增加,可以通过使用离散切比雪夫不等式[18]来显示,这种力矩不会因图像篡改而增加。
B.预测误差二维阵列
预测误差2-D阵列减少了由图像内容的多样性引起的影响; 因此,高频内容,例如篡改伪像所在的边缘被增强。
图1 预测背景
是的估计,Delta;x是由(1)[10]得到的预测误差,找到图像中的每个像素的Delta;x得到图像的预测误差2-D阵列。
(1)
C.离散小波变换(DWT)
离散小波变换(DWT)适用于捕获离散空间和频域的瞬态或局部变化,有利于篡改检测。三级 Harr小波变换在之前有提到过并在[8]中证明是合理的。在实现中,为了简单起见,应用一级Haar小波变换来将图像像素2-D阵列,其对应的MBDCT系数和预测误差2-D阵列分解成若干小波子带,然后使用它们来计算统计矩 。
D.矩和边缘矩
1-D特征函数(CF)是每个小波子带的1-D直方图的DFT。在这个续篇中,图像系数阵列及其预测误差2-D阵列被认为是由LL0表示的0级的低低子带.H(ui)表示离散频率ui处的CF分量,K是不同系数值的总数。1-D CF的第l个绝对矩可以被定义为:
(2)
作为二阶统计量,2-D直方图可以进一步增强篡改检测能力,并且这样的直方图是对被特定距离和方向分开的成对像素的联合现象的度量。沿着水平和垂直方向的两个像素之间的单位距离在这里涉及,导致每个图像有两个二阶直方图。 像1-D CF,由H(u,v)表示的2-D CF是二阶直方图的DFT。2-D CF的两个第l边缘矩由(3)定义。在(2)和(3)中,只有三个最低阶矩l = 1,2,3在特征形式中被考虑,因为添加高阶矩几乎不会提高检测率。我们广泛的实验证实了这一假设并且现象与[19]中普遍使用的通用隐写术中的现象一致,其中1-D CF和2-D CF边缘矩被建设性地混合。
(3)
E.马尔科夫特征
在[10]中,已经证明,以转移概率矩阵(TPM)为特征,马尔科夫过程(MP)可以对二阶阵列的元素之间的相关性进行建模;因此图像篡改造成的统计变化可以通过马尔科夫TPM来反映。
JPEG 2-D阵列被定义为由所有霍夫曼解码的JPEG系数的大小组成的一幅给定图像的二阶矩阵,F(u,v),uisin;[0,Su -1]和visin;[0, Sv -1]。沿水平(h)和垂直(v)轴的差分JPEG 2-D阵列定义为
(4)
根据我们对一些大图像数据集的统计学研究,差分JPEG 2-D阵列的元素分布是拉普拉斯算子,从而使阈值技术成为可能。(5)中的所有元素被截断,使得它们的元素值大于T或小于-T的将分别由T或-T表示。该过程使得每个TPM的维数等于(2T 1)times;(2T 1)。 然后将MP应用于差分JPEG 2-D阵列,并且转移概率可以如下计算。
(5)
其中m,nisin;{t:tisin;Z; 和-Tle;tle;T},delta;(· )和delta;(·,·)分别为1-D和2-D dirac delta函数。 我们的研究表明,当T = 3时,约90%的这些元素被捕获。 因此,可以以降低的维度计算TPM。马尔科夫特征由TPM中的所有元素组成。[10]中精确的证明了马尔科夫特征增强了基于矩的特征。
F.特征选择
增强特征选择(BFS)[16]是从M维特征中选择最佳D维特征集的迭代算法。小于或等于M,所选择的特征维度D是用户定义的,并且对应于算法中的迭代次数。 BFS不仅可以减少训练和测试SVM分类器的特征维度和计算复杂度,而且可以改善某些情况下的检测精度由[13]验证。D的适当值可以通过D与其SVM分类精度之间的关系来确定。不幸的是,在我们提出的功能中,没有D可以提高检测率,所以D被选择用于管理类中可用的训练图像的数量与SVM训练中的图像特征的维度的低比率,并降低训练和测试分类器的计算复杂度。
Ⅲ. 实验结果
A.图像数据集
中国科学院自动化研究所科学(CASIA)最近发布了一个彩色图像篡改检测评估数据集[14],由800个真实图像和921幅大小(384times;256和256times;384)与CIF视频序列的亮度帧接近的篡改图像。大多数真实图像来自CorelDraw Image Database,其他人可以从互联网下载或使用数码相机捕获。通过颜色插值使用抗混叠滤波器使其平滑篡改区域的边界,Adobe Photoshop被用来创建篡改的图像数据集。因此,篡改区域的边界不如像剪切和粘贴操作创建的那样锐利。图2描绘了一些真实图像(上面一行)和他们的伪造图像(下面一行)。
在论文工作中,在实验的时候,[14]中只有800个真实的和626个被篡改的彩色图像。在[13]中,[14]中的500个真实的和448个被篡改的图像可用。
图2 真实图像(上面)和篡改图像(下面)举例
B.分类
采用具有2级多项式核的支持向量机(SVM)。[20]中提供的Matlab代码已经独立经过训练和测试了20次,每次由5/6个随机选择的真实和篡改的图像进行训练和剩余的测试。对一组50个选定的特征进行了可靠的性能评估。在表1中,提出了特征的检测率与[13]中报道的两种不同情景下的最佳检测率进行比较,其中特征来源于灰度共生矩阵(GLCM)。
表1 用百分百表示的检测率
IV.结论
本文提出了一组特征,从霍夫曼解码JPEG系数的幅度差分阵列导出的多尺度块离散余弦变换(MBDCT)和马尔可夫转移概率矩阵得到的1-D和2-D特征函数的矩。在彩色通道中提取特征以进行彩色图像篡改检测。虽然Cr的特征性能最好,但仅比Y(表1所示)稍好。然而,在亮度和色度通道的特征之间的性能差距是巨大的[13]。因此,我们得出结论,在彩色图像篡改检测中,利用色度通道的性能增益取决于图像统计模型的性质。在本文中,从Cr通道制定图像特征的基本原理不是强调性能上的任何显着增加,而是强调色度通道对彩色图像篡改检测的重要性。通过使用HP Pavilion dv6930us未优化的Matlab代码[14]来提取特征,特征提取的平均计算时间为每个图像26.4秒。
虽然266维特征的检测率非常高,达98.0%,由于训练图像数量与特征的比例较低,我们不建议将其作为可靠的结果,因为分类器的广义性不足[15],由训练图像的数量与特征维数的比过低造成的。增强特征选择(BFS)通过减小特征维度来避免这种限制,而不会严重恶化检测精度, BFS引起的维度减小也可以减少训练和测试SVM时的计算复杂性。通过BFS,50个选定的特征比在[13]中基本相同的数据集中报告的最佳检测率更好[14]。
综上所述,彩色图像篡改检测的新进展如下。 1)CASIA数据集V1.0是一种彩色图像数据集,可用于彩色图像篡改检测,Adobe Photoshop 7.0用于图像篡改。 2)提出的基于MBDCT的特征集是有效的。 3)Cr通道特征对于彩色图像篡改检测起着重要作用。 4)BFS通过减少特征数量而不会使检测性能的恶化。
参考文献:
[1] J. Sun, et al., “Poisson matting,” in ACM Siggraph, 2004, pp. 315-321.
[2] S. Ye, E. C. Chang, and Q. Sun. “Watermarking based image
authent
全文共16650字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[142675],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。