《图像被动取证技术简述.docx》由会员分享,可在线阅读,更多相关《图像被动取证技术简述.docx(29页珍藏版)》请在优知文库上搜索。
1、一、引言过去10年中,数字图像在日常生活中越发流行。和传统文本内容相比,图像更加直观并能传递更多信息。尽管数字图像带来了很多好处,但是它也在一些方面带来了严重的安全问题,即如何检测数字图像的真实性,以及如何发现恶意修改。随着图像处理软件的进步,篡改图片而不留下视觉上可辨的痕迹更加容易,这使得上述问题更具挑战性。为了精确并鲁棒地鉴定图像内容和发现图像造假,研究者已经提出了多种数字图像取证方法。一般而言,这些方法可分为两大类:主动方法和被动方法。主动取证方法通常通过设计各种水印或指纹,并将它们嵌入数字图像。在鉴定阶段,提取先前嵌入的水印或指纹,并用来检测判断原图是否被篡改。如果被篡改,则确定篡改位
2、置在何处。这种主动方法能够精确探测数字图像的篡改,但是这些方法并未被广泛应用。其主要原因在于不可能事先对所有互联网上的图像进行水印处理。因此,更多的人选择被动取证方法。通过分析图像生成/修改阶段所留下的特定线索或模式,能够发现图像造假。和主动取证方法相比,被动取证方法不依赖先验或预设信息,在图像取证领域中应用范围更广。在被动数字图像取证中,多种痕迹被用来区别篡改图像和原始图像。本文中,我们将这些痕迹分为3类:采集痕迹、存储痕迹和编辑痕迹。对每一种痕迹,我们将简要回顾对应的被动数字取证方法,并着重澄清如下问题:这些痕迹是什么?它们如何形成?图像取证中相关的最新方法是什么?为什么这些方法能够探测特
3、定的痕迹?本文的组织如下:第24节,我们逐一介绍被动数字图像取证方法,包括:采集痕迹法、存储痕迹法和编辑痕迹法。第5节讨论当前技术的主要局限,并提出未来可能的研究方向。二、图像采集中的线索数字图像从被捕获到被存储,中间需要经历多个处理步骤(图1)。在进入成像设备之前,光线首先会通过一系列镜头。之后,成像设备将其传送到彩色滤色阵列(ColorfiIterarray,CFA)进行特定的彩色像素排列处理,其仅允许光线的特定成分通过。大多数相机的CFA单元只允许每个像素记录一种颜色的值(红、绿、蓝)。在经过CFA滤波后,光线到达图像传感器一一数码相机的关键部分。目前,有两种广泛使用的传感器:电荷耦合器
4、(chargedcoupleddevice,CCD)和互补金属氧化物半导体(ComPlementarymetal-OXideSemiCOndUCtor,CMOS)。图像传感器中包含大量光敏二极管,每个光敏二极管与图像的像素一一对应。在每个光敏二极管中,经CFA滤色后的光强被转换为电信号。得到的图像数据的每个像素点表示红、绿、蓝中的一种颜色。因此,为了重建全彩图像,需要进行解镶嵌/去马赛克(demosaic)处理,即通过在所有颜色通道上进行插值,重建缺失的色彩分量。图1图像采集流程图上述每个阶段都会在最终图像中引入特定痕迹。这些可以作为图像源识别和篡改检测的线索。以下几个小节简要介绍了镜头阶段、
5、传感器阶段和CFA插值阶段所留下的痕迹,以及利用这些痕迹进行图像取证的典型方法和目前最先进的方法。(一)图像采集阶段的痕迹在采集图像时,镜头的设计和制作工艺使得其无可避免地引入失真/像差。数码相机有两种常见的失真:(chromaticaberration,CA)和球面差(SPheriCalaberration,SA)。不同波长的光线通过透镜时的折射率也各不相同,这种现象称为色差现象;轴上物点发出的光束,经球面折射后不再交于一点,这种现象称为球面像差。传感器模式噪声是图像采集阶段另一种重要特性。在各种传感器噪声中,由光响应不均匀性(photoresponsenonuniformity,PRNU)
6、引起的噪声尤为重要。目前学术界已经提出了多种基于PRNU噪声的数字图像取证方法,涵盖源识别、历史恢复、图像伪造检测等多个领域。PRNU是与成像传感器紧密相关的特性,通过分析图像PRNU可以获得关于成像设备的线索。CFA过程中的解镶嵌/去马赛克操作同样会留下特定痕迹。在色彩重建时,为了获取图像中每个像素的对应值,需要对3个颜色通道进行插值操作。插值过程不可避免地会在像素之间引入一定的关联性,这种相关性可以被看作是成像设备的固有“指纹。通过分析解镶嵌/去马赛克痕迹,可以获得成像设备的线索。(二)利用图像采集痕迹的图像取证1.基于传感器噪声的图像取证利用相机镜头产生的像差,可以将图像与特定设备相关联
7、,或检测图像是否经过篡改。例如,图像中经常出现的径向畸变现象会导致所成图像发生形变。为解决径向失真问题,数码相机制造商通常会采用各种方法来补偿失真,这些方法相应地会产生不同的痕迹。因此,通过分析这些痕迹可以识别相机制造商甚至相机型号。传感器模式噪声通常会被用于图像取证。对于图像/,其对应的传感器噪声可以通过以下公式表述:R=I-F(I)=xP+0(1)式中,R是总体残差,即原始图像减去经过去噪滤波器F滤波后的图像;P是PRNU因子;(P是图像中其他所有噪声的总和。假设我们有同一摄像头捕获的N幅图像I1儿对应的残差Rk可以通过公式(1)得到。PRNU因子P可以通过最大似然估计,按照以下公式进行计
8、算:(2)=E屋Rklk1.)2在相机识别中,假设存在M个设备,则需要计算M次PRNU因子,并且针对每个设备(/=1,2M)记录特定的P,值。在检测阶段,对于待测图像首先通过公式(1)即用,-F计算残余项。然后,PRNU因子与该残差Rt之间的相关性通过以下公式计算:(3)11i=ItPi0Rt式中,弋表归一化互相关;最大值对应的设备即为目标设备。2 .基于CFA痕迹的图像取证基于CFA痕迹的取证方法的基本原理是,原始图像非篡改区域和篡改区域具有不同的CFA模式。因此,对被检测图像的每个分块进行CFA模式计算,如果存在不同的CFA模式,则为篡改图像,并可以得到篡改区域。另外,由于不同的解镶嵌/去
9、马赛克算法会使得同一颜色通道中相邻像素之间的关联性不同,因此基于CFA模式的图像取证可以分为两个方向:预测插值参数并识别成像设备的类型;检查解镶嵌/去马赛克痕迹以找出可能被篡改的区域。(三)最先进的基于采集的图像取证方法1.基于镜头像差的成像设备源识别不同的相机具有不同的镜头像差,因此镜头像差可以作为源识别中设备的固有指纹。Choi等在这方面进行了开创性的工作:鉴于径向畸变会使得直线变弯曲,他们基于像素灰度和畸变程度提出两类特征,从而将成像设备源识别问题转变为二分类问题。与仅使用图像灰度的方法相比,ChOi等的方法实现了4%的检测精度提升。使用镜头痕迹进行图像伪造检测的基本思想是:原始图像和插
10、入的图像块很可能来源于不同的拍摄设备。通过检测不同图像块是否具有同一镜头痕迹,可以鉴别图像是否经过伪造。提出了一种镜头痕迹一一紫边失真(PUrPIefringingaberration,PFA)及相应的提取方法。PFA的方向特性被用作唯一的“指纹来确定被测图像是否具有镜头痕迹不一致性。该算法在图像伪造检测和篡改检测中都取得了很好的效果。3 .基于传感器模式噪声的成像设备源识别由于传感器制造工艺的缺陷,不同像素具有不同的光敏性。因此,传感器噪声(特别是PRNU)可以用来区分各种传感器和相机类型。提出了基于PRNU的源识别方法,可以识别9种相机模型。注意到在边缘区域对传感器噪声的估计不够准确。基于
11、这一发现,他们在特征提取操作之前进行了特定的预处理操作,利用Canny和1.aplace算子进行边缘区域检测,并将检测出的边缘区域移除以做进一步处理。经阈值处理计算得到传感器噪声之后,通过灰度共生矩阵(gray-levelco-occurrencematrix,G1.CM)从离散小波变换(discretewavelettransform,DWT)域提取多个统计特征。最后,采用k-近邻(k-NN)作为分类器对特征进行分类。考虑到手机摄像头识别这一应用场景,提出了一种基于摄像头传感器缺陷的方法。同样从小波域提取特征在手机相机识别中取得了很好的效果。与镜头痕迹类似,传感器噪声可用于检测图像是否经过伪
12、造。其基本想法是,篡改区域中的传感器噪声/指纹会与原始图像不一致,这一线索可以用来定位可疑的篡改区域。Fridrich提出了一种基于PRNU信息的图像篡改检测方法。该方法通过建立统计模型来描述PRNU因子,提取出的PRNU因子同样可以用于成像设备识别。实验结果表明,这种方法在100种不同类型的相机检测中实现了近乎Io0%的准确性。5 .基于CFA痕迹的成像设备源识别如前所述,不同相机的CFA模式和解镶嵌/去马赛克操作会有所差异。Gao等提出了一个基于这些信息的成像设备源识别方法。他们提取出69维的特征来描述上述痕迹。在DreSden图像数据库上的实验结果表明,在7类相机模型的识别中,该方法达到
13、99.88%的准确率。6 .基于CFA痕迹的篡改检测在篡改检测中使用CFA痕迹的基本思想很简单:篡改区域与原始图像会呈现不同的CFA以及解镶嵌/去马赛克痕迹。提出了一种描述图像解镶嵌/去马赛克痕迹的特征。如果存在异常区域(即没有原始图像CFA痕迹或具有与原始图像CFA不同的痕迹),则将其视为篡改区域。提出了一种既能检测图像伪造又能定位篡改区域的方法。通过对解镶嵌/去马赛克造成的痕迹进行建模,实现图像伪造检测。该方法对未压缩图像有很好的检测性能。然而,如何处理JPEG压缩图像仍然是一个具有挑战性的问题。三、存储过程中的线索JPEG(jointphotographicexpertsgroup)是图
14、像传输和存储应用中最广泛使用的图像格式。由于JPEG是一种有损的压缩标准,因此,在图像存储过程中,JPEG将不可避免地引入某些特殊的压缩痕迹。通过分析这些痕迹,研究者可以推导出一些重要的取证线索,例如,该图像被压缩了多少次;图像中的所有区域是否被压缩过相同的次数。在之后的几个小节中,笔者将简要介绍JPEG压缩所留下的特定痕迹、JPEG图像取证的典型场景以及该领域最新的取证方法。(一)JPEG压缩遗留的痕迹针对灰度图像的标准JPEG压缩流程如下(通过在YCbCr色彩空间中的每个通道执行类似的流程,可以将JPEG压缩扩展到彩色图像):首先,对原始图像上进行不重叠的8x8像素块分割;其次,针对每个块
15、,对其灰度值进行2D-DCT变换,从而将该块从空间域变化至频率域;再次,对各频率分量的幅度通过预设的量化表来量化(其中,图2显示了品质因子为50的典型量化表,其中较大的质量因子表示较高的图像质量和较低的压缩比);最后,采用峭编码技术(霍夫曼编码)将量化后的频率幅度转换为二进制序列进行存储。JPEG压缩将对原始图像引入3种误差:量化误差、截断误差和取整误差。量化误差是由频域中的量化过程造成的。量化之后,特定DCT分量的原始值将由最接近的相应量化步长整数倍表示。例如,如果原始DC值为86,量化步长为16(图2),则量化后DC值将变为80,并将差值表示为量化误差(即8680=6)o截断误差和取整误差在逆DCT变换中引入。由于图像每个像素点的灰度值应该是一个从0到255的整数,所以任何大于255或小于0的值都会被截断为255或0,这相应地会导致截断错误。另一方面,逆DCT变换后的大多数值不是整数,并且必须执行取整过程,从而造成取整误差。一般来说,量化误差远大于其他两个误差,特别是当品质因子为中或低(小于75)时。通过分析量化误差,可以推断出关于JPEG压缩的一些线索。1611101624405161121214192658605514131624405769561417222951878062182237566810910377243555648110