基于HDTV的数字视频压缩编码的研究外文翻译资料

 2022-09-09 16:16:41

英语原文共 442 页,剩余内容已隐藏,支付完成后下载完整资料


10.1简介

为了使压缩后的视频比特流能够在各种平台和设备上统一被解码,比特流的格式必须被预定义。就像有一种标准说的一样,一个电源适配器,为了能够插到插座里面,这个标准必修具有兼容性。所以必须有一个视频压缩的标准,使得能够在任何地方解码所有规格标准的视频压缩数据。因此,互通性是建立一个压缩标准主要的因素。我们已经描述了联合图像专家组(JPEG)的静止图像压缩标准,在本章中,我们将试图给出MPEG的视频压缩标准。我们的目的将是描述视频编码标准的各个方面,我们将避免讨论视频比特流的语法。

MPEG是运动图像专家组的缩写,它是在国际标准化组织(ISO)和国际电工委员会(IEC)的编写下形成的,MPEG在ISO/IEC中被赋予了正式的地位。在1992年,MPEG小组发布了他们的第一个视频编码标准MPEG-1,MPEG-1标准主要包含五个部分:第一部分,系统;第二部分:视频;第三部分:音频;第四部分:兼容性测试;第五部分:软件模拟。MPEG-1的标准定位于多媒体的应用,它是为了逐步优化压缩效率,使得每秒30帧大小为352times;240像素的扫描图像的数据传输速率达到1.5M/s。这个标准不支持隔行扫描视频,MPEG-1提供的图像质量相当于HVS。随着数字电视(TV)的需求不断地增加,MPEG小组在1992年推出了名为MPEG-2的视频压缩标准,该标准主要针对于广播和TV的,它支持隔行扫描,更大的图像大小和数据速率高达10M/s。MPEG-2被用于广泛分布的数字电视中,包括标准清晰度电视(SDTV),DVD和高清晰度电视(HDTV)。MPGE-2标准定义了五种配置文件来支持从MPEG-1到十分先进的HDTV压缩的广泛的功能,直接经过扩展的MPEG-1是MPEG-2中的主轮廓(MP)。

MPEG-4是在1998年进行标准化的,它旨在以非常低的数据传输速率和作为CD-ROM,DVD,数字电视和普遍接入基于内容的交互。它包括易错的无线网络,MPEG-4。MPEG-4是将多媒体标准进行固定和无线网络传输,可以整合多个应用程序。将在下个章节中对MPEG-4标准特征进行一个简要的的描述。

MPEG-7是在2004年进行标准化的。MPEG-7,标题为多媒体内容描述的接口方面,并提供了一套丰富的工具来用于说明多媒体的内容。它提供了一套全面的视听介绍工具来创建说明,这将构成应用的基础,使所需的有效地访问多媒体内容。

在下文中,我们将试图描述视频压缩背后的基本思想,MPEG-1和MPEG-2标准的一部分为后面的MPEG-4和高级视频编码给出了给出了简要的说明。MPEG标准文件被分为两类。规范的部分定义了实际的标准。事实上,该标准仅定义了压缩的比特流格式及解码器在重建视频需要遵循的标准规则,多信息的标准节包含了必要的背景信息在编解码的原则基础上。

10.2 MPEG-1和MPEG-2标准

10.2.1 MPEG视频层术语

图片是在更早的时候被提出的,MPEG标准只规定了在编码器的输出的编码比特流和解码器简单地遵循比特数据流的语法来解压缩所述视频序列。MPEG视频比特数据流由许多层组成,并且最外层是视频序列层。视频序列是由一个图像组组成的,该图像组又由三种图片组成即I帧、P帧和B帧。顾名思义,I帧或帧内画面仅利用空间冗余的来进行压缩的。因此,在图像组(GOP)中是由自己来编吗而不依赖其他帧的。另一方面,P帧(预测编码图像)和B帧(双向预测编码图像)是参照任一I帧或P帧来进行图像压缩的。在编码器层的MPEG视频图片(GOP)的典型组说明如图10.1。这是为了在其中解码器应用解码压缩比特流。第一个P帧是使用以前的I帧作为参考压缩图片。前三个B帧所使用的第一个I帧,P帧,和下一个帧。注意,这是没有必要有一个GOP的所有三个类型的图片。相反,一个GOP可以仅含有I帧和P帧。此外,一个MPEG比特流可能有封闭或开放的GOP。在一个封闭的GOP,P帧和B帧是从同一GOP其它的I帧和P帧在一个开放的GOP中预测,而P帧和B帧可以从I帧和从GOP以外P帧进行预测。因为B帧是参照两个之前参考帧和未来帧,该图像解码顺序被呈现给观众不同于在它是编码。图10.2显示出了GOP的图10.1显示顺序。观察B帧跟随I帧和P帧跟随B帧,等等。

宏块 在输入视频序列中的每个图像都被划分成宏块,以下是一个MPEG视频宏块的建立。每个宏块是由1个16times;16亮度像素,1个8times;8的Cb像素,和一个8times;8的Cr像素组成。然而,变换(DCT)对每个8times;8进行基于离散余弦压缩

在所有的三种组分的像素块。

切片 MPEG压缩的比特率是可变的。为了使压缩的视频比特流通过恒定比特率信道来传输,输出缓冲器和速率控制的位流策略是必需的。为了适应恒定的输出速率控制策略比特率和信令改变编码参数,序列中的每个画面被分成片。这种划分成片给出了更多的灵活性和控制输出比特速率。片是栅格中几次连续的宏块的扫描顺序,如在图10.3所示。

10.2.2 MPEG编码

有了这些命名规则,我们现在来描述MPEG标准编码的规则。我们将比较与对比MPEG-1和2MPEG-2标准。图10.4显示出适用于MPEG标准序列的视频压缩的过程框图。系统在图10.4示出的是适用于I帧和帧编码。由此可见在图中,MPEG视频编码的本质上是预测性。它的去相关图片在时间域中使用运动估计和补偿获得当前和先前帧的差。视频压缩的实现,因为差分帧有强度低得多的动态范围呈拉普拉斯状分布。一个详细说明MPEG视频编码的组成部分如图10.4中所示。

预处理 该块对输入的RGB空间图像序列转换到所述YcbCr空间以及进行格式为4:2:0或4:2:2的色度采样。MPEG-2允许4:4:4采样格式使得图像的质量最好,其中所有三个组件具有初始分辨率。在4:4:4采样格式通常在主数字侧面。MPEG-2允许隔行扫描视频,而MPEG-1仅使用逐行扫描视频。MPEG-1和MPEG-2的色度采样格式示于图10.5a-e所示。在两种标准的4:2:0采样格式中有不同的地方。如从图10.5b,c可知,色度样本被对称放置。

在MPEG-1标准的四个Y采样之间,它是垂直取向的。而在MPEG-2标准中,在隔行扫描视频的情况中,色度样本与Y样本的共存仅在顶部场和底部场中,只有Y样本存在(参见图10.5d,e)。对于在MPEG-2的逐行扫描情况中,采样方式是相同的,在图10.5c所示。

运动估计 正如我们在上一章中指出,运动补偿差分优于单纯差分。因此,该编码器具有第一估计每个宏块的运动的当前帧参考前一帧。这种处理块估计使用SAD指标的议案并且还产生用于每个宏块的运动矢量。运动矢量发送到熵编码器用于传输或储存。运动估计只为的亮度块和相同的运动矢量用于与色度块合适的比例,考虑到使用的采样格式。实际搜索在块运动的估计中使用的程序是左到编码器,这取决于在合适的实时硬件处理器的可用性。

运动补偿 一旦宏块的运动被估计到,这是再用来与在参考帧中的相应的块对准并找到差值相应于当前宏块和参考帧中的对准的块之间。参考宏块被从“先前帧”缓冲得到的。该运动补偿预测块被添加到差块从逆离散余弦变换(IDCT)块,并被送回到“前一帧”缓冲区。这形成了在编码侧闭环。注意,相同的循环也可在解码器处对于视频的重建。

DCT 这个处理块接受差分像素块作为输入,并输出差分像素的二维DCT。虽然亮度块是尺寸为16times;16像素,2D DCT对每个8times;8象素执行。

量化 在MPEG量化2D DCT系数的方法与在JPEG标准中使用的是相同的。对于内相关,默认在MPEG-1的亮度分量中使用的量化矩阵如表10.1。在表10.1中可看出量化步长的分布大致相当于人的视觉系统的给定的观看距离的频率响应,大约六倍屏幕宽度和360times;240分辨率的图片像素。 DCT系数的量化的量可以增加或通过用量化尺度参数的量化矩阵乘以减小。

在MPEG标准的非内相关的缺省的量化矩阵1和2具有16为所有的元素相同的值示于表10.2。记得非内相关涉及差分图像的编码,差分图像已经去相关。因此,从根本上是白噪声。因此,他们的DCT的将具有大约为全部系数相同的值。 那是之所以使用恒定值用于非内相关的量化矩阵的原因。

锯齿扫描 DCT系数被量化以后,该量化系数熵编码之前以锯齿次序进行扫描。Z字形扫描对于MPEG-1和MPEG-2的命令列于分别显示在表10.3和10.4。这两个表中的条目对应的系数的以光栅扫描的顺序构成。附图10.6a,b显示的Z字形扫描模式为连续线,起始系数为0到系数63结束。

可变长编码

1.I帧编码

DC系数 如前面所提到的,I帧是由本身不参考以前或将来编码的图片。这意味着I帧编码是纯粹的空间编码。直流和量化后的8times;8的DCT的AC系数熵编码不同和锯齿形扫描。其原因在DC编码的差异,并且AC系数如下。一个8times;8的DCT的DC系数是衡量该块的平均值,事实上,它是块平均值的8倍。因为没有相关的块平均值之间离开,是有意义的代码块的DC差异而不是每个代码分别封锁DC。作为总体目标,在一个压缩方案是实现高的压缩比尽可能失真或丢失一个给定的量的信息,无论何时何地有必要去除可能的像素相关。因此,该差分DC =DC-DC^,其中,D^C是预测值(前一块的DC系数),是熵编码。 MPEG使用相同的程序编码的DC系数作为用于JPEG。直流差值通过11,每个大小划分为12个大小分类,0具有完全相同2大小条目数,如表10.5。对于霍夫曼代码每个尺寸也在表一起列出。该表还列出了代码色度分量的直流尺寸类别。 MPEG-1拥有高达8与DC的区别值范围从-255到 255,而MPEG-2拥有高达大小11相应范围-2047到 2047。编写一个DC区别△DC,它的大小类别由由以下公式确定:

然后为DC差的代码是接着它的大小类别代码比特大小号码,它标识DC差的精确值。例如,直流差值12的亮度分量的大小类别是4。从表10.5规模4类代码为110,然后会有一个额外的4位被附加到用于尺寸类别的代码。十进制值12的4位二进制码为1100。因此,对于直流差分的码12是1101100。如果直流差为负,则附加大小的比特数将对应于DC差减一的2的补码。因此,该为-12代码如下。大小类别仍然是相同的,即4。然后将2在4位二进制表示的-12-1=-13补是0011因此,对于DC差值-12码是1100011.或者,我们可以判断要使用的二进制码来表示-12如下:首先发现通过减去值12从2^4 - 1 = 15,其为3。如果是大小代表3二进制代码,它是0011。注意,正DC将有一个“1”作为最显著位(MSB),而负DC将有一个“0”作为的MSB。

AC系数 如JPEG中,在量化后一个8times;8块中的大部分AC系数都有零值。锯齿扫描后,人们遇到的大量零值大运行系数。它是更有效的代码零行程比编码每个零值个别。据发现,有与一对相关联的一定概率。由零运行,并打破零运行非零系数。MPEG代码运行水平对而不只是零游程和非零系数的值分别。这里,运行是零游程的长度和水平的幅度非零系数,打破了零运行。往往是遇到了一组零值系数一个块的结束。由于不存在非零系数打破零游,这个零的游程编码为块的结束(EOB)。表10.6列出了在MPEG使用中各种游程/电平值的可变长度编码(VLC)。实际上有与来自不同的某些条目的两个表对比,但与大多数代码是相同的。应当指出的在AC系数,仅用于运行第二个代码/0/1水平的内相关。。这样做的原因是,在内相关,可以发生一个EOB和DC项之后在这种情况下,在第一次运行级代码将与冲突表,注意EOB码,并非所有可能的运行/水平值包括在

列表。表中未列出的运行/电平值由6位编码逃生码后跟运行长度一个6位二进制代码和一个12位的二进制码对于非零系数的水平。尽管这些运行/电平值,用更多的位对比在表中找到其他运行/电平值,他们是极不可能和所以不增加任何显著的方式整体比特率。在每个代码,“S” 指的符号位。它是“0”,在负正系数的值和“1”的系数值。

为了阐明我在AC系数进行熵编码的想法,考虑在表10.7所示的强度的图像的8times;8像素块。表10.8列出从每个像素中减去128后的像素块。在该块的二维DCT列于表10.9。使用量化后的DCT系数后表10.1 MPEG默认矩阵见表10.10。锯齿扫描后使用模式表10.4量化的DCT系数,我们可以得到以下

游程/电平对如下所示。

从锯齿形扫描的量化DCT系数得到的游程/电平相对应表10.10:DC,(0,-3),(0,-5),(0,-2),(0,-7),(0,4),(0,-8),(0,-1),(0,1),(0,1),(0,-1),(0,1),(0,3),(1,-2),(0,-1),(0,1),(1,1),(0,4),(1,-3),(0,2),(0,-3),(0,3),(1,-1),(1,1),(0,1),(0,1),(0,-1),(3,1),(0,2),(0,1),(1,-1),(2,-1),(0,2),(0,-1),(1,-1),(0,-1),(0,-1),(3,-1),(0,1)中,EOB。然后,从表10.6得到的AC系数的游程/电平对代码和是001011001001101010010000001010100001100hellip;hellip;10。请注意,符号位中一个“0”为正系数值以及一个“1”为负系数。

2.P帧和B帧编码

预测图像和双向预测图像采用的是非帧内DCT变换,众所周知,时间预测移除相邻的图片之间的时间相关性。预测图像通常具有零得平均值并且其大小振幅是按照拉普拉斯来分布的。因此,在一个像素块上应

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[146102],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。