H.264 / AVC视频编码标准概述外文翻译资料

 2022-11-13 16:20:44

英语原文共 19 页,剩余内容已隐藏,支付完成后下载完整资料


H.264 / AVC视频编码标准概述

摘要-H.264 / AVC是ITU-T视频编码专家组(VCEG)和ISO / IEC运动图像专家组(MPEG)的最新视频编码标准。H.264 / AVC标准化努力的主要目标是增强压缩性能并提供寻址“会话”(视频电话)和“非会话”(存储,广播或流)的“网络友好”视频表示,应用程序。H.264 / AVC相对于现有标准已经在速率失真效率方面实现了显着的改进。 本文概述了H.264 / AVC的技术特性,描述了该标准的配置文件和应用程序,并概述了标准化过程的历史。

第一部分 介绍

H.264 / AVC是最新的国际视频编码标准[1]。到本出版物的时候,预期它已经被ITU-T批准为推荐H.264,并被ISO / IEC批准为国际标准14496-10(MPEG-4第10部分)高级视频编码(AVC)。在大约10年前开发的MPEG-2视频编码标准(也称为ITU-T H.262)[2]主要作为先前MPEG-1视频能力的扩展,并支持隔行视频编码,全球数字电视系统技术。它广泛用于通过卫星,电缆和地面发射传输标准清晰度(SD)和高清晰度(HD)电视信号,并将高质量SD视频信号存储到DVD上。

然而,越来越多的服务和越来越多的高清晰度电视正在产生对更高编码效率的更大需求。 此外,诸如有线调制解调器,xDSL或UMTS的其他传输介质提供比广播信道低得多的数据速率,并且增强的编码效率可以使得能够在现有的数字传输容量内传输更多的视频信道或更高质量的视频表示。

用于电信应用的视频编码通过开发ITU-T H.261,H.262(MPEG-2)和H.263视频编码标准(以及H.263的增强,称为H.263 和 H.263 ),并且已经从ISDN和T1 / E1服务多样化,包括PSTN,移动无线网络和LAN /互联网网络传送。在这种演进中,已经进行了持续的努力以最大化编码效率,同时处理网络类型的多样化及其特性格式化和丢失/错误鲁棒性要求。

最近,MPEG-4视频(MPEG-4第2部分)标准[5]也开始出现在先前编码标准的一些应用领域中。它提供了视频形状编码能力,并且同样致力于扩大数字视频使用的环境范围。

在1998年初,视频编码专家组(VCEG -ITU-T SG16 Q.6)发出了关于称为H.26L的项目的建议书,目标是使编码效率加倍(这意味着将一个给定的保真度)与用于广泛多种应用的任何其他现有视频编码标准相比。该新标准的第一草案设计在1999年10月被采用。在2001年12月,VCEG和运动图像专家组(MPEG - ISO / IEC JTC 1 / SC 29 / WG 11)组成了一个联合视频组(JVT),该章程最终确定了用于在2003年3月作为H.264 / AVC [1]提交正式批准的新视频编码标准草案。

标准化的范围如图1所示。 图1示出了典型的视频编码/解码链(不包括视频信号的传输或存储)。如所有ITU-T和ISO / IEC视频编码标准的情况一样,通过对比特流和语法施加限制并且限定语法元素的解码处理,仅中央解码器被标准化,使得每个解码器符合 标准将在给出符合标准的约束的编码比特流时产生类似的输出。标准范围的这种限制允许以适合于特定应用(平衡压缩质量,实施成本,上市时间等)的方式优化实施的最大自由度。然而,它不提供端对端再现质量的保证,因为它甚至允许粗编码技术被认为是符合。

图1:视频编码标准化的范围。

本文组织如下。第二部分提供了H.264 / AVC应用的高级概述,并突出了设计的一些关键技术特性,可以改进这种广泛应用的操作。第三部分解释了H.264 / AVC编码视频数据的网络抽象层和整体结构。在第四节中描述了视频编码层。第五节解释了H.264 / AVC支持的配置文件和该标准的一些潜在应用领域。

第二部分 应用和设计特色

新标准设计用于包括至少以下应用领域的技术解决方案。

  • 通过有线,卫星,有线调制解调器,DSL,地面等广播。
  • 光学和磁性设备,DVD等上的交互式或串行存储。
  • 通过ISDN,以太网,LAN,DSL,无线和移动网络,调制解调器等或其组合的对话服务。
  • 通过ISDN,电缆调制解调器,DSL,LAN,无线网络等的视频点播或多媒体流服务。
  • 通过ISDN,DSL,以太网,LAN,无线和移动网络等的多媒体消息服务(MMS)。

此外,可以在现有和未来网络上部署新的应用。这提出了关于如何处理这种各种应用和网络的问题。

为了满足对灵活性和可定制性的这种需要,H.264 / AVC设计涵盖被设计为有效地表示视频内容的视频编码层(VCL)和网络抽象层(NAL),网络抽象层(NAL)格式化视频,并且以适于由各种传输层或存储介质传输的方式提供头部信息(参见图2)。

图2:H.264 / AVC视频编码器的结构

相对于先前的视频编码方法,如MPEG-2视频所示例的,能够增强编码效率的设计的一些突出的特征包括以下对预测要编码的图像的内容的值的能力的增强:

  1. 具有小块大小的可变块大小运动补偿:与任何先前标准相比,该标准支持在选择运动补偿块大小和形状方面的更大灵活性,其中最小亮度运动补偿块小至4times;4。
  2. 四分之一采样精度运动补偿:大多数现有标准至多能够实现半采样运动矢量精度。 新的设计通过增加四分之一采样运动矢量精度,首先在MPEG-4 Visual(第2部分)标准的高级配置文件中找到,但是与现有设计相比,进一步降低了内插处理的复杂性。
  3. 图像边界上的运动矢量:虽然MPEG-2及其前身中的运动矢量仅需要指向先前解码的参考图像内的区域,但是首先作为H.263中的可选特征找到的图像边界外推技术包括在H .264 / AVC。
  4. 多参考图像运动补偿:MPEG-2中的预测编码图像(称为“P”图像)及其前代仅使用一个先前图像来预测输入图像中的值。 新设计扩展了在H.263 中找到的增强参考图像选择技术,以通过允许编码器在已经解码并存储在解码器中的大量图像中选择用于运动补偿目的的高效编码。 参考能力的相同扩展也应用于运动补偿双预测,其在MPEG-2中被限制为仅使用两个特定图片(其中一个是显示次序中的先前帧内(I)或P图片,而另一个是显示顺序中的下一个I或P图片)。
  5. 参考顺序与显示顺序的去耦:在先前的标准中,在用于运动补偿参考的图像的排序和用于显示目的的图像的排序之间存在严格的依赖关系。在H.264 / AVC中,这些限制被很大程度地去除,允许编码器选择用于参考和显示目的的图片的排序,具有高度的灵活性,仅受限于总的存储器容量限制以确保解码能力。去除限制还使得能够去除先前与双预测编码相关联的额外延迟。
  6. 图像表示方法与图像参考能力的去耦合:在现有标准中,使用某些编码方法编码的图像(即双预测编码图像)不能用作用于预测视频序列中的其它图像的参考。通过去除此限制,新标准为编码器提供了更多的灵活性,并且在许多情况下,使用图片进行参考的能力更接近于被编码的图片。
  7. 加权预测:H.264 / AVC中的一个新创新允许运动补偿预测信号被加权并由编码器指定的量偏移。 这可以显着提高包含衰落的场景的编码效率,并且可以灵活地用于其他目的。
  8. 改进的“跳过”和“直接”运动推断:在现有标准中,预测编码图片的“跳过”区域在场景内容中不能运动。 这在编码包含全局运动的视频时具有不利的影响,因此新的H.264 / AVC设计推断“跳过”区域中的运动。 对于双预测编码区域(称为B切片),H.264 / AVC还包括称为“直接”运动补偿的增强运动推理方法,其进一步改进在H.263 和MPEG-4 Visual中找到的在先“直接”预测设计。
  9. 用于帧内编码的定向空间预测:将编码为当前图像的先前解码的部分的边缘的新技术应用于被编码为帧内(即,不参考某一其它图像的内容而编码)的图像的区域中。 这提高了预测信号的质量,并且还允许从没有使用帧内编码来编码的邻近区域进行预测(当使用在H.263 和MPEG-4 Visual中找到的变换域预测方法时,不能使能)。
  10. 环内去块滤波:基于块的视频编码产生称为块伪影的伪像。这些可以源于解码过程的预测和残差编码级。 自适应去块滤波器的应用是改进所得到的视频质量的众所周知的方法,并且当被良好设计时,这可以提高客观和主观视频质量。进一步基于来自H.263 的可选特征的概念,H.264 / AVC设计中的去块滤波器被带入运动补偿预测回路中,使得质量的改进可以用于帧间预测以提高预测其他图片的能力。

除了改进的预测方法,还增强了设计的其他部分以提高编码效率,包括:

  1. 小块尺寸变换:所有主要的先前视频编码标准使用8times;8的变换块大小,而新的H.264 / AVC设计主要基于4times;4变换。这允许编码器以更局部适应的方式表示信号,这减少了俗称为“振铃”的伪影。(较小的块大小也部分地由于使用上述技术更好地预测视频内容的能力的提高,以及需要提供具有对应于最小预测区域的边界的变换区域的需要)。
  2. 分层块变换:尽管在大多数情况下,使用小的4times;4变换块大小在感知上是有益的,但是存在包含足够的相关性的一些信号,以调用使用具有较长基本函数的表示的某种方法。 H.264 / AVC标准以两种方式实现这一点:1)通过使用分层变换来将低频色度信息的有效块大小扩展到8times;8阵列,以及2)通过允许编码器选择特殊编码类型 帧内译码,使得以与应用于色度的方式非常相似的方式将用于低频信息的亮度变换的长度扩展到16times;16块大小。
  3. 短字长变换:所有先前的标准设计都有效地要求编码器和解码器使用更复杂的处理来进行变换计算。虽然以前的设计通常需要32位处理,但是H.264 / AVC设计仅需要16位算术。
  4. 精确匹配反变换:在先前的视频编码标准中,用于表示视频的变换一般仅在误差容限内指定,因为获得与理想指定逆变换的精确匹配的不切实际性。 结果,每个解码器设计将产生稍微不同的解码视频,导致视频的编码器和解码器表示之间的“漂移”,并降低有效视频质量。 基于在H.263 努力中作为可选特征布置的路径,H.264 / AVC是实现来自所有解码器的解码视频内容的精确相等的第一标准。
  5. 算术熵编码:H.264 / AVC中包括被称为算术编码的高级的循环编码方法。
  6. 虽然先前发现算术编码作为H.263的可选特征,但是在H.264 / AVC中发现了该技术的更有效的使用,以创建被称为CABAC(上下文自适应二进制算术编码)的非常强大的熵编码方法。
  7. 上下文自适应熵编码:在H.264 / AVC中应用的称为CAVLC(上下文自适应可变长度编码)和CABAC的两种熵编码方法都使用基于上下文的自适应性来改善相对于现有标准设计的性能。

对于通过各种网络环境操作的数据错误/损失和灵活性的鲁棒性通过H.264 / AVC标准新的设计方面来实现,包括以下突出的特征。

  1. 参数集结构:参数集设计提供鲁棒和高效的输送头信息。 由于丢失几个关键比特的信息(例如序列头部或图像头部信息)在使用现有标准时可能对解码过程具有严重的负面影响,所以将该密钥信息以更灵活和专门的方式分离以用于处理 H.264 / AVC设计。
  2. NAL单元语法结构:H.264 / AVC中的每个语法结构被放置到称为NAL单元的逻辑数据分组中。不是像在现有视频编码标准中那样强制特定比特流接口到系统,NAL单元语法结构允许以适合于每个特定网络的方式来更多地定制承载视频内容的方法。
  3. 灵活的片大小:与MPEG-2(通过增加头部数据的数量和降低预测的有效性来降低编码效率)中的刚性片结构不同,H.264 / AVC中的片大小是高度灵活的,早于MPEG-1。
  4. 灵活宏块排序(FMO):已经开发了将图像划分为称为切片组的区域的新能力,其中每个切片变成切片组的可独立解码的子集。当有效使用时,通过管理在每个片中编码的区域之间的空间关系,灵活的宏块排序可以显着增强对数据丢失的鲁棒性(FMO也可以用于各种其他目的)。
  5. 任意切片排序(ASO):由于编码图像的每个切片可以独立于图片的其他切片被(近似)解码,H.264 / AVC设计使得能够以相对于图片的任何顺序发送和接收图片的切片 彼此。 首先在H.263 的可选部分中找到的这种能力可以改善实时应用中的端到端延迟,特别是当在具有无序传送行为的网络(例如,因特网协议网络)上使用时。
  6. 冗余图片:为了增强对数据丢失的鲁棒性,H.264 / AVC设计包含允许编码器发送图片区域的冗余表示的新能力,使得能够(通常有些降级)的图片区域的表示在数据传输期间主要表示已丢失。
  7. 数据分区:由于用于表示每个区域(例如,运动矢量和其他预测信息)的一些编码信息比表示视频内容的其他信息更重要或更有价值,因此H.264 / AVC允许每个片段的语法 根据语法元素的分类,被分成多达三个不同的分区用于传输。设计的这一部分进一步建立在MPEG-4 Visual和H.263 的可选部分中所采用的路径上。 这里,通过具有由语法元素的指定分类控制的相同语法的分割的单个语法来简化设计。
  8. SP / SI同步/切换图像:H.264 / AVC设计包括由图像类型组成的新特征,其允许一些解码器的解码过程与由其它解码器产生的正在进行的视频流的精确同步,而不损失所有具有损失的解码器 由发送I图像产生的效率。 这可以使得能够在使用不同数据速率的视频内容的表示之间切换解码器,从数据丢失或错误中恢复,以及启用诸如快进,快退等的特技模式。

在以下两个部分中,给出了关键特征的更详细的描述。

第三部分 网络采集层

lt;

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[137318],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。