Chapter 5. MPEG-4 Visual

时间:2022-02-04 22:13:47

本章着重介绍有关MPEG-4 Visual标准的细节。

Tool

编码工具集合的子集(比如支持交织等)。

Object

视频元素(比如一个矩形视频帧,或者一个任意形状的区域,静止的图像)。

Profile

视频对象类型的集合。

Level

每个Profile都会有多个Level,不同的Level对机器性能的要求各不相同,因此适用于不同的应用和环境。

VO(Video Object)

视频的一帧是一个VOP(Video Object Plane),多个VOP组成一个VO。VOP可以是矩形的也可以是任意形状的。

The Simple Profile

Simple Profile中的特性。

I-VOP

即通常所说的I帧,该帧的编码不依赖于其他帧,即Intra mode。

P-VOP

即通常所说的P帧,该帧的编码依赖于之前编码了的I帧或P帧。P帧中的宏块可以用帧内编码(出现一块新的找不到很好匹配的区域),或者帧间编码(利用运动补偿,估计)。

编码效率工具

这里介绍了一些提升编码效率的工具

Four motion vector per macroblock

缩小宏块大小,增加运动向量个数,达到更精确的匹配

Unrestricted Motion Vector

在帧边缘位置的宏块,如果物体从边缘位置进入屏幕范围,极有可能搜索不到比较好的匹配,但是如果将边缘位置按照像素值“外推(extrapolate)”,那么匹配准确度会明显提升。

Intra Prediction

因为相邻宏块的内容变化可能并不显著(马尔科夫特性),因此宏块的DC和AC系数可以根据相邻宏块进行预测。

传输效率工具

这里介绍了一些提升传输效率的工具

Video Packet

Packet又称之为Slice,在Packet的头部可以增加一个Sync标签,辅助解码器同步,防止错误的传递。

Data Partitioning

将数据分成两部分传递,第一部分保存每个宏块的编码模式和每个帧内编码宏块的DC系数或者帧间编码宏块的运动向量。而帧间编码宏块的AC系数和DC系数存储在第二部分,这样即使第二部分数据出现了错误,依靠第一部分的数据依然可以恢复出来。

Reversible VLCs

即Reversible Variable Length Codes,使得解码器可以正反两个方向解码,以此减小错误所影响的范围。

The Advanced Simple Profile

Advanced Simple Profile中的特性。

B-VOP

即B帧,双向预测帧。

Quarter-Pixel Motion Vectors

四分之一像素为单位的运动向量,提升精度。

Alternate quantiser

边长的量化步长,低频区域步长小,高频区域步长大,这样能够更高效地压缩。

Global Motion Compensation

支持全局的运动向量共享。

Interlace

对交织的支持。

  • Frame DCT Mode
  • Field DCT Mode

The Advanced Real Time Simple Profile

Advanced Real Time Simple Profile中的特性。

NEWPRED

new prediction,即支持选择更早的VOP进行预测,当出现错误时,利用之前较早的未出现错误的VOP预测,可以防止错误的传递。

Dynamic Resolution Conversion

当画面中出现较复杂的场景变化时,往往会意味着码率的瞬时提高,此时可以通过降低分辨率的方式来减小码率。