【文件属性】:
文件名称:系统解码器模型-计算流体力学及其并行算法
文件大小:3.87MB
文件格式:PDF
更新时间:2021-06-02 17:10:57
H264 毕厚杰 pdf
图 5.3系统解码器模型
5.2.2 音频
与MPEG-1、MPEG-2相比,MPEG-4不仅支持自然声音(如语音和音乐),还支持合成声音(如
MIDI)。MPEG-4音频部分将音频的合成编码和自然声音的编码相结合,并支持音频的对象特征。
5.2.2.1自然声音编码
MPEG-4研究比较了现有的各种音频编码算法,支持 2Kbps~64 Kbps的自然声音编码。如 8KHz
采样频率的 2Kbps~4 Kbps的语音编码,以及 8KHz或 16KHz采样频率 4Kbps~16 Kbps的语音编
码,一般采用参数编码;而 6Kbps~24 Kbps 的语音编码,一般采用码激励线性预测 CELP(Code
Excited Linear Predictive)编码技术;而从 16Kbps以上码率的编码,则采用视频变换编码技术。这
些技术实质上借鉴了 G.723、G.728以及MPEG-1和MPEG-2等。图 5.4给出了MPEG-4音频支持 2~
64Kbps信道语音编码范围。
图 5.4 MPEG-4音频支持语音编码范围
5.2.2.2合成声音编码
MPEG-4 引入两个有力的编码技术:文本到语音编码(TTS,Text-to-Speech)和乐谱驱动合成
编码。事实上,合成语音编码技术是一种基于知识库的参数编码。值得一提的是,乐谱驱动合成技
术中,解码器由一种特殊的 合成语言 SAQL(Structured Audio Orchestra Language,结构化音频管弦
乐团语言)驱动的。“管弦乐团”由不同“乐器”组成,解码器不具有某“乐器”时,MPEG-4还允许解码
器从编码器下载该“乐器”,以恢复合成声音。
5.2.3 视频
MPEG-4 支持对自然和合成视觉对象的编码。合成的视觉对象包括 2D、3D 动画和人面部表情
动画等。对于静止图像,MPEG-4采用零树小波算法(Zerotree Wavelet Algorithm),以提高压缩比,