【文件属性】:
文件名称:系统解码器模型-2020考研数学一真题及解析
文件大小:4.88MB
文件格式:PDF
更新时间:2021-06-20 09:09:25
视频 压缩 H264
图 5.3 系统解码器模型
5.2.2 音频
与 MPEG-1、MPEG-2 相比,MPEG-4 不仅支持自然声音(如语音和音乐),还支持合成声音(如
MIDI)。MPEG-4 音频部分将音频的合成编码和自然声音的编码相结合,并支持音频的对象特征。
5.2.2.1 自然声音编码
MPEG-4 研究比较了现有的各种音频编码算法,支持 2Kbps~64 Kbps 的自然声音编码。如 8KHz
采样频率的 2Kbps~4 Kbps 的语音编码,以及 8KHz 或 16KHz 采样频率 4Kbps~16 Kbps 的语音编
码,一般采用参数编码;而 6Kbps~24 Kbps 的语音编码,一般采用码激励线性预测 CELP(Code
Excited Linear Predictive)编码技术;而从 16Kbps 以上码率的编码,则采用视频变换编码技术。这
些技术实质上借鉴了 G.723、G.728 以及 MPEG-1 和 MPEG-2 等。图 5.4 给出了 MPEG-4 音频支持 2~
64Kbps 信道语音编码范围。
图 5.4 MPEG-4 音频支持语音编码范围
5.2.2.2 合成声音编码
MPEG-4 引入两个有力的编码技术:文本到语音编码(TTS,Text-to-Speech)和乐谱驱动合成
编码。事实上,合成语音编码技术是一种基于知识库的参数编码。值得一提的是,乐谱驱动合成技
术中,解码器由一种特殊的 合成语言 SAQL(Structured Audio Orchestra Language,结构化音频管弦
乐团语言)驱动的。“管弦乐团”由不同“乐器”组成,解码器不具有某“乐器”时,MPEG-4 还允许解码
器从编码器下载该“乐器”,以恢复合成声音。
5.2.3 视频
MPEG-4 支持对自然和合成视觉对象的编码。合成的视觉对象包括 2D、3D 动画和人面部表情
动画等。对于静止图像,MPEG-4 采用零树小波算法(Zerotree Wavelet Algorithm),以提高压缩比,