- 可以通俗理解为:
- 音调:声音很细很尖,或者低沉。
- 音量:声音大小,俗称大嗓门。
- 音色:钢琴和小提琴音色不同。
- 上图:甲乙频率相同,可认为是两个女生说话。乙嗓门大(振幅大)。如果两个人一起说话,那就很容易听不见甲说话。
- 下图:甲乙嗓门一样大(振幅相同),甲是频率慢的(男生), 乙是频率大的(女生),这就能区分了。
- 左图的声音,听着 比右图舒服。但实际上,声音中几乎没有完美的正弦波。
- 次声波和超声波,人类听不到。Hz(赫兹) :1秒钟震动的次数。
- 可以看到一个有趣的现象,人喊的声音,根本不会打扰到蝙蝠的睡眠。可能是蝙蝠容易抓,然后蝙蝠被抓,然后就就很多。。。
- 模拟数据,然后按照某频率(1秒钟采集几次)进行采样,对采样的数据进行量化,量化后的数据根据峰值进行编码,编码之后就是数字信号了。
- 采样大小指图中的高度。16bit常用。0-65535, 没有负值。
- 20HZ--2wHZ,从模拟信号采样, 1S采样20次---2w 次。
看例子中的计算,1s要传输那么大的数据,所以传输音频不用PCM,要用AAC等将PCM压缩之后进行传输。
- 有损压缩,删掉冗余数据,且不能恢复。
- 无损压缩,删掉后,还可以恢复。
- 黑线以下听不到,因为分贝小(响度小),比如小小声音说话,就很有可能听不到。
- 蓝线以下听不到,因为在紫色范围中,突然后一个高声,就听不到这个频段的其他低声了,比如a在小声说话,b突然大声,c就听不到a说话,只能听到b说话了。
- 绿色可以听到,因为绿色在红色音频的影响范围之外,比如,男生女生同时发声,虽然女生分贝高,但依然可以听到男生说话。
- 在一个平缓的声音中,突然有一个大声,盖过了其他声音,这个大声音的前50ms 和 大声之后的 50ms 是影响范围。
- 心理声学模型,指的就是上面绿色图和上上面的柱状图。
- opus 最流行。1核口(实时性),1核耳(高保真)。不支持RTMP协议。
- AAC 常见,常用泛娱乐直播系统。要求音质高,实时性低一些。RTMP协议。
- speex 包括回音消除、降噪等。
- G.711,音视频会议,固话常用。
- 1. AAC 应用范围广,90%+
- 2. AAC 传输协议rtmp支持AAC speex,
- 3. AAC 本身编码质量高,高保真
- 三种格式码流依次是:128kb/s, 64kb/s, 32kb/s
- ADTS每一帧都多7-9个字节
整理自慕课网——移动端音视频入门