OPUS/SILK/SPEEX 音频编码比较

时间:2021-07-18 17:56:15

音频编码调研

Opus

http://www.opus-codec.org/

Opus是一种混合式(hybrid)的编码器,有Skype的SILK和Xiph.org的CELT融合而成,于2012年9月,由Internet Engineering Task Force (IETF)标准化RFC 6716

Skype官方博客”Skype and a New Audio Codec”(2012年9月)提到“The innovation in Opus fuses SILK for voice with Xiph.Org’s CELT codec for music.”,并且提到Skype在Opus的标准化过程中做了很多的工作。

1、特点

主要

  • Bit-rates from 6 kb/s to 510 kb/s
  • Sampling rates from 8 kHz (narrowband) to 48 kHz (fullband)
  • Frame sizes from 2.5 ms to 60 ms
  • Support for both constant bit-rate (CBR) and variable bit-rate (VBR)
  • Dynamically adjustable bitrate, audio bandwidth, and frame size

次要

  • Audio bandwidth from narrowband to fullband
  • Support for speech and music
  • Support for mono and stereo
  • Good loss robustness and packet loss concealment (PLC)

2、性能

(1)编码器质量总结

OPUS/SILK/SPEEX 音频编码比较

(2)听力测试

Google测试1

测试形式:训练和未训练的17名测试者,主观打分;MUSHRA-type tests(MUltiple Stimuli with Hidden Reference and Anchor)

测试结果:http://www.opus-codec.org/comparison/GoogleTest1.pdf

测试结论总结:

  • 窄带单声道语音:Opus(11kbps)比iLBC(15kbps)和Speex(11kbps)好
  • 宽带单声道语音:Opus(20kbps)好于G.722.1(24kbps)、Speex WB(24kbps)
  • 全带单声道语音:Opus(32kbps)好于G.719(32kbps)
Google测试2

测试形式:

测试结果:http://www.opus-codec.org/comparison/GoogleTest2.pdf

测试结论总结:

  • 窄带单声道语音(普通话):Opus(11kbps)可以和iLBC(15kbps)相比,比Speex(11kbps)好
  • 宽带单声道语音(普通话):Opus(20kbps)好于G.722.1(24kbps)、Speex WB(24kbps)
  • 全带单声道语音(普通话):Opus(32kbps)好于G.719(32kbps)

(3)手动测试

Opus官网提供了可以在Windows下直接运行的编解码器,使用chn_man_woman.wav音频进行了测试,

测试音频:

chn_man_woman.wav,时长82s,44100Hz,32bit float,双声道

测试方法:

使用Opus提供的编码器将wav文件编码成.opus文件,在使用解码器将.opus解码成wav文件(44100Hz,16bit PCM,双声道)

测试结果如下:

编码比特率 编码时间 编码文件大小 质量(主观) 质量(客观)
32Kbps 5s 323KB 几乎与原音频无差别 尚无
20Kbps 4s 207KB 几乎与原音频无差别 尚无
15Kbps 4s 152KB 音色稍有区别,声音清晰,无杂音 尚无
10Kbps 3s 105KB 声音明显模糊,声音分辨 尚无
6Kbps 2s 76KB 声音更加模糊,有轻微噪声,不影响分辨 尚无

3、其他

Skype是否已经使用Opus?

Karlheinz Wurm, the audio and video product engineering director at Skype, said in a blog post (2012年9月)

Opus will make a quiet but crystal clear entry into the world 
- most people will take for granted the high sound fidelity
when it arrives in the Skype client, through browsers and
gateways, and we hope on mobile phones, game consoles and
conference rooms, too,

SILK

https://developer.skype.com/silk

  • 该网址无法访问,考虑到Skype在中国的情况,不知是否需要*。
  • 补充,*访问该网址,会跳转到微软的网址,其中没有SILK的相关内容

根据Wikipedia SILK,SILK的最新版本是2012年发布的SDK 1.0.9,该版本可以独立于Skype下载使用,但不可用于商业应用。

1、特点

OPUS/SILK/SPEEX 音频编码比较

2、性能

OPUS/SILK/SPEEX 音频编码比较

  • SILK的资料不多,上述均来源自SILKDataSheet.pdf

Speex

http://www.speex.org/

—The Speex codec has been obsoleted by Opus. It will continue to be available, but since Opus is better than Speex in all aspects, users are encouraged to switch—

1、特点

主要

  • 比特率2kbps到44kpbs
  • 窄带(8kHz)、宽带(16kHz)和超宽带(32kHz)三种采样率
  • 可变比特率编码

次要

  • Intensity stereo encoding
  • Packet loss concealment
  • Voice Activity Detection (VAD)
  • Discontinuous Transmission (DTX)
  • Fixed-point port
  • Acoustic echo canceller
  • Noise suppression

2、最新版本

Speex 1.2rc1,发布于2008年7月

3、性能

PESQ性能比较

OPUS/SILK/SPEEX 音频编码比较

Codec Rate (kHz) bitrate (kbps) delay frame+lookahead (ms) multi-rate embedded VBR PLC bit-robust license
Speex 8 16 32 2.15-24.6 (NB) 4-44.2 (WB) 20+10 (NB) 20+14 (WB) yes yes yes yes open-source/free software
iLBC 8 15.2 or 13.3 20+5 or 30+10 yes no charge but not open-source
AMR-NB 8 4.75-12.2 20+5? yes yes yes proprietary
AMR-WB(G.722.2) 16 6.6-23.85 20+5? yes yes yes proprietary
G.722.1 (Siren7) 16 (16) 24 32 20+20 yes yes yes no charge but not open-source
G.729 8 8 10+5 yes yes proprietary
GSM-FR 8 13 20+? ? ? patented?
GSM-EFR 8 12.2 20+? yes yes proprietary
G.723.1 8 5.3 6.3 37.5 yes ? proprietary
G.728 8 16 0.625 proprietary
G.722 16 48 56 64 ? yes ? ?