3D音频再现理论研究(一)---3D音频技术历史介绍(转)

时间:2024-02-19 18:15:23
1992年,创新推出第一款双声道音效卡——Sound Blaster 16,这是一款拥有16bit采样和44.1kHz的采样速率的声卡。该款产品号称拥有CD一样的高质回放表现,声卡的音质从此获得了从量变到质变的飞跃发展,声卡也从此走进了无穷无尽的技术变革道路中。在双声道声卡推出后,PC用户在很长的一段时间都乐于现状,不过傲锐(Aureal Semiconductor)公司在1996年公布出A3D技术后,马上震惊了平静的PC音频市场。A3D是一种音频API(应用程序接口)和PC音频引擎,是一种基于HRTF(Head Related Transfer Functions)声音交互工程学模型演变而成的三维音频技术和引擎。

最早推出的A3D 1.0 规范是一套互动的虚拟3D定位音效技术,它可在一套双道声道立体音频系统中营造出假三维效果。虽然A3D 1.0的算法在现时看来是很简单,而且还是一种伪3D技术,不过在当时来说,它开创了PC的三维音频新时代,在PC音频史上具有划时代意义。

在A3D 1.0推出后,傲锐公司凭此名声大噪,并在1998年推出了支持A3D 2.0音效的Aureal AU8830音频处理器,而帝盟(Diamond)公司在就该年底推出了基于这款芯片的经典MX300声卡,一款真正支持独立四声道输出的产品。就在此时,有许多游戏公司表示用A3D开发三维游戏的音频部分,其中最著名的就要数Quake3(雷神之锤3)、Half-Life(半条命)、Unreal(虚幻)等等游戏。但可惜的是,在这张MX300声卡推出不到一年之后,帝盟与傲锐决裂终止合作,这个导致日后两公司被收购埋下伏线。

在1999年傲锐公司发生重大变故,先是公司财政出现问题,紧接在该年三月时有大量的技术人员集体辞职,这使用原来前途光明的A3D技术蒙上一层阴影,当时基于SQ3500芯片的Vortex音效卡发展计划被逼停止,A3D 3.0技术也成为了傲锐公司的绝唱。

A3D 3.0 技术介绍:



SQ3500原本设计的目的是要加强最新版A3D 3.0的功能,这个版本的API正好在公司开始走下坡之前发表问世。A3D 3.0强化了所有A3D 2.0的功能,如音源定位、声波轨迹(WaveTracing)、回声处理、封闭空间音效等等,此外它还加入了几项新的功能,像支持杜比数码音频(Dolby Digital,即AC-3)解码,回声几何运算功能(geometry engine),以及大型音源效果(Volumetric Sources)处理等。

A3D 3.0规范充许利用内建的解码器来解读杜比数码音频格式,可以利用杜比技术来录制游戏内的背景音效跟音轨。如此一来,游戏内噪音源的定位与Dolby Digital的背景音效就可以同时共存,让A3D的使用者不需要透过特别的驱动设备来进行解码,而游戏设计师也不用担心杜比数码音效能否被完整地重现出来。

但很可惜,A3D技术最终未能逃过被终结的命远。在2000年8月,傲锐被创新科技公司吞并,A3D技术从此退出音频舞台载入史册。A3D技术无论是在当时,还是在今天都一种技术非常优秀的3D音频API,被非技术性击到无疑让人十分心痛。

A3D 3.0 控制管理的音频特性:



Geometric Reverb(几何回声)
几何回声功能可以计算出一间房间的正确几何形状,适当地调整回声变化。

Acoustic Wavetracing(声波追踪技术)
声波追踪技术是A3D 3.0的新功能,将反射与封闭空间的音效处理一并整合到声波轨迹的音场效果器。

Geometry engine(回声几何运算)
回声几何运算能进一步强化了A3D 2.0的wavetracing声波轨迹处理,这项功能可以追踪一道声音在几何空间中传送的途径,藉此创造出更为真实的回音效果。

volumetric sources(大型音源)
大型音源效果让设计师可以创造出大型的发声源,你可以这么想:一个人在跑步、或是一把小型武器开火的声音都算是非常小的声源;但如果是一群正在欢呼的人,一台巨大的发电机,或是一条往来频繁的高速道路,他们所发出的声音都是属与大范围的区域。直到最近为止,以前多数的音效定位技术都只能追踪一个单一定点的音源,而A3D的大型音源技术则允许游戏设计师定义出一块大型的发声区域。

[后者居上,创新EAX称霸世界]

1998年8月,创新发布了当时最为强大的Emu10k1音频处理器,基于这款芯片的Sound Blaster Live!系列产品一时风头无二,中高端音频市场也从此被创新公司一家独大,也使音频厂商们难以插足该领域。

在EMU10K1音频芯片强大处理能力的基础下,创新公司推出了自家首个三维音效技术——EAX(Environmental Audio Extensions:环境音效扩展)。EAX环境音效技术是当时唯一一个可与A3D相抗衡的三维音频技术,但由于后来傲锐被创新收购,A3D技术最终被创新公司雪藏。

EAX环境音效技术不但能把声音变换各种各样的特效声,而且还能把来自CD、VCD、MIDI、WAV或MP3等立体声音源虚拟为多声道环绕音效。另外它的全方位音频定位技术也是一绝。现在,EAX技术已经占据了绝大部份游戏的三维音频系统了。

就技术上而言,EAX并不算是一套独立的API,而是微软DirectSound API的加强功能。它加入了三度空间的回声效果,能够反应出声音在游戏空间里不同环境下的反射表现。举例而言,一声在户外的枪响,跟在空仓库里面或是铁皮屋里所听到的声音便会有所不同,而EAX技术就是为了虚拟这些不同的环境音效而开发的音频引擎。

EAX的音效在众多API中拥有最佳的音效表现,但其在游戏的音效定位中,始终不及A3D技术来得逼真自然,也正因为这样才使到A3D技术拥有宽广的生存空间,即使是在A3D被收购的现时,仍有大批的痴迷拥护者使用已经没有太多软件支持的A3D技术和产品。

EAX ADVANCED HD

随着创新公司不段革新,现已经把EAX开成一套很完善3D音频解决方案。EAX由原始的1.0版本变革到2.0、3.0版本。到2001年时候,创新在推出Audigy的同时,发布了新四代的3D音频技术——EAX ADVANCED HD。在EAX前三代时,都只是着重于普通音乐音频和游戏音频中,但到了第四代的EAX ADVANCED HD,创新开始把各种的家庭影院音效技术容入了EAX环境音频技术中。

发展到第四代的EAX ADVANCED HD已经不能说它是一个API了,它已经变成一套完整的音效解决方案。这套解决方案主要由两大部分组成,一是应用于纯音乐和与影剧院模式相配的EAX Music;二是专门应用于三维游戏音效引擎中的EAX Gaming。

其中EAX Music比较着重于强化音效播放,例如能强化PC音乐中的低音效果、可自定义喜好的音频等化、可移除一般转录MP3时所产生的噪音、自动设定不同曲目间的合宜音量、加入像是剧院厅的音场至音乐中等等。而EAX Gaming则着重于在游戏中的音频定位及各种声音特效。下面我们一起来看看两者用于音乐和游戏中的三维音频技术。

EAX Music



DREAM 梦幻音场(Dynamic Repositioning of Enhanced Audio & Music)
DREAM(增强音频与音乐的动态重定位)可为任何立体声音乐营造一种DISCO舞厅氛围的3D环绕声效果。DREAM技术可将任何立体声音乐透过选择的音效频率并重新指定各符合音效频率的声音于多组声道中.如POP感受的3D立体音场环境, 使用者可以分别设定高中低三个频率带之音讯依节奏顺时针或逆时针方向旋转。

CMSS 多音箱环绕(Creative Multi-Speaker Surround)
创新多音箱环绕(CMSS)是一项EAX Music技术,它可以对模拟立体声音源进行混合,比如将普通CD、VHS录像带的声音混音为多声道环绕,经由4.1或5.1音箱播放出来就能使人体验到多声道环绕效果。后来创新把它扩展为CMSS 3D技术, CMSS 3D可以让您将任何立体声音乐转换成令人惊奇的6.1环绕声音。CMSS 3D不但可以产生环绕音效,还可以智能地将主要的人声放置在*音箱。而且CMSS 3D能够将立体声的电影转换成5.1或6.1环绕声音! Sound Blaster Audigy 2中CMSS 3D的算法也能够通过耳机或立体声音箱创造出真实的三维空间感。



Dolby Digital (Dolby Surround AC-3)
创新在2000年9月发布Sound Blaster Live!5.1系列声卡,它是创新首款硬件支持Dolby Digital的产品。Dolby Digital(杜比数码)是杜比实验室所发明的家庭影院多声道数字音频系统。AC-3是Audio Coding 3的简称,直译为第三代音频编码,它是一套音频压缩技术。Dolby Digital是开发的初期是针对电影多声道环绕系统所研发的新技术,为了大幅降低编码后的文件大小,Dolby Digital应用了有损压缩技术。所谓有损压缩,就是一旦压缩之后,就无法完全还原成原本的面貌,但是如果损失的是一些无关紧要的信号,则能达成大幅缩减文件大小的目的。Dolby Digital一共有5.1个声道:分别是前左、前右、*、后左环绕、后右环绕等五个声道,全都是全频段声道,再加上一个3Hz-120Hz的超低频声道,所以统称为5.1声道。

Dolby Digital EX(杜比数码EX)
杜比实验室开发的一种音频格式,提供了6.1声道、清晰的环绕声。是在原来的Dolby Digital 5.1的基础上增加了一个后置*的声道。在您前方的左、中、右声道为对白提供了精确定位。后部的独立左右环绕声道则负责电影中的背景声,而后置*声道实现了后置左右声道间的自然过渡。额外的后置*声道实现了更佳的后置左右声道间的穿梭效果,以及飞越头顶等音频感受。



DTS (Digital Theater System)
DTS是美国的Digital Theater System公司所发展出来的一种电影全数字多声道系统,它也是5.1声道。DTS和AC-3一样,为了要将5.1声道的信息量存入电影胶片的有限空间内,也做了有损压缩及编码,可是两个系统在压缩编码的方法与原理上有所不同。理论上DTS比AC-3拥有更多音频细节。大致上说,AC-3的信息压缩率平均高达12:1,信息传输率每秒只有384kbps至448kbps,而DTS平均信息压缩率只有3:1,传输率则为每秒1.14kbps至1.500kbps,大约是AC-3的三至四倍,但就以上指标而言,DTS的保真度要优于AC-3。



THX
2002年9月,创新公司发布Sound Blaster Audigy 2系列产品。它拥有支持Dolby Digital EX 6.1声道、DVD-Audio、THX认证、24bit/96KHz等新特征。值得注意,Audigy 2是少有获得THX标准认证的声卡产品之一。这一标准最初是由乔治卢卡斯本人制定的,用于保证最早的《星球大战》影片中的音乐在影院中播放时,能够达到在录音棚中制作时所预想的效果。后来这一标准被应用于家庭影院系统,而直到近年,THX标准才被应用于评价PC多媒体系统,在播放DVD影片或玩3D游戏时的多声道环绕声效。所有申请THX认证的产品必须符合严格的性能要求和质量标准,才能获得THX认证标志。这些性能标准覆盖产品的所有特征,包括功率处理、频率响应、传播特性等。因此,THX标志是影音界权威认证的保证。通过THX认证并获得THX标志的产品,将会带给您前所未有的品质和可靠性。目前已有许多厂商生产符合THX标准的影音器材。一套完全由THX规格器材组成的AV系统应该能够达成以下的效果:一、全频段的高音及低音。二、声音更为平顺自然。三、在听觉范围内最少的低音失真。四、更清晰的人声定位。大家要注意的是:THX是一个标准而不是一件器材,THX的确为应用专利技术的影院生产了一批特殊产品,但是他们的主要职能是确保自己检测和认证的产品具有最高的质量和性能标准。

EAX Gameing



Environment Filtering(环境过滤)
环境过滤可准确模拟在开放和封闭空间的声音传播。

Multi-Environment(多环境)
多环境技术可同时提供多达4种实时环境音效。在现实生活场景中,您所听到的声音不仅受到周围环境的影响,而且受到“实时”环境的影响。例如,您在一个大厅里,当厅里的大钟敲响时您可以感到回声带来的空间感;但同时,大厅尽头走廊中传来的笑声听起来应具有较窄的回声音质。



Environment Panning(环境移位)
环境移位使环境音效的三维空间音效和定位成为可能。 在虚拟世界中,有很多时候需要模拟不断接近或距离较远的音效环境,比如火车在行驶时不断接近隧道,环境移位功能是通过三维空间定位来实现此效果的。



Environment Reflections(环境反射)
环境反射技术提供声音反射以及回响的定位。反射是一种在真实世界中声音从物体表面反射回到听者耳中的现象,而环境反射不仅可以模拟出这种效果而且还能给声音反射加上三维空间定位。



Environment Morphing(环境过渡)
在虚拟世界中,虚拟的“边界”使不同空间和地区分离。跨越"边界"会在音频中引起突然的变化,例如,从一个小房间进入一个大洞穴。环境过渡能被用来慢速地把听众从一个环境过渡到另一个环境,就象现实生活中发生的情况那样。

[DirectSound3D、Sensaura、Q3D]

DirectSound3D

讲到PC的三维音频技术,我们不能不提一提DirectSound,它原来是微软开发DirectX API的一个小小组件,只是由于微软公司一直以来都十分在意图形API的开发,所以在音频上缺乏重视。不过在创新公司成功扩展DirectSound推出EAX音效技术后,微软也意识到三维音频对于游戏的重要性,因此在近年来加大了DirectSound3D的开发力度。

作为DirectX API的音频组件之一,DirectSound3D可以提供快速的混音、硬件加速功能,并且可以直接访问相关设备,不过DirectSound3D的三维音频算法一般都是靠CPU处理的,所以资源占用比较高,但这使用到它拥有很好的兼容性。此外DirectSound3D拥有A3D/EAX没有的优点,它因为是完全公开的工业标准,所以开发起来十分简单,而最重要是它的通用性十分强。傲锐和创新公司为了维护自身的利益,仅对外开放了A3D 1.0、EAX 1.0、EAX 2.0三个版本的3D音频技术,而更高级的A3D/EAX技术只能在其自家音效芯片上支持,其他的厂商都即使是花钱也未能共用新版的A3D/EAX技术。

Sensaura



来自英国的Sensaura创造研发出多种3D音效定位的演算法,并且授权给音频芯片开发公司与音响硬件公司。使用Sensaura技术的产品一般都能兼容于A3D与EAX,而且一般都包含了数项DirectSound3D的加强功能。 当然Sensaura自己拥有特有的技术,如MacroFX,它是一项可以模拟非常贴近使用者头部的真实音源技术;ZoomFX,允许设计师创造定位出大型的发声来源;EnvironmentFX效果,类似而且共通于EAX的效果,它能够处理不同环境下的3D音场,像是水面底下的环境,大型的房间,金属的墙壁等等。Sensaura后来被创新收购后,并未像A3D一样从此消失于世上,其技术仍然得到广泛的应用,现在它主要被采用于电视游戏机及一些专业应用软件和硬件设备上。

Qsound Q3D



与Sensaura一样,Qsound的Q3D也是相当古老的3D音效API,自从1991年进入市场以来,经过了几次大的变革,进步成为一种十分成熟的3D音效。不过Qsound的三维音频技术在PC平台上并没有取得成功。幸好Qsound的3D音频技术不仅仅用在娱乐声卡领域,所以它并没有像A3D、Sensaura哪样在PC平台上经营失败后被收购。其实,它在游戏机方面的应用比PC更为广泛,在许多大型游戏机中你都可以看到Qsound的身影。

 

转自:http://hi.baidu.com/24dianao/blog/item/458a412438803932c8955906.html