阿里巴巴跨物理界招人,世界级音频专家冯津伟入职人工智能团队Idst

时间:2022-06-01 13:01:19

11月30日阿里巴巴正式宣布,前Polycom(宝利通)声学设计和信号处理首席工程师(Principal Engineer)冯津伟入职人工智能核心团队iDST,担任智能语音交互团队研究员,将负责语音交互设备端的声学设计和信号处理研究工作。

这是继今年6月任小枫入职后,iDST迎来的又一位大牛级人物。

冯津伟曾就读国内*声学研究机构南京大声学研究所,师从音频声学泰斗沙家正先生,并与导师一起研制出了全球第一台扬声器纸盆共振频率的自动测试系统,极大地帮助了国内的电声行业提高生产效率。冯津伟博士毕业于在主动降噪领域著名的弗吉尼亚理工大学VAL实验室。

Polycom是语音和视频协作解决方案领域的全球领导者,占全球视频会议市场份额第一。冯津伟曾在Polycom工作17年,拥有十余项美国专利,大部分已产品化,是名声在外的世界级音频专家。他曾主持开发基于麦克风阵列的视频跟踪系统,即在多人视频会议时,摄像头能基于方位和距离,精准定位发言人,产品创新性引业内效仿。

阿里巴巴iDST语音团队负责人鄢志杰表示:“冯博士的入职,是物理学和互联网间的‘跨界’。阿里严肃看待智能语音交互技术全链路,逐步组建世界级专家团队。从源头和信号采集开始,在端上做突破性的智能语音交互体验。”

此前,iDST语音团队的技术成果已通过阿里云人工智能ET等对外输出,在法庭庭审识别、智能客服、视频审核和实时字幕转写、声纹验证、物联网等多个场景成功应用。全国有近300家法院和超过6000家法庭在使用ET,每年有超过1.2亿次客服电话由ET协助人类接听。

在语音交互产品方面,阿里iDST研究的技术平台能够精准转换用户的语音为对互联网内容和服务的意图,触达手机、IoT设备、互联网汽车、电视、智能音箱等各类终端,如与斑马网络、上汽合作的的荣威互联网汽车、与海尔合作的人工智能电视等。

冯津伟入职后将依托其在声学与信号处理领域的背景,主持领导语音交互设备端的研究工作。声学是物理学分支学科之一,研究媒质中机械波的产生、传播、接收和效应。以时下最热门的智能音箱为例,如何选择麦克风的材质、摆放位置、结构,就是声学设计要解决的问题。

关于加入阿里巴巴,冯津伟认为是一次全新的机会。他表示,过去自己的专业知识基本用于会议模式,而未来阿里丰富的智能交互场景将为声学设计与信号处理的发展提供宝贵的实战经验。 

冯津伟的研究方向为“下一代人机自然交互技术”,该领域已经得到阿里巴巴重点投入,此前成立的“达摩院”就包含这一研究领域。

阿里巴巴iDST透露,冯津伟已参与一秘密项目开发,项目在全球没有先例。