会议 | 百度首席科学家吴华图灵大会演讲:NLP技术的演变与发展

时间:2024-03-29 15:08:40

“理解语言,拥有智能,改变世界,是每一个NLP人的使命。”5月18日,百度技术委员会主席、自然语言处理部首席科学家吴华博士在成都举办的ACM中国图灵大会(ACM TURC2019)上如是说。

 

作为中国计算机领域最有影响力的学术盛会之一,本届图灵大会以“注智世界,赋能未来”为主题,汇聚了包括曼纽尔·布卢姆、希尔维奥·米卡利、莱斯利·瓦利安特3位ACM图灵奖获得者在内的多名产学界世界*专家,共同探讨人工智能的前沿应用与发展趋势。吴华博士作为NLP领域世界顶尖的科学家,作了题为“知识与语言智能”报告,为现场数千名参会人士梳理了自然语言处理技术的演变与发展,同时介绍了百度在这一领域的长期积累与新突破。

 

“上帝为了阻止巴别塔的建立,让人们拥有了不同的语言,而跨语言沟通成了人们的共同梦想。如今,自然语言处理技术使得这一梦想触手可及。”吴华博士谈到,人工智能的本质就是让机器像人一样感知和认识世界。语言能力是人类区别于动物的最显著的特征,而自然语言处理技术让机器系统拥有人类的语言智能。自然语言处理从第一台计算机诞生之初,就开始萌芽,经过数十年的发展,凭借深度学习、大数据技术持续发展和知识的不断累积,自然语言处理迎来黄金发展期。而百度,则成为该领域技术发展的亲历者和引领者。

会议 | 百度首席科学家吴华图灵大会演讲:NLP技术的演变与发展

作为百度自然语言处理部首席科学家,吴华博士详细地介绍了百度在这一领域的深耕与布局。百度在语言和知识方面有深厚的积累,拥有最大的中文知识图谱,以及领先的语言理解和语言生成技术。百度自然语言处理技术的发展,同样得益于深度学习、大数据、知识图谱的强大助力。在深度学习方面,百度自主研发并开源的国内首个深度学习平台PaddlePaddle,集深度学习核心框架、工具组件和服务平台为一体,拥有全面业务模型、超大规模深度学习并行技术和全面领先的高速推理引擎,支持千亿级别稀疏特征任务的并行训练。

会议 | 百度首席科学家吴华图灵大会演讲:NLP技术的演变与发展

PaddlePaddle全景图

 

在深度学习模型拟合语言的同时,对语言“真正”的理解也离不开丰富的背景知识,为此,百度构建了包含实体、事件、关注点、地点、行业知识等在内的大规模多元异构知识图谱。这些描述真实世界的知识,被融入到基于实体关系的语义表征、知识增强的阅读理解、以及知识驱动的对话系统中,在深度学习模型与逻辑符号系统融合的探索中,实现对自然语言的更深入理解。基于上述技术,百度开源了PaddleNLP,它是基于PaddlePaddle深度学习框架打造的工业级NLP开源工具集,涵盖文本分类、序列标注、语义匹配等多种NLP任务的解决方案,拥有当前业内效果最好的中⽂语义表示模型和基于用户大数据训练的应⽤任务模型,且同类型算法模型可灵活插拔,提供了基于工业级数据训练的语义表示、阅读理解、人机对话等全栈智能文本处理能力。

 

事实上,本次图灵大会不仅是人工智能的知识盛宴,同样也是产学对话的一次难得契机。作为中国人工智能企业的代表,百度在产学融合道路上做出的努力值得肯定。通过平台开源、师资培训、课程共建、技术竞赛、教材出版等多种形式,百度已经形成了一套多层次、全领域的校企合作模式。正如大会主题“赋能未来”表达的那样,百度正通过自身的技术革新和对年轻人才的助力,切实推动人工智能技术的发展,真正做到“赋能未来”。