文件名称:国内研究现状-winform开发手册
文件大小:3.53MB
文件格式:PDF
更新时间:2024-07-21 16:08:49
综述
3.1.2基于同步文法的文本生成 在过去的20年间,统计句法分析与统计机器翻译是公认的两个取得长足进步的自然 语言处理任务。除了从成熟的统计句法分析中借鉴成功经验——如判别式消歧之外,不 少学者也尝试复用成功的机器翻译模型来完成文本生成。机器翻译的目标是将某种自然 语言语句翻译成另外一种自然语言语句,并尽量保持意义不变;而文本生成则可以视为 将某种形式语言语句翻译成一种自然语言语句,二者具有极强的可比性。 Chiang。”。提出了层级基于短语的翻译模型(Hierarchical Phrase-based Model),其核 心是利用同步上下文无关文法(Synchronous Contex.Free Grammar)来协同源语言语句的 解析和目标语言语句的生成。目前同步文法也已经被借鉴到文本生成的研究中。理1鼬。 wong与Mooney‘理。两位作者讨论了两种形式语言用于表征意义:第一种是用于指挥机器 人动作的形式语言,第二种是一种无变量的数据库检索语言。而Lu与Ng。58。则针对表达 能力极强的类型入表达式(Typed入.expression)展开研究。两项研究的共同点是构建形 式语言的基于树的结构,再将相关结构与待生成的自然语言的树结构建立一致性对应, 从而完成文本生成任务。另一个共同点则是广泛地使用了现有的机器翻译技术(包括开 源软件等)来进行文法抽取、解码等。 3.2 国内研究现状 国内语言学界与计算语言学界针对自然语言语义的形式化研究较少,针对汉语进行 全方面组合语义刻画的研究目前尚属空白。另一方面,从事自然语言处理的研究人员也 较少涉猎深层语言结构处理问题,而对意义到文本的生成研究则更是鲜有,很少能见到 e hIIp:∥www.delph-in.ne∥erg/。 ② https:∥github.com/OpenccG/openccg。 万方数据