自然语言处理的趋势

时间:2022-06-07 01:31:38

NLP,即自然语言处理,是当前一个比较热门的研究领域。其包括很多分支,如机器翻译,信息抽取,信息整合等等。搜索引擎中也引入了越来越多的NLP的知识以提高检索的准确性,理解用户的倾向。

最近看了一些自然语言研究的资料和热点话题,总结一下,NLP很可能在一硬一软两大方向上重点发展,不是并行发展,而更可能是交叉性的,相互促进的方式。

一硬:计算能力,包括并行计算,分布式计算的发展,以及海量存储的发展。这种发展模式恐怕只适合具有无与伦比的资源优势的大公司。他们利用强大的机群,进行统计模型的计算、训练,进行大规模信息的索引,存储。只要你能给我足够多的训练语料,我就能训练出完美的模型,给我足够的空间,任何检索就相当于查表,one step。

一软:理解能力,深层次的分析与发掘语义知识。目前的统计机器学习方法通常只选用了一些浅层的语义知识,以特征向量的形式表征,这种方式有很大的局限性,很难表示复杂的关系与深层的语义。因此,如何提高机器的理解能力就成了一个主要的难题与突破点。可能的方法可能有,逻辑描述,认知心理学。前者利用了逻辑的推理与严谨,进行规则的自动学习,后者则模拟人类理解文本的方式,试图建立新的语言模型。

一点薄见!