人工智能-NLP简单知识汇总01

自然语言处理难点：

总而言之：！！语言无处不歧义

通过词汇、形式文法等制定的规则引入语言学知识，从而完成相应的自然语言处理任务

在这里插入图片描述

对于机器翻译任务可以构造如下规则库：

if 汉语主语=我 then 英语主语 = I
if 英语主语=I then 英语 be动词 = am/was
if 汉语 = 苹果 and 没有修饰量词 then 英语 = apples

就是基于固定规则，优缺点显而易见

将自然语言处理任务转化为某种分类任务

在这里插入图片描述

需要人工处理的特别多

将特征学习和预测模型融合，通过优化算法使得模型自动地学习出好的特征表示，并基于此进行结果预测

在这里插入图片描述

将大量各类型自然语言处理任务，统一为生成式自然语言理解框架

在这里插入图片描述

在大规模语言模型构建阶段，通过大量的文本内容，训练模型长文本的建模能力，使得模型具有语言生成能力，并使得模型获得隐式的世界知识。
在通用能力注入阶段，利用包括阅读理解、情感分析、信息抽取等现有任务的标注数据，结合人工设计的指令词对模型进行多任务训练，从而使得模型具有很好的任务泛化能力。
特定任务使用阶段则变得非常简单，由于模型具备了通用任务能力，只需要根据任务需求设计任务指令，将任务中所需处理的文本内容与指令结合，然后就可以利用大模型得到所需结果。

秒客网