[学习笔记]刘知远团队大模型技术与交叉应用L4-Prompt-learning & Delta-learning-Prompt-Learning

时间:2024-01-26 08:39:07

基本组成与流程介绍

预训练和fine-tuning有一定的gap。毕竟是不同的任务。
在这里插入图片描述
通过额外增加模版。
映射到标签的过程称为verbalizer。
这样就使用了mask任务。弥补了不同之间的gap。
在这里插入图片描述

流程举例

在这里插入图片描述

如何考虑PLM,Template,Verbalizer

PLM

Auto-regressive有更好的生成能力,mask往往放最后
MaskLM有更好的理解能力,mask往往放中间
Encoder-Decoder,mask位置可以随意
在这里插入图片描述

Template

人工构造

在这里插入图片描述
在这里插入图片描述
人为加入规则
在这里插入图片描述

结构化的Template

在这里插入图片描述

多个template整合

在这里插入图片描述

自动template

最终的template可能没有含义,但是work
在这里插入图片描述

Verblizer

把标签映射成标签词的过程。
本质上是如何用模型预测得到的分布,用它完成分类或者生成。
在这里插入图片描述

人为构造

在这里插入图片描述

训练新范式

在这里插入图片描述

应用

在这里插入图片描述

总结

在这里插入图片描述