2021-GAIIC-Task3-Share:全球人工智能技术创新大赛-赛道三:小布助手对话短文本语义匹配

时间:2024-04-21 09:57:05
【文件属性】:

文件名称:2021-GAIIC-Task3-Share:全球人工智能技术创新大赛-赛道三:小布助手对话短文本语义匹配

文件大小:125KB

文件格式:ZIP

更新时间:2024-04-21 09:57:05

2021-GAIIC-Task3-Share 全球人工智能技术创新大赛-赛道三:小布助手对话短文本语义匹配 周周星分享 非常荣幸能够拿到周周星,目前初赛第四,本着互联网开源精神,这里也做一些的分享,和大家相互学习,共同进步。 数据 1,对偶数据增强,即Q1-Q2对变成Q2-Q1对; 2,闭包数据增强,即Q1-Q2 = 1,Q2-Q3 = 1,则Q1-Q3 = 1;注意:数据增强时要保证正负样本比例,与原始分布一致,否则无效果甚至导致效果变差。 模型训练方式 半互动 1,ESIM,2,Bimpm,3,SentenceBert,注意:半交互是我们一开始的思路,并使用双路bert,上层使用bert前模型等;并且使用ESIM单模加上技巧,单模也可以上0.89,但是后面使用全交互,效果更好,就没有再继续实验了。 全互动 1,先MLM预训练,再微调; 2,MLM预训练与微调一起做,注意:第二种方式会比


【文件预览】:
2021-GAIIC-Task3-Share-main
----LICENSE(11KB)
----README.md(4KB)
----image()
--------logcong.png(71KB)
--------ranking.png(52KB)
----.gitignore(2KB)

网友评论