TextMatch:基于Pytorch的,中文语义相似度匹配模型(ABCNN,Albert,Bert,BIMPM,DecomposableAttention,DistilBert,ESIM,RE2,Roberta,SiaGRU,XlNet)

时间:2024-04-09 04:14:04
【文件属性】:

文件名称:TextMatch:基于Pytorch的,中文语义相似度匹配模型(ABCNN,Albert,Bert,BIMPM,DecomposableAttention,DistilBert,ESIM,RE2,Roberta,SiaGRU,XlNet)

文件大小:126KB

文件格式:ZIP

更新时间:2024-04-09 04:14:04

Python

基于Pytorch的中文语义相似度匹配模型 基于Pytorch的中文语义相似度匹配模型 本项目将持续更新,对比目前业界主流文本匹配模型在中文的效果 运行环境:python3.7,pytorch1.2,transformers2.5.1 数据集采用LCQMC数据(将一个句子对进行分类,判断两个句子的语义是否相同(二分类任务)),因数据存在涉嫌嫌疑,故不提供下载,需要者可向官方提出数据申请 ,将数据解压到数据文件夹即可。模型评价指标为:ACC,AUC以及预测总计耗时。 嵌入:本项目输入都统一采用分字策略,故通过*中文语料,训练了字向量作为嵌入。训练语料,矢量模型以及词表,可通过百度网盘下载。链接: : 提取码:s830 模型文件:本项目训练的模型文件(不一定最优,可通过超参继续调优),也可通过网盘下载。链接: : 提取码:s830 测试集结果对比: 模型 行政协调会 AUC 耗时(s


【文件预览】:
TextMatch-master
----Albert()
--------models()
--------utils.py(9KB)
--------test.py(1KB)
--------train.py(5KB)
--------model.py(2KB)
--------data.py(5KB)
----RE2()
--------models()
--------test.py(2KB)
--------train.py(6KB)
--------util.py(9KB)
--------__init__.py(0B)
--------model.py(3KB)
--------utils()
--------data.py(5KB)
--------modules()
----DecomposableAttention()
--------models()
--------utils.py(9KB)
--------test.py(2KB)
--------train.py(5KB)
--------model.py(4KB)
--------layers.py(993B)
--------data.py(5KB)
----SiaGRU()
--------models()
--------utils.py(9KB)
--------test.py(2KB)
--------train.py(5KB)
--------model.py(2KB)
--------data.py(5KB)
----data()
--------数据可从网盘下载.txt(0B)
----BIMPM()
--------models()
--------utils.py(9KB)
--------test.py(2KB)
--------train.py(5KB)
--------model.py(11KB)
--------data.py(5KB)
----ESIM()
--------models()
--------utils.py(10KB)
--------test.py(2KB)
--------train.py(6KB)
--------model.py(4KB)
--------layers.py(5KB)
--------data.py(5KB)
----Xlnet()
--------models()
--------utils.py(9KB)
--------test.py(1KB)
--------train.py(5KB)
--------model.py(2KB)
--------data.py(5KB)
----RoBerta()
--------models()
--------utils.py(9KB)
--------test.py(1KB)
--------train.py(5KB)
--------model.py(2KB)
--------data.py(5KB)
----DistilBert()
--------models()
--------utils.py(9KB)
--------test.py(1KB)
--------train.py(5KB)
--------model.py(1KB)
--------data.py(5KB)
----ABCNN()
--------models()
--------utils.py(9KB)
--------test.py(2KB)
--------train.py(5KB)
--------model.py(4KB)
--------data.py(5KB)
----Bert()
--------models()
--------utils.py(9KB)
--------test.py(1KB)
--------train.py(5KB)
--------model.py(2KB)
--------data.py(5KB)
----.gitignore(2KB)
----README.md(2KB)
----utils()
--------gen_corpus.py(2KB)
--------load_data.py(2KB)
--------args.py(246B)
--------data_utils.py(2KB)
--------train_w2v.py(2KB)
--------lcqmc_dataset.py(706B)

网友评论