文件名称:deep_text_matching:实现keras的几种深层文本匹配(类似文本)模型。 cdssm,arc-ii,match_pyramid,mvlstm,esim,drcn,bimpm,bert,albert,raberta
文件大小:18.35MB
文件格式:ZIP
更新时间:2024-05-12 17:55:41
Python
Deep text matching 1、前言 Github 上面有很多文本匹配项目,本项目工作主要借鉴了 和 ,模型的代码风格来自前者。另外模型是使用 keras 深度学习框架进行复现的,主要也是使用的前者的复现代码,只是增加了个别模型的复现,也去除了一些我觉得不太重要的模型;另外,由于本项目只是实验层面探索,所以将 matchzoo 源码中一些和模型无关的很多代码进行了删减,同时对部分模型的结构进行了细微的调整,没有完全遵从论文里的设置。 我使用这些模型在2018年蚂蚁金服的文本匹配竞赛数据集(数据集来自text matching 上传,因此数据的预处理代码也使用的该项目的代码)上进行了一些实验,另外我借鉴了 项目的代码测试了几个 bert 系列模型(bert 及其变体)。由于训练集、验证集、测试集中的正负样本比例都是1:1,因此我使用了准确率这一评价指标来衡量了这些模型的性能,结果
【文件预览】:
deep_text_matching-master
----bert_model()
--------bert_similarly.py(4KB)
----models()
--------esim.py(3KB)
--------match_pyramid.py(2KB)
--------mvlstm.py(2KB)
--------bimpm.py(2KB)
--------drcn.py(5KB)
--------__pycache__()
--------cdssm.py(2KB)
--------arcii.py(3KB)
----.DS_Store(6KB)
----paper()
--------mvlstm.pdf(394KB)
--------albert.pdf(283KB)
--------match_pyramid.pdf(863KB)
--------roberta.pdf(205KB)
--------bimpm.pdf(359KB)
--------drcn.pdf(1.01MB)
--------esim.pdf(985KB)
----engine()
--------layers.py(26KB)
--------__pycache__()
--------base_model.py(3KB)
----utils()
--------data_utils.py(2KB)
--------__init__.py(0B)
--------load_data.py(7KB)
--------__pycache__()
----README.md(9KB)
----__pycache__()
--------mvlstm.cpython-37.pyc(1KB)
--------layers.cpython-37.pyc(15KB)
--------arcii.cpython-37.pyc(2KB)
--------base_model.cpython-37.pyc(3KB)
--------cdssm.cpython-37.pyc(2KB)
--------bimpm.cpython-37.pyc(1KB)
----input()
--------test.csv(718KB)
--------vocab.txt(31KB)
--------train.csv(7.02MB)
--------dev.csv(715KB)
--------word2vec()
----word2vec_static.py(2KB)
----pic()
--------2.png(12KB)
--------3.png(100KB)
--------5.png(139KB)
--------arcii.png(118KB)
--------6.png(54KB)
--------drcn.png(512KB)
--------1.png(60KB)
--------捕获6.PNG(242KB)
--------4.png(6KB)
--------7.png(231KB)
--------match_pyramid.png(294KB)
----train.py(8KB)