文件名称:Poly-Encoder
文件大小:14KB
文件格式:ZIP
更新时间:2024-06-16 04:51:31
Python
用于响应选择任务的双编码器,多编码器和交叉编码器 该存储库是的非官方重新实现。 特别感谢sfzhou5678! 一些数据预处理(dataset.py)和训练循环代码是从他的改编的。 但是,该存储库中的模型体系结构和数据表示与本文不完全一致,从而导致性能下降。 我在coder.py中重新实现了Bi-Encoder和Poly-Encoder的模型。 另外,还实现了交叉编码器的模型和数据处理流水线。 大多数run.py训练代码是从adpated 在库。 此实现与原始论文之间最重要的体系结构差异是仅使用一个bert编码器(而不是两个单独的编码器)。 有关详细信息,请参阅此。 但是,这应该不会对性能产生太大影响。 该存储库未实现原始论文中的所有详细信息,例如,稳定时学习率下降0.4。 同样由于有限的计算资源,我无法像原始论文中那样使用确切的参数设置,例如批处理大小或上下文长度。 另外,使用的
【文件预览】:
Poly-Encoder-master
----encoder.py(6KB)
----dstc7()
--------parse.sh(213B)
--------parse.py(1KB)
--------merge.py(430B)
----dataset.py(5KB)
----bert_model()
--------run.sh(244B)
----LICENSE(1KB)
----run.py(15KB)
----dstc7_aug()
--------parse.py(717B)
----requirements.txt(87B)
----transform.py(4KB)
----README.md(6KB)