【文件属性】:
文件名称:numerate-language-models
文件大小:63KB
文件格式:ZIP
更新时间:2021-05-18 04:54:59
Python
多种语言模型
算术是处理数字和数字的能力。 该项目研究了语言模型预测数字的各种策略。 在临床和科学数据集上对模型进行训练和测试。
参考
Georgios Spithourakis和Sebastian Riedel。 语言模型的计算能力:评估和提高其预测数字的能力,ACL 2018
依存关系
pip安装beautifulsoup4
pip安装lxml(对于Windows,请从下载)
pip install spacy(可能还需要:conda install libgcc)
python -m spacy下载zh
手套嵌入来自: :
下载和预处理数据
下载并提取数据
latexml.download_arxmliv.py
[数据集] .extract_to_json.py
latexml.xml_to_text.py
处理文字
json_to_tsv.py
tsv_to_an
【文件预览】:
numerate-language-models-master
----.gitignore(774B)
----src()
--------dataset()
--------models()
--------number_cloze()
--------preproc()
----LICENSE(34KB)
----README.md(2KB)