文件名称:ure:ACL 2020中“重新访问无监督关系提取”的源代码
文件大小:38KB
文件格式:ZIP
更新时间:2024-06-15 12:56:22
Python
回顾无监督关系提取 在ACL 2020中源代码 环境 pip3 install -r requirements.txt 实验是在Nvidia V100 GPU(16GB GPU RAM)上进行的。 但是,这些方法很小,可以在大多数GPU上运行。 数据集 NYT:与联系TACRED: 输入格式:与相同 NYT和TACRED都经过了预处理(令牌化,实体键入)。 我们使用Stanford CoreNLP来获取TACRED的依赖项功能。 NYT中的实体类型是TACRED的子集,我们将TACRED中所有未在NYT中看到的实体类型映射到MISC 。 需要预先生成一些词汇文件。 您可以使用脚本 bash ure/preprocessing/run.sh 我们还提供了用于特征提取的文件 python ure/preprocessing/feature_extractor.py --input_
【文件预览】:
ure-master
----.gitignore(36B)
----requirements.txt(55B)
----data()
--------tacred()
--------sample.txt(2KB)
--------nyt()
----models()
--------feature.yml(1KB)
--------etypeplus.yml(1KB)
--------pcnn.yml(1KB)
--------config.yml(1KB)
----LICENSE(9KB)
----ure()
--------hyperparams.py(3KB)
--------vocabulary.py(3KB)
--------feature()
--------train_eval.py(6KB)
--------alias_sampling.py(2KB)
--------etypeplus()
--------utils.py(10KB)
--------preprocessing()
--------dataset.py(12KB)
--------pcnn()
--------scorer.py(2KB)
--------link_predictor.py(1KB)
--------rel_dist.py(3KB)
----README.md(3KB)