InterpretEval:(几乎)所有NLP任务的可解释性评估

时间:2024-05-12 10:51:26
【文件属性】:

文件名称:InterpretEval:(几乎)所有NLP任务的可解释性评估

文件大小:13.84MB

文件格式:ZIP

更新时间:2024-05-12 10:51:26

HTML

由,,,和其他捐助。 该项目得到以下两项工作的支持: 最终产品: (更新中) 更新: 在CoNLL03上添加了一个SOTA NER系统和两个得分最高的系统,参阅。 感谢 和Stefan Schweter的分享成果。 1.动机问题 许多NLP任务的执行已达到稳定状态。 什么有效,下一步是什么? XX解决了吗? 还剩什么? 一个好的评估指标不仅可以对不同的系统进行排名,还可以告诉他们它们之间的相对优势(优势和劣势)。 下一代Leaderboard :具备强大的分析能力吗? 2.可解释的评估方法 评估方法通常包括以下步骤。 2.1属性定义 以NER和CWS任务为例,我们为NER任务定义了8个属性,为CWS任务定义了7个属性。 ID 内尔 标准煤 1个 实体长度 字长 2个 句子长度 句子长度 3 OOV密度 OOV密度 4 代币频率 字符频率 5 实体频率


【文件预览】:
InterpretEval-master
----fig()
--------.DS_Store(6KB)
--------interpretEval.gif(1.26MB)
--------board.png(99KB)
--------yanshi.gif(8.42MB)
--------new.png(12KB)
--------ner.gif(166KB)
--------nlp.png(5KB)
----.DS_Store(10KB)
----README.md(7KB)
----interpretEval()
--------.DS_Store(12KB)
--------ner_overall_f1.py(6KB)
--------tensorEvaluation-ner.py(51KB)
--------img()
--------requirements.txt(49B)
--------analysis()
--------run_task_ner.sh(3KB)
--------__pycache__()
--------data()
--------conlleval(12KB)
--------output_tensorEval()

网友评论