chisp:CSpider的脚本和基准

时间:2024-05-25 23:22:15
【文件属性】:

文件名称:chisp:CSpider的脚本和基准

文件大小:51KB

文件格式:ZIP

更新时间:2024-05-25 23:22:15

Python

CSpider:用于复杂和跨域语义分析和文本到SQL任务的大型中文数据集 CSpider是一个大型中文数据集,用于复杂的跨域语义解析和文本到SQL任务(关系数据库的自然语言接口)。 它与我们的EMNLP 2019论文一起发布:。 此仓库包含用于评估,预处理和本文中使用的所有基准的所有代码。 请访问以获取更多常规介绍和排行榜。 变更日志 10/2019我们将使用转换的完整数据集启动中文文本到SQL任务。 提交教程和我们的数据集可以在我们的找到。 请遵循它以获取未发布测试数据的结果。 感谢与我们分享测试仪。 9/2019根据Spider的训练和部署集重新定义了我们在EMNLP 2019论文中使用的数据集。 数据集可从下载。 刚刚发布了该数据集以重现我们的论文中的结果。 要加入CSpider排行榜并更好地与原始英语结果进行比较,请访问我们的以获取完整的数据集。 引文 当您使用CSpider数据


【文件预览】:
chisp-master
----.gitignore(165B)
----requirements.txt(4B)
----models()
--------andor_predictor.py(3KB)
--------desasc_limit_predictor.py(4KB)
--------multisql_predictor.py(4KB)
--------__init__.py(0B)
--------op_predictor.py(7KB)
--------keyword_predictor.py(7KB)
--------root_teminal_predictor.py(4KB)
--------supermodel.py(35KB)
--------col_predictor.py(8KB)
--------having_predictor.py(4KB)
--------net_utils.py(2KB)
--------agg_predictor.py(6KB)
----evaluation.sh(464B)
----train_all.sh(1KB)
----utils()
--------process_sql.py(16KB)
--------word_embedding.py(10KB)
--------__init__.py(0B)
--------util.py(17KB)
----README.md(6KB)
----config.py(947B)
----preprocess_data.py(26KB)
----test_gen.sh(721B)
----config()
--------chisp-config.yml(2KB)
--------leaderboard.json(2KB)
----test.py(3KB)
----evaluation.py(29KB)
----train.py(7KB)

网友评论