文件名称:QMSum:NAACL 2021纸的数据集
文件大小:20.06MB
文件格式:ZIP
更新时间:2024-05-02 11:30:48
QMSum 概述 该存储库维护了NAACL 2021论文的数据集:“ QMSum:基于查询的多域会议摘要的新基准”。 QMSum是用于基于查询的多域会议摘要任务的新的人工注释基准,它由多个域中232个会议上的1,808个查询摘要对组成。 如果您使用我们的数据集,请仅将其用于研究目的并引用我们的论文。 数据集 您可以通过data/ALL文件夹访问QMSum的训练/有效/测试集。 此外,QMSum由三个域组成: data/Academic , data/Product和data/Comittee包含单个域中的数据。 每个文件夹中的文件: jsonl :.jsonl格式的数据。 all :.json格式的所有数据。 train :训练数据。 val :验证数据。 test :测试数据。 json数据的格式如下: { "topic_list": [ {