文件名称:PubMed-PICO-Detection:PubMed PICO元素检测数据集
文件大小:41.17MB
文件格式:ZIP
更新时间:2024-05-20 07:22:07
nlp machine-learning deep-learning corpus sentence-classification
PubMed PICO元素检测数据集 此数据集由 抽象的 成功的循证医学(EBM)应用程序依赖于通过分析大型医学文献数据库来回答临床问题。 为了提出明确的,有针对性的临床问题,广泛使用了称为PICO的框架,该框架可识别给定医学文本中属于以下四个部分的句子:参与者/问题(P),干预(I),比较(C)和结果(O)。 在这项工作中,我们提出了一个基于长期短期记忆(LSTM)神经网络的模型来自动检测PICO元素。 通过对给定文本中的后续句子进行联合分类,与几种强大的基线模型相比,我们在PICO元素分类上获得了最新的结果。 我们还将公开整理的数据作为基准数据集,以便社区可以从中受益。 一些其他信息: structured_abstracts_PICO包含原始摘要。 以###开头的行表示PMID。 在该行之后,每行包含原始节标题,用于训练和测试的附设的金标以及该节内容,以符号|分隔| 。 要
【文件预览】:
PubMed-PICO-Detection-master
----structured_abstracts_sentences_PICO.txt(45.79MB)
----splitted()
--------PICO_dev.txt(4.41MB)
--------PICO_test.txt(4.46MB)
--------PICO_train.txt(36.92MB)
----structured_abstracts_PICO.txt(44.97MB)
----README.md(2KB)