文件名称:DrQA:阅读*回答开放域问题
文件大小:522KB
文件格式:ZIP
更新时间:2024-03-18 15:52:52
Python
质量保证 这是Dr.A系统的PyTorch实现,在ACL 2017论文``。 快速链接 大规模机器阅读 DrQA是一种用于开放域问答的阅读理解系统。 尤其是,DrQA的目标是“大规模机器阅读”(MRS)。 在这种情况下,我们正在寻找可能非常大的非结构化文档集中的问题的答案(这可能不是多余的)。 因此,系统必须将文档检索(查找相关文档)与机器理解文本(识别那些文档的答案)的挑战结合起来。 我们使用DrQA进行的实验着重于回答事实性问题,同时使用Wikipedia作为文档的唯一知识来源。 Wikipedia是大规模,丰富,详细信息的合适来源。 为了回答任何问题,必须首先检索500万以上的潜在相关文章,然后仔细扫描以找出答案。 请注意,DrQA将Wikipedia视为文章的通用集合,并且不依赖于其内部图结构。 结果,如检索器中所述,可以将DrQA直接应用于任何文档集合。 该存储库包括代码
【文件预览】:
DrQA-master
----setup.py(714B)
----.gitignore(77B)
----install_corenlp.sh(1KB)
----requirements.txt(92B)
----CONTRIBUTING.md(1KB)
----CODE_OF_CONDUCT.md(244B)
----LICENSE(2KB)
----scripts()
--------convert()
--------retriever()
--------distant()
--------reader()
--------pipeline()
----README.md(20KB)
----img()
--------drqa.png(463KB)
----drqa()
--------__init__.py(573B)
--------retriever()
--------reader()
--------tokenizers()
--------pipeline()
----download.sh(2KB)