文件名称:medknow:医疗关系和实体提取
文件大小:42KB
文件格式:ZIP
更新时间:2024-05-23 09:13:01
nlp neo4j biomedical umls relation-extraction
Medknow 该项目是一个子模块,旨在用于创建特定疾病的知识库,但也可以在其他项目中用作独立模块。 它着重于利用图形数据库从免费的nlp文本中提取生物医学实体及其之间的关系,并以一种使提取新知识和推断隐藏关系更容易的方式构造它们。 该项目在设计时考虑了模块化,允许实现和快速集成新的提取器,例如用于关系提取的和用于概念提取的 。 目前正在与已经实现的基于提取器一起开发这两个。 当前,该项目的主要功能是(一些正在开发中): 不同种类的输入源:*文本,已提取的关系,概念等。 各种知识提取器在管道中工作: SemRep , MetaMap ,混响 多种持久性选项:利用Neo4j将丰富的文档保存到文件,实体以及与.csv的关系。 另外,使用Mongodb进行句子提取,而不是将.json保存到文件中。 入门 这些说明将为您提供在本地计算机上运行并运行的项目的副本,以进行开发和测试。 知识
【文件预览】:
medknow-master
----.gitignore(220B)
----README.md(12KB)
----test.py(647B)
----config.py(316B)
----load_parse.py(11KB)
----settings_sample_yaml(7KB)
----LICENSE(11KB)
----data_loader.py(12KB)
----Authentication.py(1KB)
----data_extractor.py(30KB)
----test2.py(430B)
----tasks.py(19KB)
----__init__.py(18B)
----requirements.txt(216B)
----utilities.py(9KB)
----data_saver.py(38KB)