文件名称:mimic-tools:MIMIC数据资源
文件大小:1.61MB
文件格式:ZIP
更新时间:2024-05-17 19:50:32
python nlp corpus mimic-iii Python
MIMIC数据资源 该存储库将资源重组以用于语料库处理 1.要求 您已克隆存储库 cd ~ git clone git@github.com:jtourille/mimic-w2v-tools.git 您已经成功下载了mimic-iii并填充了一个postgres数据库。 有关详细说明,请参见官方网站。 2.使用方法 以下步骤假定您正在空目录中工作。 mkdir ~ /mimicdump cd ~ /mimicdump 2.1-从数据库中提取文本文档 运行以下命令以从数据库中提取文档。 将参数调整为您的设置。 python ~ /mimic-w2v-tools/main.py EXTRACT \ --url postgresql://mimic@localhost:5432/mimic \ --output-dir ~ /mimicdump/01_extraction
【文件预览】:
mimic-tools-master
----.gitignore(1KB)
----mimic()
--------corenlp.py(4KB)
--------transform.py(43KB)
--------__init__.py(0B)
--------w2v.py(1KB)
--------tools.py(530B)
--------extract.py(2KB)
----README.md(2KB)
----lists()
--------www.countries-list.info()
--------data.medicare.gov()
--------talk.collegeconfidential.com()
--------generatedata.com()
--------misc()
--------www.randomlists.com()
--------1990_US_CENSUS()
----main.py(9KB)