【文件属性】:
文件名称:mimic-tools:MIMIC数据资源
文件大小:1.61MB
文件格式:ZIP
更新时间:2021-04-28 02:03:52
python nlp corpus mimic-iii Python
MIMIC数据资源
该存储库将资源重组以用于语料库处理
1.要求
您已克隆存储库
cd ~
git clone git@github.com:jtourille/mimic-w2v-tools.git
您已经成功下载了mimic-iii并填充了一个postgres数据库。 有关详细说明,请参见官方网站。
2.使用方法
以下步骤假定您正在空目录中工作。
mkdir ~ /mimicdump
cd ~ /mimicdump
2.1-从数据库中提取文本文档
运行以下命令以从数据库中提取文档。 将参数调整为您的设置。
python ~ /mimic-w2v-tools/main.py EXTRACT \
--url postgresql://mimic@localhost:5432/mimic \
--output-dir ~ /mimicdump/01_extraction
【文件预览】:
mimic-tools-master
----.gitignore(1KB)
----mimic()
--------corenlp.py(4KB)
--------transform.py(43KB)
--------__init__.py(0B)
--------w2v.py(1KB)
--------tools.py(530B)
--------extract.py(2KB)
----README.md(2KB)
----lists()
--------www.countries-list.info()
--------data.medicare.gov()
--------talk.collegeconfidential.com()
--------generatedata.com()
--------misc()
--------www.randomlists.com()
--------1990_US_CENSUS()
----main.py(9KB)