sectionizer:一个基于规则的Python模块,用于将文档拆分为多个部分

时间:2024-03-10 04:01:34
【文件属性】:

文件名称:sectionizer:一个基于规则的Python模块,用于将文档拆分为多个部分

文件大小:122KB

文件格式:ZIP

更新时间:2024-03-10 04:01:34

nlp pipeline spacy nlp-library clinical-nlp

临床分段器 该软件包提供了在文档中标记临床章节标题的组件。 此包已弃用! 发展clinical_sectionizer已被转移到现在应该安装为: pip install medspacy # Option 1: Load with a medspacy pipeline import medspacy nlp = medspacy . load ( enable = [ "sectionizer" ]) print ( nlp . pipe_names ) # Option 2: Manually add to a spaCy model import spacy from medspacy . section_detection import Sectionizer nlp = spacy . load ( "en_core_web_sm" ) nlp . add_pipe ( S


【文件预览】:
sectionizer-master
----setup.py(1KB)
----clinical_sectionizer()
--------__init__.py(376B)
--------sectionizer.py(21KB)
--------util.py(1KB)
--------_version.py(24B)
--------text_sectionizer.py(6KB)
----__init__.py(0B)
----resources()
--------patrick_section_patterns.json(19KB)
--------text_section_patterns.jsonl(28KB)
--------spacy_section_patterns.jsonl(7KB)
----LICENSE(1KB)
----notebooks()
--------00-clinical_sectionizer.ipynb(146KB)
--------03-subsections.ipynb(21KB)
--------with_compile_flags.ipynb(4KB)
--------02-text_sectionizer.ipynb(40KB)
--------01-adding_sections.ipynb(17KB)
--------example_discharge_summary.txt(12KB)
----README.md(879B)
----tests()
--------test_textsectionizer.py(3KB)
--------test_sectionizer.py(17KB)
----img()
--------viz_ent.png(74KB)

网友评论