文件名称:完整的空间管道和科学/生物医学文献模型。-Python开发
文件大小:233KB
文件格式:ZIP
更新时间:2024-06-14 10:13:04
Python Natural Language Processing
该存储库包含与使用spaCy获取科学文档有关的自定义管道和模型。 特别是,有一个自定义令牌生成器,它在spaCy的基于规则的令牌生成器,POS标记器和语法的基础上添加了令牌化规则。此存储库包含与将spaCy用于科学文档有关的自定义管道和模型。 特别是,有一个自定义令牌生成器,它在spaCy基于规则的令牌生成器的基础上添加了令牌生成规则,在生物医学数据上经过训练的POS标记器和语法解析器以及一个实体跨度检测模型。 另外,还有用于更具体任务的NER模型。 只是想测试您的数据模型? 查看我们的演示。 安装安装Scispacy需要两个步骤:inst
【文件预览】:
scispacy-main
----MANIFEST.in(185B)
----project.yml(28KB)
----docs()
--------example.svg(8KB)
--------_config.yml(138B)
--------Gemfile(76B)
--------.gitinclude(0B)
--------scispacy-logo-square.png(82KB)
--------index.md(5KB)
--------scispacy-logo.png(42KB)
----requirements.in(341B)
----pytest.ini(28B)
----data()
--------craft_ner.json(332B)
--------meta_small.json(322B)
--------jnlpba_ner.json(334B)
--------meta_medium.json(322B)
--------bc5cdr_ner.json(334B)
--------meta_large.json(322B)
--------meta_scibert.json(398B)
--------bionlp13cg_ner.json(342B)
----.github()
--------workflows()
----Dockerfile(770B)
----scispacy()
--------per_class_scorer.py(4KB)
--------train_utils.py(1KB)
--------umls_utils.py(7KB)
--------umls_linking.py(111B)
--------base_project_code.py(4KB)
--------linking_utils.py(4KB)
--------candidate_generation.py(20KB)
--------file_cache.py(5KB)
--------data_util.py(10KB)
--------umls_semantic_type_tree.py(4KB)
--------custom_tokenizer.py(5KB)
--------custom_sentence_segmenter.py(2KB)
--------util.py(1KB)
--------__init__.py(52B)
--------hyponym_detector.py(5KB)
--------abbreviation.py(9KB)
--------consts.py(294B)
--------hearst_patterns.py(16KB)
--------linking.py(6KB)
--------version.py(150B)
----tests()
--------test_candidate_generation.py(2KB)
--------test_abbreviation_detection.py(7KB)
--------conftest.py(4KB)
--------test_per_class_scorer.py(2KB)
--------test_linking.py(3KB)
--------custom_tests()
--------test_file_cache.py(3KB)
--------__init__.py(0B)
--------test_umls_utils.py(2KB)
--------test_hyponym_detector.py(2KB)
--------test_util.py(449B)
--------test_data_util.py(4KB)
--------fixtures()
--------test_umls_semantic_type_tree.py(2KB)
----RELEASE.md(1KB)
----LICENSE(11KB)
----configs()
--------base_parser_tagger_scibert.cfg(3KB)
--------base_ner_scibert.cfg(3KB)
--------base_specialized_ner.cfg(3KB)
--------base_parser_tagger.cfg(3KB)
--------base_ner.cfg(3KB)
----setup.py(2KB)
----.gitignore(1KB)
----evaluation()
--------sentence_splitting_evaluation.py(4KB)
----README.md(15KB)
----scripts()
--------count_word_frequencies.py(3KB)
--------mypy.sh(102B)
--------create_linker.py(636B)
--------convert_freqs.py(3KB)
--------export_umls_json.py(4KB)
--------evaluate_ner.py(2KB)
----.flake8(570B)