文件名称:Chinese_models_for_SpaCy:SpaCy中文模型| 支持中文的SpaCy模型
文件大小:105KB
文件格式:ZIP
更新时间:2024-02-24 09:11:56
nlp chinese-nlp nlp-dependency-parsing nlp-machine-learning spacy-models
SpaCy官方中文模型已经上线( ),本项目『推动SpaCy中文模型开发』的任务已经完成,本项目将进入维护状态,后续更新将只进行bug修复,感谢各位用户长期的关注和支持。 SpaCy中文模型 为SpaCy提供的中文数据模型。模型目前还处于beta公开测试的状态。 在线演示 基于Jupyter notebook的在线演示在 。 特性 部分王小明在北京的清华大学读书这个Doc对象的属性信息: NER(新! ) 部分王小明在北京的清华大学读书这个Doc对象的NER信息: 开始使用 SpaCy(版本> 2)的基础知识。 系统要求 Python 3(也许支持python2,但未通过良好测试) 安装 下载模型 从页面下载模型( New!为中国地区的用户提供了加速下载的链接)。假设所下载的模型称为zh_core_web_sm-2.xxtar.gz 。 安装模型 pip install zh_core_web_sm-2.x.x.tar.gz 为了方便后续在Rasa NLU等框架中使用,需要再为这个模型建立一个链接,通过执行以下命令: spacy link zh_core_web_sm zh 运行完
【文件预览】:
Chinese_models_for_SpaCy-master
----third-part()
--------.gitkeep(0B)
--------brown-cluster()
----plain_word_vectors.py(1KB)
----test_init_model.py(452B)
----onto_to_spacy_json.py(5KB)
----create_init_model.bash(167B)
----train_ner.py(0B)
----format_convertor.bash(321B)
----compute_brown_cluster.bash(164B)
----update_model_meta.py(286B)
----move_wikipedia_corpus.bash(92B)
----notebooks()
--------demo.ipynb(21KB)
----.gitmodules(256B)
----train.bash(164B)
----create_model_package.bash(147B)
----train_requirements.txt(42B)
----meta.json(520B)
----download_and_compile_brown_cluster.bash(116B)
----test.py(509B)
----compute_plain_word_vec.bash(189B)
----README.en-US.md(3KB)
----create_jsonl_corpus.bash(113B)
----all_in_one.bash(470B)
----merge_all_text_files.py(454B)
----test_dependency_model.py(471B)
----convert_UD_Chinese-GSD_corpus.bash(282B)
----requirements.txt(40B)
----create_jsonl_vocabulary.py(8KB)
----train_model.bash(227B)
----corpus()
--------.gitkeep(0B)
----init_model.bash(122B)
----merge_all_text_files.bash(86B)
----.idea()
--------misc.xml(315B)
--------Chinese_models_for_SpaCy.iml(1KB)
--------modules.xml(300B)
--------vcs.xml(257B)
----test_as_model_dir.py(518B)
----requirements_dev.txt(6B)
----LICENSE.md(1KB)
----README.md(3KB)
----extract_UD_Chinese-GSD_corpus.bash(59B)
----create_wikipedia_corpus.bash(65B)
----compute_words_freq.bash(194B)
----POS_depedency_model()
--------.gitignore(18B)
----test_ner.py(524B)
----workflow.md(3KB)
----.images()
--------attributes_of_doc.png(27KB)
--------attributes_of_doc.html(2KB)
--------dependency_of_doc.svg(4KB)
--------temp.html(3KB)
--------ner_of_doc.png(6KB)
--------dependency_of_doc.png(40KB)
----spacy-dev-resources(22B)
----.gitignore(3KB)
----merge_submodel.py(1KB)
----train_ner.bash(185B)
----onto_to_spacy_json.bash(175B)
----download_UD_Chinese-GSD_corpus.bash(125B)
----test_load.py(566B)