文件名称:kwx:Python中基于BERT,LDA和TFIDF的关键字提取
文件大小:5.21MB
文件格式:ZIP
更新时间:2024-04-04 15:09:59
multilingual python nlp data-science machine-learning
Python中基于BERT,LDA和TFIDF的关键字提取 跳到: ••• kwx是用于基于Google的和多语言关键字提取的工具包。 该软件包提供了一套方法来处理不同语言的文本,然后从创建的语料库中提取和分析关键字(有关各种语言支持,请参阅 )。 唯一的重点是允许用户确定输出中不包括哪些单词,从而允许他们使用自己的直觉来微调建模过程。 有关该过程和技术的全面概述,请参阅,并参考以获取有关模型和可视化方法的说明。 通过PyPi安装 kwx可以通过pip从pypi下载或直接从此存储库中获取: pip install kwx git clone https://github.com/andrewtavis/kwx.git cd kwx python setup.py install import kwx 型号 实现的NLP建模方法包括: 伯特 表示法是基于在开源Wikipedia数据上
【文件预览】:
kwx-main
----setup.py(2KB)
----.gitignore(408B)
----codecov.yml(239B)
----requirements.txt(3KB)
----resources()
--------kwx_logo_transparent.png(96KB)
--------kwx_logo.png(93KB)
--------gh_images()
----CHANGELOG.md(1KB)
----LICENSE.txt(1KB)
----.github()
--------COC_CONTACT.md(213B)
--------CONTRIBUTING.md(223B)
--------CODE_OF_CONDUCT.md(6KB)
--------workflows()
----examples()
--------kw_extraction.ipynb(655KB)
----README.md(11KB)
----kwx()
--------__init__.py(0B)
--------visuals.py(26KB)
--------utils.py(24KB)
--------topic_model.py(7KB)
--------autoencoder.py(3KB)
--------languages.py(3KB)
--------model.py(32KB)
----tests()
--------conftest.py(14KB)
--------__init__.py(0B)
--------test_utils.py(7KB)
--------test_languages.py(251B)
--------test_visuals.py(3KB)
--------test_model.py(3KB)
----environment.yml(5KB)
----.gitattributes(359B)
----docs()
--------requirements.txt(14B)
--------Makefile(638B)
--------make.bat(799B)
--------source()