利用BERT和基于类的TF-IDF创建易于解释的主题。-Python开发

时间:2024-06-14 09:39:17
【文件属性】:

文件名称:利用BERT和基于类的TF-IDF创建易于解释的主题。-Python开发

文件大小:5.78MB

文件格式:ZIP

更新时间:2024-06-14 09:39:17

Python Natural Language Processing

BERTopic是一种主题建模技术,它利用BERT嵌入和c-TF-IDF创建密集的群集,从而使主题易于理解,同时又在主题描述中保留了重要的单词。 BERTopic是一种主题建模技术,它利用BERT嵌入和c-TF-IDF创建密集的群集,从而使主题易于理解,同时又在主题描述中保留了重要的单词。 相应的中等职位可以在这里找到。 关于项目算法的目录2.1。 句子转换器2.2。 UMAP + HDBSCAN 2.3。 c-TF-IDF入门3.1。 安装3.2。 基本用法3.3。 概述Google合作实验室1.关于项目返回目录


【文件预览】:
BERTopic-master
----.gitignore(916B)
----README.md(10KB)
----.github()
--------workflows()
----tests()
--------conftest.py(231B)
--------test_other.py(1KB)
--------test_models.py(11KB)
--------test_topic_representation.py(5KB)
--------test_utils.py(1KB)
--------__init__.py(0B)
--------test_bertopic.py(3KB)
----bertopic()
--------_ctfidf.py(2KB)
--------_bertopic.py(70KB)
--------_mmr.py(2KB)
--------__init__.py(94B)
--------backend()
--------_utils.py(3KB)
----docs()
--------faq.md(6KB)
--------api()
--------img()
--------changelog.md(8KB)
--------index.md(4KB)
--------tutorial()
--------style.css(0B)
----LICENSE(1KB)
----.gitattributes(31B)
----mkdocs.yml(2KB)
----images()
--------logo.png(18KB)
--------icon_white.png(6KB)
--------ctfidf.png(15KB)
--------topic_visualization.gif(309KB)
--------probabilities.png(194KB)
--------clusters.png(862KB)
--------icon.png(11KB)
--------dtm.gif(1.98MB)
----notebooks()
--------BERTopic.ipynb(148KB)
----setup.py(3KB)
----Makefile(370B)
----theme()
--------logo.png(9KB)
--------style.css(0B)

网友评论