文件名称:SeaNMF:短文本主题建模
文件大小:5.63MB
文件格式:ZIP
更新时间:2024-05-20 16:36:29
Python
SeaNMF 本文的执行 ,Kyeongpil Kang, 和 ,“通过非负矩阵分解并丰富本地单词上下文相关性的短文本主题建模”,在里昂举行的国际互联网大会上进行,法国,2018年4月 要求 的Python 3.5.2 argparse 用法: 资料处理 使用 , 或 删除特殊字符。 删除停用词。 编辑data_process.py的参数 运行python3 data_process.py以准备文档术语矩阵和词汇表。 火车 运行python3 train.py --help来查看选项的完整列表。 评估 运行python3 vis_topic.py来计算PMI并可视化每个主题中的热门关键字。
【文件预览】:
SeaNMF-master
----data_process.py(2KB)
----seanmf_results()
--------W.txt(5.83MB)
--------H.txt(35.77MB)
--------Wc.txt(5.83MB)
----train.py(3KB)
----utils.py(1KB)
----model.py(6KB)
----vis_topic.py(1KB)
----LICENSE(34KB)
----README.md(1KB)
----__pycache__()
--------utils.cpython-35.pyc(2KB)
--------model.cpython-35.pyc(7KB)
----data()
--------vocab.txt(28KB)
--------data.txt(777KB)
--------doc_term_mat.txt(439KB)