文件名称:chowmein:自动标记主题模型
文件大小:703KB
文件格式:ZIP
更新时间:2024-06-05 21:00:57
Python
炒面 自动标记主题模型。 在描述了算法 例子 我们对NIPS 2014的摘要进行建模(2008至2014年的NIPS摘要可在datasets/下获得)。 同时,我们禁止将要标记为NN,NN或JJ,NN标签JJ,NN并使用前200个最有用的标签。 >>> python label_topic.py --line_corpus_path datasets/nips-2014.dat --preprocessing wordlen tag --label_tags NN,NN JJ,NN --n_cand_labels 200 ... Topical words: -------------------- Topic 0: model data framework clustering information distributions two number world propose n
【文件预览】:
chowmein-master
----.gitignore(705B)
----continuous_integration()
--------install.sh(2KB)
----.travis.yml(505B)
----LICENSE(1KB)
----README.md(4KB)
----.coveragerc(113B)
----chowmein()
--------label_topic.py(6KB)
--------datasets()
--------label_finder.py(2KB)
--------__init__.py(0B)
--------tests()
--------pmi.py(3KB)
--------corpus_processor.py(2KB)
--------label_ranker.py(8KB)
--------text.py(2KB)
--------data.py(1KB)