文件名称:cpp-Familia一个中文主题建模工具包
文件大小:59KB
文件格式:ZIP
更新时间:2022-09-04 23:44:26
C/C 开发-其它杂项
Familia 开源项目包含文档主题推断工具、语义匹配计算工具以及基于工业级语料训练的三种主题模型:Latent Dirichlet Allocation(LDA)、SentenceLDA 和Topical Word Embedding(TWE)。
【文件预览】:
baidu-Familia-63d4715
----proto()
--------config.proto(751B)
----.gitignore(105B)
----run_query_doc_sim_demo.sh(211B)
----run_show_topic_demo.sh(188B)
----Makefile(3KB)
----model()
--------README.md(2KB)
--------download_model.sh(384B)
----src()
--------semantic_matching.cpp(4KB)
--------model.cpp(3KB)
--------util.cpp(764B)
--------tokenizer.cpp(3KB)
--------sampler.cpp(12KB)
--------demo()
--------vocab.cpp(1KB)
--------document.cpp(3KB)
--------inference_engine.cpp(3KB)
--------vose_alias.cpp(2KB)
----.travis.yml(221B)
----LICENSE(1KB)
----run_word_distance_demo.sh(199B)
----README.md(5KB)
----python()
--------run_lda_infer_demo.sh(174B)
--------run_query_doc_sim_demo.sh(196B)
--------cpp()
--------run_word_distance_demo.sh(186B)
--------run_slda_infer_demo.sh(176B)
--------README.md(1KB)
--------demo()
--------run_doc_distance_demo.sh(175B)
--------run_topic_word_demo.sh(183B)
----include()
--------familia()
----depends.mk(1KB)
----run_doc_distance_demo.sh(178B)
----build.sh(68B)
----run_inference_demo.sh(175B)
----AUTHORS(384B)
----run_topic_word_demo.sh(226B)