【文件属性】:
文件名称:go-topics:潜在Dirichlet分配
文件大小:87KB
文件格式:ZIP
更新时间:2021-02-17 09:32:25
golang topic model topics inference
话题
一个非常基本的LDA(潜在Dirichlet分配)实现。 尚未以任何方式完成,可能作为起点。
用法
根据func(word string) (new string, keep bool)形式的一组转换func(word string) (new string, keep bool)创建一个处理器:
processor := topics . NewProcessor (
topics. Transformations {
topics . ToLower ,
topics . Sanitize ,
topics . MinLen ,
topics . GetStopwordFilter ( "../stopwords/en" )})
读取数据并应用转换以建立语料库:
var docs = [] string {
"I like to
【文件预览】:
go-topics-master
----LDA.go(5KB)
----inference.go(211B)
----transforms.go(1KB)
----processor.go(2KB)
----model_test.go(302B)
----stopwords()
--------en(975B)
--------se(558B)
----example()
--------example_test.go(711B)
--------corpus(250KB)
----glide.lock(1KB)
----glide.yaml(199B)
----LDA_test.go(639B)
----README.md(1KB)
----concurrentMap.go(506B)
----model.go(2KB)
----processor_test.go(683B)
----.gitignore(25B)