文件名称:lda-ruby:潜在Dirichlet分配(LDA)的Ruby包装器
文件大小:72KB
文件格式:ZIP
更新时间:2024-05-14 05:54:45
C
潜在的狄利克雷分配-Ruby包装器 什么是LDA-Ruby? 该包装器基于David M. Blei的C代码。 简而言之,它可用于自动将文档聚类为主题。 预先选择主题的数量,找到的主题通常非常直观。 可以在Blei,Ng和Jordan的论文中找到实现的详细信息。 原始的C代码依赖于文件进行输入和输出。 我们认为有必要脱离该模型,而是将Ruby对象用于这些步骤。 唯一需要的文件是数据文件(格式类似于所使用的)。 (可选)您可能需要一个词汇文件才能提取属于主题的单词。 用法示例: require 'lda-ruby' corpus = Lda::DataCorpus.new("data/data_file.dat") lda = Lda::Lda.new(corpus) # create an Lda object for training lda.em("random")
【文件预览】:
lda-ruby-master
----.gitignore(51B)
----license.txt(26KB)
----README.md(2KB)
----CHANGELOG.md(1KB)
----test()
--------simple_test.rb(2KB)
--------simple_yaml.rb(502B)
--------lda_ruby_test.rb(8KB)
--------test_helper.rb(234B)
--------data()
----VERSION.yml(43B)
----ext()
--------lda-ruby()
----lib()
--------lda-ruby.rb(5KB)
--------lda-ruby()
----Rakefile(2KB)
----lda-ruby.gemspec(2KB)