OnlineLDA_Spark:基于Spark的在线LDA

时间:2024-07-16 13:48:35
【文件属性】:

文件名称:OnlineLDA_Spark:基于Spark的在线LDA

文件大小:9KB

文件格式:ZIP

更新时间:2024-07-16 13:48:35

Scala

在线LDA_Spark 基于Spark的在线LDA 该存储库包含来自在线 LDA 实现。 使用 Apache Spark v1.2.0 开发。 共享代码以备不时之需。 主要接口: OnlineLDA_Spark.runOnlineMode(sc: SparkContext, paths: Seq[String], vocab: Map[String, Int], K: Int, batchSize: Int)和 OnlineLDA_Spark runBatchMode(sc: SparkContext, paths: Seq[String], vocab: Map[String, Int], K: Int, iterations: Int) 其中路径是要处理的文件。 有关更多详细信息,请参阅 Driver.scala 中的示例。 性能统计,在 4 节点集群上,每个集群有 16


【文件预览】:
OnlineLDA_Spark-master
----Driver.scala(2KB)
----Docs2Vec.scala(1KB)
----LICENSE(11KB)
----README.md(2KB)
----OnlineLDA_Spark.scala(5KB)

网友评论