Mockingbird:在American Classic上使用Apache Spark进行文档分类

时间:2024-05-27 02:34:10
【文件属性】:

文件名称:Mockingbird:在American Classic上使用Apache Spark进行文档分类

文件大小:22.72MB

文件格式:ZIP

更新时间:2024-05-27 02:34:10

XSLT

在American Classic上使用Apache Spark进行文档分类 这些是标记的文件,并放入length = 10的段落中: ./mock.tokens ./watch.tokens 这些是从头创建原始文件的第一章: ./mock1.txt ./watch1.txt 这些是您需要修改的scala文件的位置: ./src/main/scala/Stemmer.scala-用于标记数据的实用程序,来自这里: ./src/main/scala/Models.scala-读取数据,构建模型,报告结果 步骤1:编译代码-创建一个新的jar: 首先下载sbt( ) 确保这些文件在适当的位置./model.sbt和./project/plugins.sbt 一旦安装了sbt并准备好文件,请发出以下命令:> sbt assembly 如果成功,则应创建以下jar:targe


网友评论