文件名称:Spark大数据中文分词统计Scala语言工程源码
文件大小:395KB
文件格式:7Z
更新时间:2019-09-10 16:49:17
Spark Scala 中文分词 IKAnalyzer 源码
参考网络资源使用IKAnalyzer分词组件,实现了在Spark框架下使用Scala语言对唐诗宋词等国学经典进行中文分词统计排序的功能,你可以轻松发现唐诗宋词中最常用的词是那几个。
【文件预览】:
ScalaWordCount
----bin()
--------com()
--------screen shoot2.png(145KB)
--------scala()
----.settings()
--------org.scala-ide.sdt.core.prefs(259B)
--------org.eclipse.jdt.core.prefs(598B)
----src()
--------com()
--------screen shoot2.png(145KB)
----.project(448B)
----.classpath(610B)
----.cache-main(44KB)