文件名称:spark mllib 文本特征提取
文件大小:1.67MB
文件格式:ZIP
更新时间:2020-12-08 09:06:04
文本特征提取 word2vec TF-IDF LDA
里面包含四种模型(word2vec TF-IDF LDA CountVectorizer) 的helloworld代码和模型简单介绍,都是基于spark mllib的,包含python版本、scala版本和java版本的,是我运行通过后,整理成pdf的。这些代码没有问题,一般运行在linux上 python需要pip install 工具包来下载相应工具,一般出错出在操作系统不对和工具包没有下载
【文件预览】:
文档主题生成模型(LDA)算法原理及Spark MLlib调用实例(Scala_Java_python).pdf
Spark MLlib 文本特征提取(TF-IDF_Word2Vec_CountVectorizer).pdf