spark mllib 文本特征提取

时间:2020-12-08 09:06:04
【文件属性】:

文件名称:spark mllib 文本特征提取

文件大小:1.67MB

文件格式:ZIP

更新时间:2020-12-08 09:06:04

文本特征提取 word2vec TF-IDF LDA

里面包含四种模型(word2vec TF-IDF LDA CountVectorizer) 的helloworld代码和模型简单介绍,都是基于spark mllib的,包含python版本、scala版本和java版本的,是我运行通过后,整理成pdf的。这些代码没有问题,一般运行在linux上 python需要pip install 工具包来下载相应工具,一般出错出在操作系统不对和工具包没有下载


【文件预览】:
文档主题生成模型(LDA)算法原理及Spark MLlib调用实例(Scala_Java_python).pdf
Spark MLlib 文本特征提取(TF-IDF_Word2Vec_CountVectorizer).pdf

网友评论

  • 没什么作用,浪费积分