Mahout:BDA

时间:2024-04-11 04:36:19
【文件属性】:

文件名称:Mahout:BDA

文件大小:24.87MB

文件格式:ZIP

更新时间:2024-04-11 04:36:19

Python

建立推荐人 为了演示如何使用Mahout在EMR上进行分析工作,我们将构建电影推荐器。 我们将从GroupLens团队编译的MovieLens数据集中用户对电影标题的评级开始,并使用“基于建议”的示例为每个用户查找最受推荐的电影。 在CLI中,键入以下命令 获取MovieLens数据 wget http://files.grouplens.org/datasets/movielens/ml-1m.zip unzip ml-1m.zip 转换rating.dat,将“ ::”换为“,”,并仅使用前三列: cat ml-1m/ratings.dat | sed 's/::/,/g' | cut -f1-3 -d, > ratings.csv 将评级文件放入HDFS: hadoop fs -put ratings.csv /ratings.csv 运行推荐器作业: mahout reco


【文件预览】:
Mahout-master
----Demo.mp4(35.67MB)
----README.md(2KB)
----hello.py(952B)

网友评论