文件名称:SparkCosineSimilarity:矩阵向量上余弦相似度的python实现
文件大小:27KB
文件格式:ZIP
更新时间:2024-07-13 21:12:14
Python
火花余弦相似度 这是一个脚本,输入一个矩阵并计算矩阵中每个向量与其他向量的余弦相似度 例子: *add test dataset (dataset.txt) into hadoop hdfs 这是数据集的摘录: "16",45,12,7,2,2,2,2,4,7,7 "28",1,1,1,0,0,0,0,0,0,0 "35",28,9,6,1,0,3,0,5,2,2 "52",28,7,3,3,3,1,2,4,4,3 "63",17,5,1,0,0,0,0,4,1,1 "67",35,20,10,1,1,8,0,17,8,4
【文件预览】:
SparkCosineSimilarity-master
----Similarity.py(453B)
----README.md(438B)
----dataset.txt(101KB)