【文件属性】:
文件名称:OpenCF:协同过滤系统的实现
文件大小:2MB
文件格式:ZIP
更新时间:2021-07-04 22:51:07
boost collaborative-filtering TeX
开放CF
这是协同过滤系统的一个实现,它是推荐系统最流行的算法。
更多信息可从滑块获取:report/OpenCF-report.pdf
OpenCF 实现了基于用户的 CF 和基于项目的 CF,并优化了如下方法:
评级矩阵的行归一化。
相似函数:
原余弦
调整余弦
皮尔逊相关
相似度总结:
直接求和
归一化(一阶)相似度求和
概率相似度求和
紧凑型身份证
compact用于压缩不连续的 user-id 和 item-id。
# compact data/uir to data/uir.compact, -U and -I specifies mapping file names, which is used to restore ids.
./compact -f data/uir -o data/uir.compact -U data/user.map -I data
【文件预览】:
OpenCF-master
----report()
--------post-proc.eps(10KB)
--------p285-sarwar.pdf(252KB)
--------sim_compare.eps(11KB)
--------row_norm.eps(10KB)
--------summing_compare_f1.eps(8KB)
--------sim_compare_f1.eps(8KB)
--------base.eps(11KB)
--------post-proc_f1.eps(8KB)
--------base_f1.eps(8KB)
--------summing_compare.eps(10KB)
--------p247-karypis.pdf(172KB)
--------click_curve.eps(9KB)
--------doc.tex(15KB)
--------makefile(227B)
--------report.pdf(496KB)
--------doc.pdf(97KB)
--------sim_norm.eps(10KB)
--------sim_norm_f1.eps(8KB)
--------netflix.png(175KB)
--------doc.bib(899B)
--------rating_f1.eps(8KB)
--------report.tex(17KB)
--------row_norm_f1.eps(8KB)
--------rating.eps(10KB)
----similarity.cpp(3KB)
----postprocess()
--------postprocess.cpp(3KB)
--------makefile(186B)
----rating()
--------rating.cpp(5KB)
--------linear.cpp(1KB)
--------linear.h(586B)
--------makefile(385B)
----datainfo.h(456B)
----compact.cpp(4KB)
----evaluate()
--------prepare_test.sh(167B)
--------evaluate.cpp(3KB)
--------sort_prediction.sh(162B)
--------makefile(170B)
----util.cpp(2KB)
----predict.cpp(6KB)
----LICENSE(18KB)
----README.md(3KB)
----util.h(2KB)
----makefile(487B)
----data()
--------train(2.81MB)
--------test(1.09MB)
--------t_alibaba_data.csv(4.26MB)
----.gitignore(177B)