文件名称:去重算法Similarity
文件大小:15KB
文件格式:RAR
更新时间:2016-08-01 11:14:01
shingling minhash simhash 汉明距离
实现了SimHash算法、MinHash算法、Shingling算法、汉明距离、Jaccard Index。供初学者参考
【文件预览】:
SimilarityAlgorithms
----.project(396B)
----src()
--------sim()
--------todo.txt(72B)
----.settings()
--------org.eclipse.jdt.core.prefs(629B)
----.classpath(301B)
----bin()
--------sim()
--------todo.txt(72B)