
http://blog.****.net/pipisorry/article/details/49742907
海量数据挖掘Mining Massive Datasets(MMDs) -Jure Leskovec courses学习笔记 相似项的发现:面向高相似度的方法
{博客内容:More about Locality-Sensitive Hashing:当所能接受的相似度较低时,基于LSH的方法表现得更为有效。但当要找几乎相等的集合时,还存在一些更快的方法,并且这些方法是精准的,即它们会找到所有满足相似度要求的对。也就是说,这里不会像LSH一样有伪反例出现。}
面向高相似度的方法
from:http://blog.****.net/pipisorry/article/details/49742907
ref: