A Fast Approximate Nearest Neighbor Search Algorithm in the Hamming Space

时间:2017-09-08 10:36:35
【文件属性】:

文件名称:A Fast Approximate Nearest Neighbor Search Algorithm in the Hamming Space

文件大小:788KB

文件格式:PDF

更新时间:2017-09-08 10:36:35

Hamming 汉明距离 近邻查询

该文献的主要思想是:输入文件的哈希值(我用的是文件名)例如一个64位的哈希值,多次随机抽取若干位(例如4位)的值组成一个字串,按照字串值的不同将文件放入不同的哈希桶中。这样一个64位哈希值将被放入64/4=16个桶中,查询时把所有查询点也哈希成64位哈希值,按照相同的方式随机抽取,把所在桶中所有的字符串全部拿出来做候选集。同时,为了进一步提高查全率设定一个权重值(度量汉明距离),准备一个汉明字典将所有字串和其他汉明字串的值记录用以将权重值内的桶的字符串也做为候选集。


网友评论