文件名称:相似性搜索中的近似算法研究
文件大小:4.02MB
文件格式:PDF
更新时间:2018-01-17 17:06:20
去重
相似性搜索是指对于给定样本对象,在对象集合中查找与之内容最相似的对 象的技术。如何快速地进行相似性搜索一直是研究的热点和难点。目前主流的方 法是使用基于数字指纹的近似搜索策略以达到平衡搜索效率与搜索效果的目的。 这类近似算法的主要思想是利用指纹函数将数据表示成固定长度的二进制数字指 纹,指纹间的差异程度反映了数据对象在原始空间中的相似程度,从而将原始空 间中的搜索问题转换为指纹的匹配问题。然而,现有的近似搜索算法往往因为数 据对象的指纹不够紧凑而效率低下。