文件名称:字符串距离
文件大小:24KB
文件格式:RAR
更新时间:2015-03-25 12:32:30
字符串距离 编辑距离 LCS相似度 N-gram相似度
开发计算两个字符串间的编辑距离,LCS距离和N-gram距离的函数。 (1)编辑距离 字符串a和b的编辑距离ED(i,j)表示把字符串a转换成b所需要的最少操作次数,这些操作可以是:插入一个字符,删除一个字符,替换一个字符。 (2)LCS相似度 字符串a和b的LCS(Longest Common Subsequence)相似度是a和b间的最大相同子串的长度。显然LCS(i,j)越大,a,b越相似。 (3)N-gram相似度 设Ngram(a) 是字符串a中长度为N的子串的集合。两个字符串a,b的N-gram相似度NG(a,b)定义如下: NG(a,b)越大,字符串a,b越相似。
【文件预览】:
StringDistance
----main.cpp(15KB)
----bin()
--------Debug()
----obj()
--------Debug()
----StringDistance.layout(243B)
----StringDistance.depend(193B)
----StringDistance.cbp(1KB)