字符串距离

时间:2015-03-25 12:32:30
【文件属性】:

文件名称:字符串距离

文件大小:24KB

文件格式:RAR

更新时间:2015-03-25 12:32:30

字符串距离 编辑距离 LCS相似度 N-gram相似度

开发计算两个字符串间的编辑距离,LCS距离和N-gram距离的函数。 (1)编辑距离 字符串a和b的编辑距离ED(i,j)表示把字符串a转换成b所需要的最少操作次数,这些操作可以是:插入一个字符,删除一个字符,替换一个字符。 (2)LCS相似度 字符串a和b的LCS(Longest Common Subsequence)相似度是a和b间的最大相同子串的长度。显然LCS(i,j)越大,a,b越相似。 (3)N-gram相似度 设Ngram(a) 是字符串a中长度为N的子串的集合。两个字符串a,b的N-gram相似度NG(a,b)定义如下: NG(a,b)越大,字符串a,b越相似。


【文件预览】:
StringDistance
----main.cpp(15KB)
----bin()
--------Debug()
----obj()
--------Debug()
----StringDistance.layout(243B)
----StringDistance.depend(193B)
----StringDistance.cbp(1KB)

网友评论

  • 嗯,实现的功能很全,但是显得有点乱。
  • 没什么用 谁有N-gram的源代码可以分享一下啊
  • 写在一个文件里,看着不舒服
  • 还以为是源码,就是.exe,这种东西放上来有什么用?