字符串子序列工具:识别一对字符串的公共子串-matlab开发

时间:2024-06-19 15:56:52
【文件属性】:

文件名称:字符串子序列工具:识别一对字符串的公共子串-matlab开发

文件大小:5KB

文件格式:ZIP

更新时间:2024-06-19 15:56:52

matlab

徐志平在 FEX 上的提交引起了我的兴趣。 我知道它必须更有效。 长字符串很常见,因此拥有高效的代码非常有意义。 您可能会发现这些工具对于检查 DNA 碱基串或检查学生提交的作业是否有抄袭内容很有趣。 当然还有其他用途。 commonsubstring.m 函数相当有效地执行此搜索(尽管我相信它也可以增强。) 生成一对长随机字母序列,然后确定它们之间的最长公共子串。 在以下示例中,每个原始字符串中都有 10^5 个随机元素。 基地 = 'acgt'; str1 = bases(ceil(rand(1,100000)*4)); str2 =基数(ceil(rand(1,100000)* 4)); tic,[substr,ind1,ind2] = commonsubstring(str1,str2);toc 经过的时间是 16.650532 秒。 找到了两个最大长度 (16) 个字符


【文件预览】:
SubstringTools.zip

网友评论