文件名称:edlib:轻量级,超快速CC ++(&Python)库,用于使用编辑(Levenshtein)距离进行序列比对
文件大小:4.16MB
文件格式:ZIP
更新时间:2024-02-23 10:49:38
python c-plus-plus library bioinformatics edit-distance
Edlib· 一个轻量级且超快速的C / C ++库,用于使用进行序列比对。 计算两个字符串的编辑距离很简单: edlibAlign ( " hello " , 5 , " world! " , 6 , edlibDefaultAlignConfig()).editDistance; Edlib也可用于Python ,代码位于 。 @cjdoris也了非官方的。 产品特点 计算编辑距离(Levenshtein距离) 。 它可以找到最佳的比对路径(有关如何将第一个序列转换为第二个序列的说明)。 它只能找到对齐路径的开始和/或结束位置-当速度比拥有精确的对齐路径更重要时,它很有用。 支持多种:global( NW ),prefix( SHW )和infix( HW ),它们分别对不同的场景有用。 您可以扩展字符相等性定义,使您可以使用通配符,不区分大小写的对齐方式或使用简并核苷酸。 即使找到对齐路径,它也可以轻松处理小的序列或非常大的序列,而占用的内存却很少。 得益于Myers的位向量算法,超级快。 内容 建造 介子 构建Edlib的主要方法是通过构建工具。 要求