RapidFuzz:使用Levenshtein距离的Python快速模糊字符串匹配

时间:2024-02-20 08:54:24
【文件属性】:

文件名称:RapidFuzz:使用Levenshtein距离的Python快速模糊字符串匹配

文件大小:3.9MB

文件格式:ZIP

更新时间:2024-02-20 08:54:24

python cpp levenshtein levenshtein-distance string-matching

使用Levenshtein距离的Python和C ++快速模糊字符串匹配 ••• 描述 RapidFuzz是适用于Python和C ++的快速字符串匹配库,它使用的字符串相似度计算。 但是,有两个方面使RapidFuzz与FuzzyWuzzy脱颖而出: 它已获得MIT许可,因此可以为您的项目选择想要使用的任何许可,而在使用FuzzyWuzzy时则必须采用GPL许可 它主要是用C ++编写的,并且最重要的是,它对算法进行了许多改进,以使字符串匹配更快,同时仍提供相同的结果。 有关这些性能改进的更多详细信息,可以以基准测试形式在找到 要求 Python 2.7或更高版本 在Windows上,需要 安装 有多种安装RapidFuzz的方法,推荐的方法是使用pip (Python软件包管理器)或conda (开源,跨平台的软件包管理器) 带点 RapidFuzz可以通过以下方式通过pip安装: pip install rapidfuzz 有针对MacOS(10.9和更高版本),Linux x86_64和Windows的RapidFuzz的预构建二进制文件。 piwheel上提供了


网友评论