fuzzyset:python字符串的简单模糊匹配集

时间:2024-06-06 03:26:06
【文件属性】:

文件名称:fuzzyset:python字符串的简单模糊匹配集

文件大小:369KB

文件格式:ZIP

更新时间:2024-06-06 03:26:06

Python

Fuzzyset-用于python的模糊字符串集。 Fuzzyset是一种数据结构,对数据执行类似于全文搜索的操作,以确定可能的拼写错误和近似的字符串匹配。 用法 用法很简单。 只需将一个字符串添加到集合中,然后使用.get或[]要求它: >>> a = fuzzyset.FuzzySet() >>> a.add("michael axiak") >>> a.get("micael asiak") [(0.8461538461538461, u'michael axiak')] 结果将是(score, mached_value)元组的列表。 分数在0到1之间,其中1是完美匹配。 对于大约15%的性能提高,还有一个名为cfuzzyset的Cython实现版本。 因此,您可以编写类似于cStringIO和cPickle的以下内容: try: from cfuzzyset imp


【文件预览】:
fuzzyset-master
----.gitignore(134B)
----README.rst(4KB)
----tests()
--------performance.py(2KB)
--------profile.py(761B)
--------interactive.py(486B)
----MANIFEST.in(152B)
----fake_pyrex()
--------Pyrex()
----setup.py(2KB)
----fuzzyset()
--------cfuzzyset.c(356KB)
--------cfuzzyset.pyx(7KB)
--------__init__.py(4KB)
----cities.gz(304KB)

网友评论