Levenshtein_search:Python搜索模块,用于快速近似字符串匹配

时间:2024-03-29 04:10:12
【文件属性】:

文件名称:Levenshtein_search:Python搜索模块,用于快速近似字符串匹配

文件大小:24KB

文件格式:ZIP

更新时间:2024-03-29 04:10:12

C

Levenshtein_search 作者:马特·安德森(Matt Anderson)。 2016-2019 Levenshtein_search是一个Python模块,可将任意数量的文档存储为三元搜索树。 它对距查询词d距离的文档中的词执行模糊搜索。 搜索也可以与TF-IDF计算结合使用。 频率(TF)一词是针对文档中每个近似匹配的词以及与查询词之间的Levenshtein距离计算的。 该模块用C语言编写,通过使用图搜索算法并最大程度地减少了冗余比较的数量,提高了搜索速度。 用法 import Levenshtein_search excerpt1 = [ "We" , "went" , "to" , "the" , "fire" , "Mother" , "said" , "Is" , "he" , "cold" , "Versh" , "Nome" , "Versh" , "sa


【文件预览】:
Levenshtein_search-master
----setup.py(579B)
----.gitignore(436B)
----.manylinux-install.sh(653B)
----requirements.txt(5B)
----.manylinux.sh(236B)
----.travis.yml(2KB)
----LICENSE(34KB)
----setup.cfg(25B)
----Lev_search.c(27KB)
----README.md(6KB)
----tests()
--------test_levenshtein.py(3KB)
----appveyor.yml(1KB)

网友评论