文件名称:pyahocorasick:实现Aho-Corasick算法的Python模块(C扩展和纯Python)
文件大小:129KB
文件格式:ZIP
更新时间:2024-05-22 23:40:22
trie string-manipulation automaton aho-corasick C
脓胸病 pyahocorasick是一个快速且内存有效的库,用于精确或近似的多模式字符串搜索,这意味着您可以在某些输入文本中一次找到多个键字符串。 该库提供了一个ahocorasick Python模块,您可以将其用作类似于dict的Trie,也可以将Trie转换为自动机以进行有效的Aho-Corasick搜索。 它是用C实现的,并在Python 2.7和3.4+上进行了测试。 它可以在Linux,Mac和Windows上运行。 为BSD-3条款。 一些实用程序(例如测试和纯Python自动机)专用于Public Domain。 下载和源代码 您可以从以下位置获取pyahocorasick : GitHub Pypi conda伪造 快速开始 该模块是用C编写的。您需要安装C编译器来编译本机CPython扩展。 安装: pip install pyahocorasick 然后