seqsim:用于计算序列相似度(尤其是字符串相似度)的Python包

时间:2024-04-27 15:08:01
【文件属性】:

文件名称:seqsim:用于计算序列相似度(尤其是字符串相似度)的Python包

文件大小:617KB

文件格式:ZIP

更新时间:2024-04-27 15:08:01

Python

序号 Python库,用于计算可散列数据类型序列的距离和相似度。 虽然seqsim是作为通用库开发的, seqsim其主要目的是用于文化进化特别是文本传统文化进化领域的研究中。 一些方法充当标准Python库或其他库(例如。 安装 在任何标准的Python环境中, seqsim均可通过以下方式安装: $ pip install seqsim 用法 该库提供了不同的方法来比较任意可哈希元素的序列。 可以混合序列和元素类型。 提供了完整的文档,提供了几乎完整的代码。 对于大多数常见用法,可以使用wrapper .distance()函数。 >> > import seqsim >> > seqsim . edit . levenshtein_dist ( "kitten" , "string" ) 5 >> > seqsim . edit . levenshtein_dist ( "


【文件预览】:
seqsim-main
----setup.py(2KB)
----.gitignore(1KB)
----requirements.txt(27B)
----.readthedocs.yml(155B)
----src()
--------__init__.py(30B)
--------seqsim()
----AUTHORS.md(179B)
----LICENSE(1KB)
----setup.cfg(69B)
----.github()
--------workflows()
----README.md(7KB)
----tests()
--------test_compression.py(1KB)
--------test_edit.py(11KB)
--------test_token.py(3KB)
--------test_common.py(1KB)
--------test_sequence.py(1KB)
--------test_general.py(2KB)
----extra()
--------readme_compare.py(881B)
--------simhash.py(6KB)
--------masscomp_tiago.py(619B)
----docs()
--------scriptorium.jpg(327KB)
--------Makefile(634B)
--------index.rst(9KB)
--------conf.py(2KB)
--------modules.rst(55B)
--------seqsim.rst(944B)
--------source()
--------scriptorium_small.jpg(252KB)

网友评论