Python-TextSimilarity使用不同的方法计算相似度

时间:2022-08-30 09:35:39
【文件属性】:

文件名称:Python-TextSimilarity使用不同的方法计算相似度

文件大小:9KB

文件格式:ZIP

更新时间:2022-08-30 09:35:39

Python开发-其它杂项

这是一个类,里面包含的有关文本相似度的常用的计算算法,例如,最长公共子序列,最短标记距离,TF-IDF等算法 例如简单简单简单的用法:创建类实例,参数是两个文件目录,之后会生成两个字符串a.str_a, a.str_b


【文件预览】:
text-similarity-master
----.gitignore(1KB)
----EasySimilarity()
--------__init__.py(58B)
--------simutils.py(362B)
--------common.py(98B)
----LICENSE(1KB)
----textSimilarity.py(9KB)
----README.md(4KB)

网友评论