文件名称:CHlikelihood:用于比较两个中文句子相似度的工具
文件大小:3KB
文件格式:ZIP
更新时间:2024-05-22 01:00:04
Python
CHlikelihood 一个用于比较两个中文句子相似度的工具 安装方法 pip install Chlikelihood 使用方法 from CHlikelihood.likelihood import Likelihood a = Likelihood() a.likelihood('很高兴见到你','我也很高兴见到你') >>>0.8164965809277261 原理 分词 很高兴见到你,我也很高兴见到你 划分为 很/高兴/见到/你,我/也/很/高兴/见到/你 汇总所有出现过的词 ['高兴', '也', '你', '我', '很', '见到'] 计算两个句子的词频 句子1: 高兴:1,也:0,你:1,我:0,很:1,见到:1 句子2: 高兴:1,也:1,你:1,我:1,很:1,见到:1 完成句子到向量的转化 句子1:[1,0,1,0,1,1] 句子2:[1,1,1,1,1,1] 计
【文件预览】:
CHlikelihood-master
----CHlikelihood()
--------likelihood.py(2KB)
--------__init__.py(21B)
----README.md(1KB)
----LICENSE.md(1KB)
----setup.py(498B)