相似度:相似度:相似度计算工具包,java编写。用于词,短语,句子,词法分析,情感分析,语义分析等相关的相似度计算

时间:2024-02-24 09:09:13
【文件属性】:

文件名称:相似度:相似度:相似度计算工具包,java编写。用于词,短语,句子,词法分析,情感分析,语义分析等相关的相似度计算

文件大小:22.45MB

文件格式:ZIP

更新时间:2024-02-24 09:09:13

nlp semantic sentiment similarity lexical-analysis

相似 适用词,语法,句子,词法分析,情感分析,语义分析等相关的相似度计算。 相似度是由一系列算法组成的Java版相似度计算工具包,目标是传播自然语言处理中相似度计算方法。相似度是工具实用,性能高效,架构清晰,语料时新,可自定义的特点。 相似性提供下列功能: 词相似度计算 词林编码法相似度 汉语语义法相似度 知网词相似度 字面编辑距离法 初步相似度计算 简单而言相似度 句子相似度计算 词性和词序结合法 编辑距离算法 Gregor编辑距离法 优化编辑距离法 文本相似度计算 余弦相似度 编辑距离算法 欧几里得距离 雅卡德相似性系数 Jaro距离 Jaro–Winkler距离 曼哈顿距离 SimHash +汉明距离 Sørensen–Dice系数 词法分析 xmnlp中文分词 分词词性标注 词频统计 知网义原 义原树 情感分析 正面实力程度 明显潜力程度 情感倾向性 近似词 word2vec 在提供丰富功能的同时,相似性内部模块坚持低耦合,模型坚持惰性加载,词典坚持明文发布,使用方便,帮助用户培训自己的语料。 演示 去做 文本相似性指标 关键词匹配(TF-IDF,BM25) 浅层语义匹配(


网友评论