文件名称:婚姻八字测算java源码-jcseg:赛格
文件大小:4.24MB
文件格式:ZIP
更新时间:2024-06-26 12:48:38
系统开源
婚姻八字测算java源码 Jcseg是什么? Jcseg是基于mmseg算法的一个轻量级开源中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了最新版本的lucene, solr, elasticsearch的分词接口, Jcseg自带了一个 jcseg.properties文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加同义词等! Jcseg核心功能: 中文分词:mmseg算法 + Jcseg 独创的优化算法。 关键字提取:基于textRank算法。 关键短语提取:基于textRank算法。 关键句子提取:基于textRank算法。 文章自动摘要:基于BM25+textRank算法。 自动词性标注:目前只是基于词库,效果不是很理想。 Restful api:嵌入jetty提供了一个绝对高性能的server模块,包含全部功能的http接口,标准化json输出格式,方便各种语言客户端直接调用。 Jcseg中文分词: 三种切分模式: (1).简易模式:FMM算法,适合速度要求场合。 (2)