word源码java-Chinese_word_segmenter:Chinese_word

【文件属性】：

文件名称：word源码java-Chinese_word_segmenter:Chinese_word_segments

文件大小：84.56MB

文件格式：ZIP

更新时间：2024-06-25 16:55:27

系统开源

word源码java 中文分词器主要用于中法创研中心的“文本情感分析器——多功能应用接口” 该中文分词器基于word分词器用途特点中文分词可排除停止词多种分词算法支持分布式词性标注同义、反义、拼音标注词语境计算相关词词频统计文本相似度(10种算法) 判定句子是有意义的人话的可能性支持应用统计语言模型(即隐含马尔可夫)(二元模型、三元模型) 部分文件功能 word分词器的API可打开 word-1.3 API.html查看运行demo-word查看分词效果运行evaluation对分词效果进行评估(评估结果位于target/evaluation目录) 通过计算词的语境来获得相关词用word分词内置语料库：运行word分词项目根目录下的脚本 demo-word-vector-corpus 使用自己的文本内容：运行word分词项目根目录下的脚本 demo-word-vector-file 运行sentence-identify判定句子是有意义的人话的可能性 pom.xml: Project Object Model, 内含项目依赖版本项目部署(Build)后

立即下载

【文件预览】：
Chinese_word_segmenter-master
----classes()
--------artifacts()
----.gitignore(93B)
----demo-word.bat(371B)
----sentence-identify.bat(374B)
----Chinese_word_segmenter.iml(505B)
----src()
--------META-INF()
--------Main.java(4KB)
----demo-word-vector-file.sh(1KB)
----.travis.yml(80B)
----mvnw(7KB)
----evaluation.sh(375B)
----LICENSE.txt(11KB)
----pom.xml(10KB)
----word 1.3 API.html(3KB)
----mvnw.cmd(5KB)
----runJar.bat(350B)
----README.md(2KB)
----demo-word-vector-corpus.sh(1KB)
----demo-word-vector-file.bat(1KB)
----wfs.sh(914B)
----sentence-identify.sh(383B)
----word.jar(44.26MB)
----evaluation.bat(366B)
----demo-word.sh(377B)
----demo-word-vector-corpus.bat(1KB)
----word 1.3 API_files()
--------overview-frame.html(3KB)
--------script.js.下载(827B)
--------overview-summary.html(8KB)
--------allclasses-frame.html(17KB)
--------stylesheet.css(13KB)

秒客网

word源码java-Chinese_word_segmenter:Chinese_word_segments

网友评论

相关文章