文件名称:word源码java-Chinese_word_segmenter:Chinese_word_segments
文件大小:84.56MB
文件格式:ZIP
更新时间:2024-06-25 16:55:27
系统开源
word源码java 中文分词器 主要用于中法创研中心的“文本情感分析器——多功能应用接口” 该中文分词器基于word分词器 用途特点 中文分词 可排除停止词 多种分词算法 支持分布式 词性标注 同义、反义、拼音标注 词语境计算 相关词 词频统计 文本相似度(10种算法) 判定句子是有意义的人话的可能性 支持应用统计语言模型(即隐含马尔可夫)(二元模型、三元模型) 部分文件功能 word分词器的API可打开 word-1.3 API.html查看 运行demo-word查看分词效果 运行evaluation对分词效果进行评估(评估结果位于target/evaluation目录) 通过计算词的语境来获得相关词 用word分词内置语料库:运行word分词项目根目录下的脚本 demo-word-vector-corpus 使用自己的文本内容:运行word分词项目根目录下的脚本 demo-word-vector-file 运行sentence-identify判定句子是有意义的人话的可能性 pom.xml: Project Object Model, 内含项目依赖版本 项目部署(Build)后
【文件预览】:
Chinese_word_segmenter-master
----classes()
--------artifacts()
----.gitignore(93B)
----demo-word.bat(371B)
----sentence-identify.bat(374B)
----Chinese_word_segmenter.iml(505B)
----src()
--------META-INF()
--------Main.java(4KB)
----demo-word-vector-file.sh(1KB)
----.travis.yml(80B)
----mvnw(7KB)
----evaluation.sh(375B)
----LICENSE.txt(11KB)
----pom.xml(10KB)
----word 1.3 API.html(3KB)
----mvnw.cmd(5KB)
----runJar.bat(350B)
----README.md(2KB)
----demo-word-vector-corpus.sh(1KB)
----demo-word-vector-file.bat(1KB)
----wfs.sh(914B)
----sentence-identify.sh(383B)
----word.jar(44.26MB)
----evaluation.bat(366B)
----demo-word.sh(377B)
----demo-word-vector-corpus.bat(1KB)
----word 1.3 API_files()
--------overview-frame.html(3KB)
--------script.js.下载(827B)
--------overview-summary.html(8KB)
--------allclasses-frame.html(17KB)
--------stylesheet.css(13KB)