java分词源码

时间:2011-03-27 09:42:02
【文件属性】:

文件名称:java分词源码

文件大小:191KB

文件格式:ZIP

更新时间:2011-03-27 09:42:02

java 分词

一个java编写的分词程序,词库量为四万多。


【文件预览】:
SAMPLE.txt
www.pudn.com.txt
java
----Segment.java(600B)
----Dictionary.java(947B)
----FMMSegment.java(1KB)
----Dictionary.class(2KB)
----Segment.class(808B)
----FMMSegment.class(1KB)
SDIC.txt

网友评论

  • 还是有一定的帮助,感谢分享!
  • 本代码有不少可借鉴之处:首先运用了数据流操作进行处理 2.字符的处理很不错。
  • 只有划分,没有词性标注