正向最大匹配中文分词算法

时间:2016-03-18 03:20:54
【文件属性】:

文件名称:正向最大匹配中文分词算法

文件大小:3.63MB

文件格式:ZIP

更新时间:2016-03-18 03:20:54

中文分词 最大匹配

中文分词一直都是中文自然语言处理领域的基础研究。目前,网络上流行的很多中文分词软件都可以在付出较少的代价的同时,具备较高的正确率。而且不少中文分词软件支持Lucene扩展。但不管实现如何,目前而言的分词系统绝大多数都是基于中文词典的匹配算法。其中最为常见的是最大匹配算法 (Maximum Matching,以下简称MM算法) 。MM算法有三种:一种正向最大匹配,一种逆向最大匹配和双向匹配。本程序实现了正向最大匹配算法。


【文件预览】:
LBChSeg
----LBChSeg.sln(888B)
----LBChSeg.sdf(8.96MB)
----LBChSeg()
--------Segment.h(235B)
--------stdafx.cpp(212B)
--------Dict.cpp(998B)
--------Dict.h(630B)
--------Segment.cpp(3KB)
--------stdafx.h(233B)
--------targetver.h(236B)
--------LBChSeg.vcxproj.user(143B)
--------LBChSeg.cpp(451B)
--------Debug()
--------words.dict(1.59MB)
--------LBChSeg.vcxproj.filters(2KB)
--------ReadMe.txt(2KB)
--------LBChSeg.vcxproj(4KB)
----LBChSeg.suo(14KB)
----ipch()
--------lbchseg-92dfd245()
----Debug()

网友评论

  • 很简单实用的中文分词,帮了大忙
  • 很简单实用的中文分词,帮了大忙
  • 就是太简单了/..
  • 还不错,不过界面有待改进
  • 初学者理解困难
  • 很好,刚好指导自己,感谢分享
  • 比较好的参考资料
  • 不错 拿来参考一下
  • 很不错,初学者理解起来还是有点难
  • 非常不错,收益匪浅,好
  • 用来做中文分词的,很不错。
  • 很好的东西,虽然很简洁,但有了基础可以自己再多做几种方法分词
  • 可以用,利用里面的字典,自己再写了一个逆向的
  • 不错,很好指导我的学习
  • 感谢楼主分享,有帮助!