ChineseSplitter中文分词(单字、双字、词义)

时间:2010-10-29 08:40:43
【文件属性】:

文件名称:ChineseSplitter中文分词(单字、双字、词义)

文件大小:4.5MB

文件格式:RAR

更新时间:2010-10-29 08:40:43

简介
ChineseSplitter中文分词系统集成了单字(一元切分)、双字(二元切分)、词义切分等分词方法。提供很好的权重计算办法。

类结构
BaseSplitter(分词基类)

├─SingleSplitter(一元切分)

├─DoubleSplitter(二元切分)

└─DefaultSplitter(词义切分)────NICTCLAS(中科院分词系统)

KeywordsSort(关键字排序类)


【文件预览】:
ChineseSplitter.suo
项目说明.txt
ChineseSplitter.sln
TestConsoleApplication
----bin()
--------Release()
--------Debug()
----TestConsoleApplication.csproj(3KB)
----Program.cs(1KB)
----obj()
--------Release()
--------Debug()
----Properties()
--------AssemblyInfo.cs(1KB)
ChineseSplitter
----bin()
--------Release()
--------Debug()
----SingleSplitter.cs(7KB)
----obj()
--------Release()
--------Debug()
----KeywordsSort.cs(11KB)
----DefaultSplitter.cs(2KB)
----ChineseSplitter.csproj(3KB)
----DoubleSplitter.cs(9KB)
----Properties()
--------AssemblyInfo.cs(1KB)
----BaseSplitter.cs(2KB)

网友评论

  • 有一定的参考价值
  • 这个分词系统太老了