文件名称:ChineseSplitter中文分词(单字、双字、词义)
文件大小:4.5MB
文件格式:RAR
更新时间:2010-10-29 08:40:43
简介
ChineseSplitter中文分词系统集成了单字(一元切分)、双字(二元切分)、词义切分等分词方法。提供很好的权重计算办法。
类结构
BaseSplitter(分词基类)
│
├─SingleSplitter(一元切分)
│
├─DoubleSplitter(二元切分)
│
└─DefaultSplitter(词义切分)────NICTCLAS(中科院分词系统)
KeywordsSort(关键字排序类)
【文件预览】:
ChineseSplitter.suo
项目说明.txt
ChineseSplitter.sln
TestConsoleApplication
----bin()
--------Release()
--------Debug()
----TestConsoleApplication.csproj(3KB)
----Program.cs(1KB)
----obj()
--------Release()
--------Debug()
----Properties()
--------AssemblyInfo.cs(1KB)
ChineseSplitter
----bin()
--------Release()
--------Debug()
----SingleSplitter.cs(7KB)
----obj()
--------Release()
--------Debug()
----KeywordsSort.cs(11KB)
----DefaultSplitter.cs(2KB)
----ChineseSplitter.csproj(3KB)
----DoubleSplitter.cs(9KB)
----Properties()
--------AssemblyInfo.cs(1KB)
----BaseSplitter.cs(2KB)