文件名称:KTDictSeg 中英文分词组件
文件大小:1015KB
文件格式:RAR
更新时间:2010-06-13 12:54:48
中文 准确 分词 高效
KTDictSeg 简介: KTDictSeg 是由KaiToo搜索开发的一款基于字典的简单中英文分词算法
主要功能: 中英文分词,未登录词识别,多元歧义自动识别,全角字符识别能力
主要性能指标:
分词准确度:90%以上(有待专家的权威评测)
处理速度: 600KBytes/s
版本: V1.0 Bata
Copyright(c) 2007 http://www.kaitoo.com
作者:肖波
授权: 开源GPL
公司网站: http://www.kaitoo.com
【文件预览】:
FTAlgorithm
----mssccprj.scc(174B)
----ExtractWords.cs(11KB)
----CException.cs(10KB)
----CFileException.cs(2KB)
----bin()
--------Debug()
----obj()
--------FTAlgorithm.csproj.FileList.txt(150B)
--------Debug()
----CRegex.cs(12KB)
----Properties()
--------AssemblyInfo.cs(1KB)
--------vssver2.scc(107B)
----CStream.cs(3KB)
----Dfa.cs(7KB)
----CFile.cs(19KB)
----FTAlgorithm.csproj(2KB)
----vssver2.scc(131B)
Demo
----Demo.sln(2KB)
----bin()
--------Debug()
----obj()
--------Demo.csproj.FileList.txt(350B)
--------Debug()
----FormDemo.Designer.cs(16KB)
----Properties()
--------Resources.Designer.cs(3KB)
--------Settings.settings(249B)
--------Resources.resx(5KB)
--------Settings.Designer.cs(1KB)
--------AssemblyInfo.cs(1KB)
----Program.cs(466B)
----Demo.suo(23KB)
----FormDemo.cs(4KB)
----Demo.csproj(3KB)
----FormDemo.resx(6KB)
DictSeg
----bin()
--------Debug()
----obj()
--------KTDictSeg.csproj.FileList.txt(188B)
--------Debug()
----Properties()
--------AssemblyInfo.cs(1KB)
----KTDictSeg.csproj(2KB)
----SimpleDictSeg.cs(8KB)
说明.txt