KTDictSeg 中英文分词组件

时间:2010-06-13 12:54:48
【文件属性】:

文件名称:KTDictSeg 中英文分词组件

文件大小:1015KB

文件格式:RAR

更新时间:2010-06-13 12:54:48

中文 准确 分词 高效

KTDictSeg 简介: KTDictSeg 是由KaiToo搜索开发的一款基于字典的简单中英文分词算法
主要功能: 中英文分词,未登录词识别,多元歧义自动识别,全角字符识别能力
主要性能指标:
分词准确度:90%以上(有待专家的权威评测)
处理速度: 600KBytes/s

版本: V1.0 Bata
Copyright(c) 2007 http://www.kaitoo.com
作者:肖波
授权: 开源GPL
公司网站: http://www.kaitoo.com


【文件预览】:
FTAlgorithm
----mssccprj.scc(174B)
----ExtractWords.cs(11KB)
----CException.cs(10KB)
----CFileException.cs(2KB)
----bin()
--------Debug()
----obj()
--------FTAlgorithm.csproj.FileList.txt(150B)
--------Debug()
----CRegex.cs(12KB)
----Properties()
--------AssemblyInfo.cs(1KB)
--------vssver2.scc(107B)
----CStream.cs(3KB)
----Dfa.cs(7KB)
----CFile.cs(19KB)
----FTAlgorithm.csproj(2KB)
----vssver2.scc(131B)
Demo
----Demo.sln(2KB)
----bin()
--------Debug()
----obj()
--------Demo.csproj.FileList.txt(350B)
--------Debug()
----FormDemo.Designer.cs(16KB)
----Properties()
--------Resources.Designer.cs(3KB)
--------Settings.settings(249B)
--------Resources.resx(5KB)
--------Settings.Designer.cs(1KB)
--------AssemblyInfo.cs(1KB)
----Program.cs(466B)
----Demo.suo(23KB)
----FormDemo.cs(4KB)
----Demo.csproj(3KB)
----FormDemo.resx(6KB)
DictSeg
----bin()
--------Debug()
----obj()
--------KTDictSeg.csproj.FileList.txt(188B)
--------Debug()
----Properties()
--------AssemblyInfo.cs(1KB)
----KTDictSeg.csproj(2KB)
----SimpleDictSeg.cs(8KB)
说明.txt

网友评论

  • 可以用,你们有编译好的exe,可以直接运行,自己应该可以调用它的组件,还没试
  • 能运行,还不错
  • 下载了,不会用,不过看别人的评论不错
  • 已经下了,看结构感觉还不错,正好能用到我的项目里面,分词速度待检测
  • 分词准确率高,很好用!