分词及词频统计.rar

时间:2011-11-22 06:43:46
【文件属性】:

文件名称:分词及词频统计.rar

文件大小:4.83MB

文件格式:RAR

更新时间:2011-11-22 06:43:46

分词及词频统计

1. 解压缩后运行freqci.exe即可。 2. 文件夹code里是程序源代码,其中freqci.pjx是项目文件。 3. 本程序以VFP9编写,可在VFP9环境下打开项目文件查看源代码。 4. 本程序的分词只用了最简单的最大匹配法。 5. 本程序所用词表是从拼音加加的词表中整理出来的。


【文件预览】:
FOXUSER.DBF
freqci.exe
vfp9r.dll
cibiao.CDX
code
----config.fpw(12B)
----freqci.PJX(2KB)
----freqci.PJT(8KB)
----BOOK06.ICO(766B)
----freqci_main.prg(1KB)
----freqci.SCT(22KB)
----freqci.scx(5KB)
----freqci_proc.prg(3KB)
vfp9rchs.dll
vfp9t.dll
FOXUSER.FPT
VFP9RENU.DLL
cibiao.dbf
说明.txt

网友评论

  • 统计出来的是乱码
  • 太好了,这就是我想要的
  • 开源的不会用,执行程序功能又不完善,真心纠结
  • 代码可以使用,但是需要自己配置词库
  • 没有源代码,也没有词库
  • 为什么我的结果全是单独的一个个的汉字?
  • 代码可以用。不错
  • 非常好,能够对txt进行分词和词频统计
  • 非常好,能够对txt进行分词和词频统计
  • 最大前缀匹配准则来做的代码应该可以优化一下