java版中文汉字字频统计

时间:2015-11-30 17:11:08
【文件属性】:

文件名称:java版中文汉字字频统计

文件大小:4KB

文件格式:JAVA

更新时间:2015-11-30 17:11:08

中文 汉字 字频 统计 java

该程序是一个java的中文汉字字频统计,从诸如txt文件中读取语料,然后生成一个前100个高频汉字的字频统计结果的txt文件,并且还会生成前100、200、600、2000、等汉字的字频和的另一个txt文件。该程序是借用treeMap来实现数据的储存的,很方便。输入语料文件名时是要输入全名的,例如:E:\1.txt


网友评论

  • 代码很好的,基于这个代码可以做出更多的统计结果可以适用于各个文档的字频统计,自己还可以改写代码实现词频的统计
  • 老师布置的作业,参考很有用,自己根据这个写出了词频统计。
  • 惊喜,字频统计写的很好
  • 能统计出来,可以试试。
  • 很不错的代码,有个缺点就是没有返回异常,不过已经很好了
  • 只是字频统计,做好有词频统计,这样更实用些
  • 很好,代码可用。基于这个代码可以做出更多的统计结果
  • 代码很好的,可以适用于各个文档的字频统计,自己还可以改写代码实现词频的统计