文本分类系统

时间:2017-07-07 09:26:14
【文件属性】:

文件名称:文本分类系统

文件大小:1.85MB

文件格式:ZIP

更新时间:2017-07-07 09:26:14

文本分类

TextClassify文本分类系统适用于中文,英文文本分类。 包括各个文本的关键词输出,可以控制关键词输出个数,也可以对关键词加入黑名单和白名单。 关于TextClassify文本分类系统的改进: 改进jieba中文分词词典 改进黑名单:增加停用词 改进白名单:增加专业词 在TextProcess改进每一类text至多选FileInFolder个:理论上越多越好 deleteN的选取:可以优化 特征词的长度限定:unicode不过长,不过短 特征词词典dict_size的选取:可以优化 特征的改进 多分类结合的算法改进


【文件预览】:
文本分类系统
----stopwords.txt(10KB)
----TextFeature.pyc(3KB)
----jieba_dict.txt(5.17MB)
----Main.py(10KB)
----TextProcess.pyc(7KB)
----TextEvaluation.pyc(867B)
----TextClassify.pyc(3KB)

网友评论

  • 文件打不开