[python] Kmeans文本聚类算法+PAC降维+Matplotlib显示聚类图像源码

时间:2019-02-08 22:53:41
【文件属性】:

文件名称:[python] Kmeans文本聚类算法+PAC降维+Matplotlib显示聚类图像源码

文件大小:247KB

文件格式:RAR

更新时间:2019-02-08 22:53:41

python 文本聚类 Kmeans 降维 Matplotlib

该资源主要参考我的博客: [python] Kmeans文本聚类算法+PAC降维+Matplotlib显示聚类图像 http://blog.csdn.net/eastmount/article/details/50545937 包括输入文档txt,共1000行数据,每行都是分词完的文本。 本文主要讲述以下几点: 1.通过scikit-learn计算文本内容的tfidf并构造N*M矩阵(N个文档 M个特征词); 2.调用scikit-learn中的K-means进行文本聚类; 3.使用PAC进行降维处理,每行文本表示成两维数据; 4.最后调用Matplotlib显示聚类效果图。 免费资源,希望对你有所帮助~ By Eastmount


【文件预览】:
python kmeans
----01_All_BHSpider_Content_Result.txt(1022KB)
----01_sklearn_tfidf_cluster_content.py(5KB)

网友评论

  • 好人一生平安
  • 很好的资源
  • 很好,改一下文本文件的路径就可以运行。谢谢分享!
  • 垃圾 代码不全
  • 和好的资源,好用
  • 用起来还凑合吧
  • 垃圾 代码不全
  • 可以用,数据格式很有意思。
  • 不好用,东西不全
  • 这个我用过了,可以用!
  • 可以运行 非常不错
  • 下载后不能正常使用.
  • 可以使用,赞个
  • 很好的示例,感谢分享