北京地区网络招聘信息文本挖掘.rar

时间:2022-09-04 13:27:27
【文件属性】:

文件名称:北京地区网络招聘信息文本挖掘.rar

文件大小:2.02MB

文件格式:RAR

更新时间:2022-09-04 13:27:27

python爬虫 词云 词向量 K-means文本聚类 网络招聘

使用python对51job的招聘信息进行爬虫,使用python对职位信息输出词云,词频统计图,使用jieba库进行分词,然后使用gensim的word2vec进行词向量训练,然后使用sklearn的k-means算法进行聚类。压缩包内有代码,数据,简单的小论文文档,代码来源于网络,论文自己写的,水平一般。代码在anaconda的spyder开发环境可以正常运行。


【文件预览】:
k_means_.py
test_k_means.py
usedwordcloud.py
jobname_wc.py
职位文本信息词云与文本聚类.docx
51job_spyder.py
jobnae_wordcloud.png
kmstrcluster.py
jobname原.txt

网友评论