文件名称:Linkedin:在数据分析师职位信息上进行文本挖掘
文件大小:470KB
文件格式:ZIP
更新时间:2024-06-03 08:37:45
JavaScript
在数据分析师职位信息上进行文本挖掘 概述 为了获得与数据分析师职位相关的必要详细信息,我计划从linkedin中抓取职位信息,并实施文本挖掘以了解雇主的一般性要求或可取性要求。 Web抓取所有数据分析师职位-Python 通常,在此过程中存在两个问题。 登录问题: 使用请求会话登录(我使用过)b。 Selenium(慢/需要保留登录历史记录) Ajax问题:如何识别和查找我们想要覆盖的数据。 职位信息的文本挖掘 预处理:Nan值删除停用词列表创建将所有字母都以小写字母删除标点符号删除停用词删除其他空格 词频和共现分析 选择城市图形制图工作分布技能集频率索引重要性关键词云图主题分析 结果 频率分析 为了充分了解频率,我删除了无意义的单词以及过于频繁的单词(例如数据)。 基于云这个词,我们可以看作是一个数据分析师,它主要需要分析,报告,可能实现的工作。 雇主希望您具有业务意识,管理和团队
【文件预览】:
Linkedin-master
----1_linkedin_scapping.py(4KB)
----graph()
--------Rplot01.png(55KB)
--------WordCloud.png(274KB)
--------Rplot02.png(43KB)
----textminig.R(11KB)
----README.md(2KB)
----vis()
--------lda.json(74KB)
--------ldavis.js(52KB)
--------lda.css(291B)
--------index.html(405B)
--------d3.v3.js(302KB)
----topic_analysis.htm(421B)
----1_job_position.py(2KB)