文件名称:JobMarketAnalysis:基于大数据技术的就业市场分析
文件大小:3.31MB
文件格式:ZIP
更新时间:2024-07-15 07:13:46
Java
就业市场分析 基于大数据技术的就业市场分析 该项目通过使用公开可用的纽约市开放数据数据集进行预测,探索纽约市就业市场的高薪工作技能和薪水。 许多不同的参数和非参数模型已被证明可以在某些数据集上达到良好的精度水平。 • 项目探讨了高薪工作技能和薪水与工作经验的关系• 从开放数据集中收集数据并解析、标记化、过滤数据• 编写了在 Hadoop 中处理数据的 Map 和 reduce 函数• 在本地和 Amazon EMR 上测试和运行
【文件预览】:
JobMarketAnalysis-master
----presentation-v3.1.pptx(1.31MB)
----src()
--------TweetNumberN.java(2KB)
--------JobNYCParser.java(4KB)
--------JobNYCReducer.java(603B)
--------JobTXReducer.java(602B)
--------JobNYCMapper.java(883B)
--------TakeMost.java(439B)
--------ReadLine.java(1KB)
--------Function.java(644B)
--------.DS_Store(6KB)
--------StopWords.java(762B)
--------JobTX.java(982B)
--------JobTXParser.java(3KB)
--------JobTXMapper.java(1KB)
--------MergeTX.java(1KB)
--------JobNYC.java(987B)
--------FunctionTX.java(168B)
--------JobTXNew.java(463B)
--------JobNew.java(1KB)
----bin()
--------JobNew.class(1KB)
--------JobNYCReducer.class(2KB)
--------JobTXNew.class(948B)
--------StopWords.class(2KB)
--------JobTXMapper.class(3KB)
--------JobTX.class(1KB)
--------JobTXReducer.class(2KB)
--------MergeTX.class(2KB)
--------TweetNumberN$Reduce.class(2KB)
--------.DS_Store(6KB)
--------ReadLine.class(2KB)
--------TakeMost.class(673B)
--------FunctionTX.class(534B)
--------JobNYC.class(1KB)
--------JobNYCParser.class(4KB)
--------TweetNumberN.class(2KB)
--------TweetNumberN$Map.class(3KB)
--------JobNYCMapper.class(2KB)
--------JobTXParser.class(4KB)
--------Function.class(719B)
----Firstweb()
--------data1.csv(452B)
--------.classpath(520B)
--------.mymetadata(290B)
--------.settings()
--------.project(2KB)
--------WebRoot()
----.DS_Store(6KB)
----StopWords.java(726B)
----stopwords.txt(953B)
----result(ave_salary)()
--------_SUCCESS(0B)
--------_logs()
--------part-r-00000(336B)
----README.md(680B)
----jobTXn.txt(2.83MB)
----output_full.json(3.52MB)
----JSChart()
--------index copy.html(2KB)
--------index_with_json.html(376B)
--------.DS_Store(6KB)
--------index_with_xml.html(374B)
--------data.json(4KB)
--------index.html(3KB)
--------data.xml(3KB)
--------output.json(3.52MB)
----result(skill statistic)()
--------_SUCCESS(0B)
--------_logs()
--------part-00000(41KB)