文件名称:sentiment-analysis:GitHub 提交评论上的分布式情绪分析
文件大小:733KB
文件格式:ZIP
更新时间:2024-06-20 12:55:25
Python
该存储库包含对来自 GitHub ( ) 的大型 Git 提交评论数据集执行情感分析所需的所有代码。 该代码旨在在 LIACS 的分布式 ASCI 超级计算机 3 (DAS-3) 上运行。 它利用 Apache Hadoop 的 HDFS 和 MapReduce 来执行情绪分析。 先决条件 下面提到的版本号已经过验证。 不同的版本也可能有效。 Git 1.7.1 或 2.3.x 带库的 Python 2.7.9(详见下面的安装说明) 克隆存储库 第一步是克隆存储库以获取代码的本地副本。 打开终端窗口并运行以下命令。 $ git clone https://github.com/timvandermeij/sentiment-analysis.git $ cd sentiment-analysis 运行代码 所有代码都是用 Python 编写的。 要运行简单的情感分析程序,请执行:
【文件预览】:
sentiment-analysis-master
----words()
--------negative.txt(44KB)
--------positive.txt(19KB)
----unrecognized.py(2KB)
----.gitignore(468B)
----plot.py(7KB)
----ssh-setup.sh(2KB)
----label.py(2KB)
----experiment.py(3KB)
----LICENSE.md(1KB)
----Report()
--------Report.tex(79KB)
--------Makefile(485B)
--------Report.bib(4KB)
--------Images()
----memtime.sh(271B)
----tree.py(515B)
----analyze.py(2KB)
----utils.py(4KB)
----README.md(25KB)
----reducer.py(798B)
----algorithms.json(6KB)
----preprocess.py(14KB)
----plots()
--------experiment_results-SGD_classifier,_loss=huber.pdf(18KB)
--------experiment_results-SGD_classifier,_loss=hinge.pdf(18KB)
--------all-language-RandomForest-neg.pdf(17KB)
--------experiment_results-SGD_classifier,_loss=epsilon_insensitive.pdf(18KB)
--------experiment_results-Multinomial_naive_Bayes_classifier.pdf(13KB)
--------experiment_results-Random_forest_classifier.pdf(12KB)
--------experiment_results-Gaussian_naive_Bayes_classifier.pdf(11KB)
--------experiment_results-Ridge_classifier,_solver=cholesky.pdf(14KB)
--------experiment_results-SGD_classifier,_loss=log.pdf(18KB)
--------experiment_results-Linear_SVC.pdf(12KB)
--------experiment_results-C-SVC,_kernel=linear.pdf(13KB)
--------all-language-PassiveAggressive-pos.pdf(17KB)
--------experiment_results-SGD_classifier,_loss=perceptron.pdf(18KB)
--------all-language-PassiveAggressive-neg.pdf(17KB)
--------experiment_results-K_neighbors_classifier,_weights=uniform.pdf(14KB)
--------experiment_results-C-SVC,_kernel=rbf.pdf(13KB)
--------experiment_results-Passive_aggressive_classifier.pdf(12KB)
--------experiment_results-K_neighbors_classifier,_weights=distance.pdf(14KB)
--------experiment_results-Ada_Boost_classifier.pdf(16KB)
--------experiment_results-SGD_classifier,_loss=modified_huber.pdf(19KB)
--------experiment_results-Extra_trees_classifier.pdf(12KB)
--------all-language-RandomForest-pos.pdf(17KB)
--------experiment_results-Nu_SVC.pdf(12KB)
--------experiment_results-Ridge_classifier_with_cross-validation.pdf(14KB)
--------experiment_results-Radius_neighbors_classifier.pdf(14KB)
--------experiment_results-Ridge_classifier,_solver=sparse_cg.pdf(14KB)
--------experiment_results-Ridge_classifier,_solver=svd.pdf(13KB)
--------experiment_results-Passive_aggressive_regressor.pdf(10KB)
--------experiment_results-Ridge_classifier,_solver=lsqr.pdf(14KB)
--------experiment_results-Bernoulli_naive_Bayes_classifier.pdf(13KB)
--------experiment_results-SGD_classifier,_loss=squared_hinge.pdf(19KB)
----timing.txt(6KB)
----mpi-test.py(200B)
----.gitattributes(70B)
----commit_comments-dump.2015-01-29.labeled.json(71KB)
----classify.py(11KB)
----Presentation()
--------Classifier-Output.png(105KB)
--------Makefile(397B)
--------beamerleidenshared.sty(5KB)
--------beamerinnerthemeleiden.sty(2KB)
--------beamercolorthemeleiden.sty(7KB)
--------beamerfontthemeleiden.sty(6KB)
--------beamerthemeleiden.sty(2KB)
--------img()
--------Presentation.tex(9KB)
--------beamerouterthemeleiden.sty(10KB)