Spark-Preprocessing:大数据预处理

时间:2024-05-20 03:07:06
【文件属性】:

文件名称:Spark-Preprocessing:大数据预处理

文件大小:12.39MB

文件格式:ZIP

更新时间:2024-05-20 03:07:06

Java

在运行程序之前,请在lib文件夹下添加spark-assembly-1.3.1-hadoop2.6.0.jar和spark-examples-1.3.1-hadoop2.6.0.jar文件并将其添加到buildpath中


【文件预览】:
Spark-Preprocessing-master
----.gitignore(82B)
----.project(377B)
----README.md(165B)
----bin()
--------main()
----.settings()
--------org.eclipse.jdt.core.prefs(587B)
----src()
--------main()
----.classpath(1KB)
----data()
--------train_neg_docs()
--------sample_libsvm_data.txt(102KB)
--------sample_binary_classification_data.txt(102KB)
--------outdata()
--------sample_lda_data.txt(264B)
--------words.db(3.54MB)
--------sample_svm_data.txt(39KB)
--------stopwords(13KB)
--------test_neg_docs()
--------sample_movielens_data.txt(14KB)
--------sample_isotonic_regression_data.txt(2KB)
--------sample_naive_bayes_data.txt(48B)
--------test.libsvm(34KB)
--------train_pos_docs()
--------train.libsvm(22KB)
--------sample_linear_regression_data.txt(116KB)
--------test_pos_docs()
--------sample_multiclass_classification_data.txt(7KB)
--------wordcount.txt(5KB)
----lib()
--------opennlp-tools-1.6.0.jar(1.04MB)
--------google-collect-1.0.jar(564KB)
--------lucene-core-3.6.2.jar(1.47MB)
--------LIBLINEAR.jar(225KB)
--------datanucleus-core-3.2.10.jar(1.8MB)
--------opennlp-uima-1.6.0.jar(94KB)
--------datanucleus-rdbms-3.2.9.jar(1.73MB)
--------datanucleus-api-jdo-3.2.6.jar(332KB)
--------TopicMiner.jar(77KB)
--------spark-1.3.1-yarn-shuffle.jar(3.95MB)
--------commons-math-2.2.jar(965KB)
--------TextProcessor.jar(57KB)

网友评论