Spark学习笔记2（spark所需环境配置

Spark学习笔记2

配置spark所需环境

1.首先先把本地的maven的压缩包解压到本地文件夹中，安装好本地的maven客户端程序，版本没有什么要求

不需要最新版的maven客户端。

解压完成之后在解压好的maven客户端的文件夹内打开conf文件夹，修改里面的settings.xml文件

Spark学习笔记2（spark所需环境配置

然后只需要修改这一行就可以了，把这一行替换成你自己本地的maven仓库的路径

Spark学习笔记2（spark所需环境配置

最好是自己有一个完整点的maven仓库，然后把这个修改过的xml文件放到maven仓库下

Spark学习笔记2（spark所需环境配置

到这里，你本地的maven客户端环境已经搭建好了，现在可以到IDEA里建一个maven项目了！

在IDEA上建立一个maven项目

1.创建一个maven项目

new Project --》 Maven --》 next --》 groupId：组织名称（类似eclipse的工作空间），Artifactid：项目名称 Version：版本名称
--》 next到项目名称，项目的工作路径等 --》 finish

Spark学习笔记2（spark所需环境配置

下面开始配置你的xml文件，因为maven项目需要很多的依赖，配置好xml文件

就可以导入大部分的依赖包了，直接把下面的代码复制进来放入你的xml文件里就ok

 <?xml version="1.0" encoding="UTF-8"?>

 <project xmlns="http://maven.apache.org/POM/4.0.0"

          xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

          xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">

     <modelVersion>4.0.0</modelVersion>

     <groupId>cn.beicai1704</groupId>

     <artifactId>sparkLearn1704</artifactId>

     <version>1.0-SNAPSHOT</version>

     <properties>

         <maven.compiler.source>1.7</maven.compiler.source>

         <maven.compiler.target>1.7</maven.compiler.target>

         <encoding>UTF-8</encoding>

         <scala.version>2.10.6</scala.version>

         <spark.version>1.6.1</spark.version>

         <hadoop.version>2.6.4</hadoop.version>

     </properties>

     <dependencies>

         <dependency>

             <groupId>org.scala-lang</groupId>

             <artifactId>scala-library</artifactId>

             <version>${scala.version}</version>

         </dependency>

         <dependency>

             <groupId>org.apache.spark</groupId>

             <artifactId>spark-core_2.10</artifactId>

             <version>${spark.version}</version>

         </dependency>

         <dependency>

             <groupId>org.apache.hadoop</groupId>

             <artifactId>hadoop-client</artifactId>

             <version>${hadoop.version}</version>

         </dependency>

         <dependency>

             <groupId>org.apache.spark</groupId>

             <artifactId>spark-streaming_2.10</artifactId>

             <version>${spark.version}</version>

         </dependency>

         <dependency>

             <groupId>org.apache.spark</groupId>

             <artifactId>spark-sql_2.10</artifactId>

             <version>${spark.version}</version>

         </dependency>

         <dependency>

             <groupId>org.apache.spark</groupId>

             <artifactId>spark-hive_2.10</artifactId>

             <version>${spark.version}</version>

         </dependency>

         <dependency>

             <groupId>org.apache.spark</groupId>

             <artifactId>spark-streaming-kafka_2.10</artifactId>

             <version>1.6.1</version>

         </dependency>

         <dependency>

             <groupId>org.apache.spark</groupId>

             <artifactId>spark-streaming-flume_2.10</artifactId>

             <version>${spark.version}</version>

         </dependency>

         <dependency>

             <groupId>com.alibaba</groupId>

             <artifactId>fastjson</artifactId>

             <version>1.1.41</version>

         </dependency>

     </dependencies>

     <build>

         <sourceDirectory>src/main/scala</sourceDirectory>

         <testSourceDirectory>src/test/scala</testSourceDirectory>

         <plugins>

             <plugin>

                 <groupId>net.alchim31.maven</groupId>

                 <artifactId>scala-maven-plugin</artifactId>

                 <version>3.2.2</version>

                 <executions>

                     <execution>

                         <goals>

                             <goal>compile</goal>

                             <goal>testCompile</goal>

                         </goals>

                         <configuration>

                             <args>

                                 <arg>-make:transitive</arg>

                                 <arg>-dependencyfile</arg>

                                 <arg>${project.build.directory}/.scala_dependencies</arg>

                             </args>

                         </configuration>

                     </execution>

                 </executions>

             </plugin>

             <plugin>

                 <groupId>org.apache.maven.plugins</groupId>

                 <artifactId>maven-shade-plugin</artifactId>

                 <version>2.4.3</version>

                 <executions>

                     <execution>

                         <phase>package</phase>

                         <goals>

                             <goal>shade</goal>

                         </goals>

                         <configuration>

                             <filters>

                                 <filter>

                                     <artifact>*:*</artifact>

                                     <excludes>

                                         <exclude>META-INF/*.SF</exclude>

                                         <exclude>META-INF/*.DSA</exclude>

                                         <exclude>META-INF/*.RSA</exclude>

                                     </excludes>

                                 </filter>

                             </filters>

                             <transformers>

                                 <transformer implementation="org.apache.maven.plugins.shade.resource.ManifestResourceTransformer">

                                     <mainClass>WordCount</mainClass>

                                 </transformer>

                             </transformers>

                         </configuration>

                     </execution>

                 </executions>

             </plugin>

         </plugins>

     </build>

然后根据提示点击加载依赖到项目里，因为我已经配置过了，所以没有任何显示

Spark学习笔记2（spark所需环境配置

到这里基本就配置完成了，现在可以写一个spark文件来测试一下了！

转载本文请和本文作者联系，本文来自博客园一袭白衣一

秒客网

Spark学习笔记2（spark所需环境配置

相关文章