windows安装maven,eclipse配置maven,运行spark程序总结

时间:2021-02-18 09:21:33

1、到maven官网下载最新的maven安装包

https://maven.apache.org/download.cgi

windows安装maven,eclipse配置maven,运行spark程序总结

2、配置Windows环境

(略)

windows安装maven,eclipse配置maven,运行spark程序总结

3、在eclipse中配置maven环境

3.1、Installations

Add => maven安装路径的bin目录的上一层即可

windows安装maven,eclipse配置maven,运行spark程序总结

3.2、User Setting

有的文档要求把%MAVEN_HOME%\conf   中的settings.xml的镜像改为点击打开链接(默认的*库在国外,国内访问比较慢)

但是,我先不建议修改,aliyund的镜像有些文件下载下来有问题,会报好多错误,另外后面在建maven项目时会报错,需要把settings.xml 给为默认的。

<mirrors>
<mirror>
<id>aliyun</id>
<name>aliyun Maven</name>
<mirrorOf>*</mirrorOf>
<url>http://maven.aliyun.com/nexus/content/groups/public/</url>
</mirror>
</mirrors>

windows安装maven,eclipse配置maven,运行spark程序总结

3.3、在eclipse中新建maven项目

windows安装maven,eclipse配置maven,运行spark程序总结

windows安装maven,eclipse配置maven,运行spark程序总结


如果在新建工程的时候,遇到不能链接Maven网站下载必须的组件时,可以用以下方式解决(大多数都会遇到的问题) 

会报错:

Could not resolve archetype org.apache.maven.archetypes:maven-archetype-quickstart ......

【解决方案】

重新下载,

maven-archetype-quickstart-1.1.jar

https://repo1.maven.org/maven2/org/apache/maven/archetypes/maven-archetype-quickstart/1.1/(亲测可用,网上好多资源都不可以使用)

下载好后,将该jar包拷贝到Maven的安装目录下的lib里面,在cmd中执行mvn install:install-file -
DgroupId=org.apache.maven.archetypes -DartifactId=maven-archetype-quickstart -Dversion=1.1 -Dpackaging=jar -
Dfile=maven-archetype-quickstart-1.1.jar

【说明】

如果在上文提前配置了setting.xml文件的镜像为aliyun,那么自出会安装失败,因为ailiyun的镜像无法下载Dfile=maven-archetype-quickstart-1.1.jar 的依赖库,默认的*库可以正常下载,成功安装。


现在,就可以新建maven项目了,打开项目的pom.xml文件,添加spark编程依赖包,然后保存pom.xml就会自动下载依赖包。

spark 最重要的包,核心包

<dependency>
 <groupId>org.apache.spark</groupId>
 <artifactId>spark-core_2.10</artifactId>
 <version>1.3.0</version>
</dependency>

......

【注意】不要一次性把所有的依赖包按照如上方式写到pom.xml.  这样会下载异常的慢,还会包一个特别恶心的错误:

导入项目之后出现 java Build Path Problems:Archive for required library 
具体为:Archive for required library:E:program Files/apache-maven-3.1.0/repository/org/xxx.jar in project XXXXX cannot be read or is not a valid ZIP file 

网上关于这个问题有许多的文章,但是真正可以解决的少之又少,现在总结如下:

(1)最好用默认的*库(就是不要修改setting.xml的mirror为aliyun或者其他的国内镜像,不是正宗的,会有各种错误)

关于 XXXXX cannot be read or is not a valid ZIP file 这个错误,网上有的博客的解决方案是:把C:\Users\用户名\.m2\repository\org\...本地库下该jar的父目录或者是相关上层目录删除,重新保存pom.xml文件下载,但是经测试还会报同样的错误,只是换了不同的包而已,依次反复 删除--下载--删除--下载...(何时是个头!!!!)不行!!

(2)我建议采用我上文提到过的方案,不要一次性的下载所有的包,可以依次部分下载,有的程序不需要那么多的包!


--------------------------------------------------------------------------------------------华丽的的分割线----------------------------------------------------------------------------------------------------------------

【更新】

总结:

(1)前几天老是报“java Build Path Problems:Archive for required library ”这样的错误,今天我再一次的尝试

1)一次性在pom.xml导入所有的依赖包

2)使用默认的*库

3)依旧采用之前的重新下载,并安装的maven-archetype-quickstart-1.1.ja

【很丝滑,没有报之前的错误】

【分析】可能是最近*库更新的缘故吧~(费解)



【附件】pom.xml


<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
  xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
  <modelVersion>4.0.0</modelVersion>


  <groupId>cn.spark</groupId>
  <artifactId>SparkTest</artifactId>
  <version>0.0.1-SNAPSHOT</version>
  <packaging>jar</packaging>


  <name>SparkTest</name>
  <url>http://maven.apache.org</url>


  <properties>
    <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
  </properties>


  <dependencies>
    <dependency>
      <groupId>junit</groupId>
      <artifactId>junit</artifactId>
      <version>3.8.1</version>
      <scope>test</scope>
    </dependency>
    <dependency>
 <groupId>org.apache.spark</groupId>
 <artifactId>spark-core_2.10</artifactId>
 <version>1.3.0</version>
</dependency>
<dependency>
 <groupId>org.apache.spark</groupId>
 <artifactId>spark-sql_2.10</artifactId>
 <version>1.3.0</version>
 </dependency>
<dependency>
 <groupId>org.apache.spark</groupId>
 <artifactId>spark-hive_2.10</artifactId>
 <version>1.3.0</version>
</dependency>
<dependency>
 <groupId>org.apache.spark</groupId>
 <artifactId>spark-streaming_2.10</artifactId>
 <version>1.3.0</version>
</dependency>
<dependency>
 <groupId>org.apache.hadoop</groupId>
 <artifactId>hadoop-client</artifactId>
 <version>2.4.1</version>
</dependency>
<dependency>
 <groupId>org.apache.spark</groupId>
 <artifactId>spark-streaming-kafka_2.10</artifactId>
 <version>1.3.0</version>
</dependency>
  </dependencies>
  
  <build>
    <sourceDirectory>src/main/java</sourceDirectory>
    <testSourceDirectory>src/main/test</testSourceDirectory>


    <plugins>
      <plugin>
        <artifactId>maven-assembly-plugin</artifactId>
        <configuration>
          <descriptorRefs>
            <descriptorRef>jar-with-dependencies</descriptorRef>
          </descriptorRefs>
          <archive>
            <manifest>
              <mainClass></mainClass>
            </manifest>
          </archive>
        </configuration>
        <executions>
          <execution>
            <id>make-assembly</id>
            <phase>package</phase>
            <goals>
              <goal>single</goal>
            </goals>
          </execution>
        </executions>
      </plugin>


      <plugin>
        <groupId>org.codehaus.mojo</groupId>
        <artifactId>exec-maven-plugin</artifactId>
        <version>1.2.1</version>
        <executions>
          <execution>
            <goals>
              <goal>exec</goal>
            </goals>
          </execution>
        </executions>
        <configuration>
          <executable>java</executable>
          <includeProjectDependencies>true</includeProjectDependencies>
          <includePluginDependencies>false</includePluginDependencies>
          <classpathScope>compile</classpathScope>
          <mainClass>cn.spark.sparktest.App</mainClass>
        </configuration>
      </plugin>


      <plugin>
        <groupId>org.apache.maven.plugins</groupId>
        <artifactId>maven-compiler-plugin</artifactId>
        <configuration>
          <source>1.6</source>
          <target>1.6</target>
        </configuration>
      </plugin>


    </plugins>
  </build>
</project>