6.pyspark程序本地运行示例

时间:2024-04-05 11:42:07

1.进行pyspark界面

    pyspark --master local[4]

2.查看当前的运行模式

   sc.master

3.读取本地文件进行计算

(1)读取本地的文件

         textFile=sc.textFile("file:/usr/local/spark/README.md")

(2)显示项数

         textFile.count()6.pyspark程序本地运行示例

3.读取HDFS文件进行计算

(1)读取本地的文件

         textFile=sc.textFile("hdfs://master:9000/user/hduser/wordcount/input/LICENSE.txt")

(2)显示项数

         textFile.count()

6.pyspark程序本地运行示例