1.进行pyspark界面
pyspark --master local[4]
2.查看当前的运行模式
sc.master
3.读取本地文件进行计算
(1)读取本地的文件
textFile=sc.textFile("file:/usr/local/spark/README.md")
(2)显示项数
textFile.count()
3.读取HDFS文件进行计算
(1)读取本地的文件
textFile=sc.textFile("hdfs://master:9000/user/hduser/wordcount/input/LICENSE.txt")
(2)显示项数
textFile.count()