方法一:用pandas辅助
方法二:纯spark
1
2
3
4
5
|
from pyspark import SparkContext
from pyspark.sql import SQLContext
sc = SparkContext()
sqlContext = SQLContext(sc)
sqlContext.read. format ( 'com.databricks.spark.csv' ).options(header = 'true' , inferschema = 'true' ).load( 'game-clicks.csv' )
|
以上这篇pyspark 读取csv文件创建DataFrame的两种方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/zhouweiyu/article/details/79043591