getting-started-spark-on-mapr:MapR上Spark入门

时间:2024-06-05 23:38:18
【文件属性】:

文件名称:getting-started-spark-on-mapr:MapR上Spark入门

文件大小:129KB

文件格式:ZIP

更新时间:2024-06-05 23:38:18

MapR上的Spark入门 从MapR-FS读取数据 1-将数据复制到MapR文件系统 在此示例中,我们将使用包含拍卖列表的CSV文件。 该文件位于此项目中: /data/auctiondata.csv 例如,使用cp / scp命令或hadoop put将文件复制到/apps/目录中的群集中 $ scp ./data/auctiondata.csv mapr@[mapr-cluster-node]:/mapr/[cluster-name]/apps/ 或者 $ hadoop fs -put ./data/auctiondata.csv /apps 要使用的数据集来自eBay在线拍卖。 eBay在线拍卖数据集包含以下字段: Auctionid-拍卖的唯一标识符 bid-投标人下的代理投标 bidtime-自拍卖开始起的出价时间(以天为单位) bidder-投标人的eB


【文件预览】:
getting-started-spark-on-mapr-master
----data()
--------auctiondata.csv(562KB)
----LICENSE(11KB)
----README.md(6KB)

网友评论