文件名称:06.Spark:星火
文件大小:503KB
文件格式:ZIP
更新时间:2024-03-18 20:56:50
JupyterNotebook
火花 데이터 RDD(데이데) 클러스터의노드에있는객체들의객체들의 수정이이불 RDD생성하는법 (1)SparkContext를이외부(HDFS,스파크로컬컬렉션컬렉션...) (2)在RDD中를,를,집계,공으,생성,생성,생성 动作함수와함수와转换함수함수 动作관련 rdd만든다고스클러스클러리실행되는이것이아님。 rdd는논리적이터 이며리는rdd상에서action이이루어질때 foreach() 收藏() 拿() 数数() 减少() map()과 转型관련 地图() flatMap() 筛选() ... 데이터 맵리듀스에는 키마와이터스키마와살펴이터살펴보아야함。 데이터 (1)RDD를 toDF()( 이를 (2)SQLContext멤버함수로데이터기 sqlCtx.createDataFrame(rdd,['컬럼명']) (3)
【文件预览】:
06.Spark-main
----16. DataFrame_시계열 데이터_연습문제.ipynb(38KB)
----15. DataFrame_연습문제.ipynb(17KB)
----20. Kafka_Consumer.ipynb(13KB)
----27. scipy 라이브러리 구조 .ipynb(6KB)
----06. RDD_연습문제.ipynb(7KB)
----14. DataFrame_정규식.ipynb(8KB)
----11. DataFrame_df.where조건.ipynb(13KB)
----02. RDD_(1) Action함수.ipynb(6KB)
----23. 선형회귀분석.ipynb(33KB)
----08. DataFrame_연습문제.ipynb(101KB)
----10. DataFrame_통계.ipynb(29KB)
----13. DataFrame_Join_Union.ipynb(11KB)
----18. Kafka_Producer.ipynb(3KB)
----17. DataFrame_Partition.ipynb(8KB)
----21. SQL-Lite.ipynb(3KB)
----05. RDD_함수.ipynb(7KB)
----22. Kafka_Producer_WebLog.ipynb(457KB)
----09. DataFrame_API.ipynb(136KB)
----26. 로지스틱 회귀.ipynb(15KB)
----01. RDD_만들기.ipynb(6KB)
----07. DataFrame.ipynb(36KB)
----12. DataFrame 연습문제_titanic.ipynb(30KB)
----README.md(2KB)
----24. 실시간 차트.ipynb(11KB)
----04. RDD_함수.ipynb(22KB)
----25. 다중선형회귀.ipynb(6KB)
----03. RDD_함수.ipynb(9KB)