文件名称:Movies-ETL
文件大小:1.69MB
文件格式:ZIP
更新时间:2024-04-18 07:30:02
JupyterNotebook
电影-ETL 单元8挑战-ETL(提取,转换,Load_) 目的 这一挑战将Python和PostgreSQL结合在一起,从Wikipedia和Kaggle收集数据,将它们合并在一起,然后将Movies and Ratings文件保存到SQL数据库中。 数据将被清理并连接在一起,然后再加载到SQL数据库中。 资料库 主分支包括以下内容: 可交付成果1、2、3的入门代码 交付品1,ETI_function_test.ipynb 交付品2,ETL_clean_-wiki-movies.ipynb 交付品3,ETL_clean_kaggle_data.ipynb 交付品4,ETL_create_database.ipynb 文件夹资源包含: wikipedia.movies.json 由于文件大,未加载movies_metadata.csv。 由于文件过大,未加载ratin
【文件预览】:
Movies-ETL-main
----.gitignore(2KB)
----ETL_Deliverable1_starter_code.ipynb(3KB)
----ETL_create_database.ipynb(22KB)
----Resources()
--------wikipedia-movies.json(5.88MB)
--------movies_query.png(39KB)
--------ratings_query.png(46KB)
----movies_query.png(39KB)
----hackathon.ipynb(331KB)
----README.md(978B)
----ETL_function_test.ipynb(30KB)
----ratings_query.png(46KB)
----ETL_Deliverable2_starter_code.ipynb(5KB)
----ETL_clean-wiki_movies.ipynb(25KB)
----ETL_clean_kaggle_data.ipynb(46KB)
----ETL_Deliverable3_starter_code.ipynb(6KB)