ETL-Project:项目二

时间:2024-03-27 02:14:21
【文件属性】:

文件名称:ETL-Project:项目二

文件大小:35.76MB

文件格式:ZIP

更新时间:2024-03-27 02:14:21

JupyterNotebook

ETL项目 ETL项目提案 团队成员: 拉斐尔·塞拉诺(Raphael Serrano) 斯沃巴比卡耶娜 托马斯·梅纳(Thomas Maina) 戴安娜·麦登科(Diana Madonko) 项目概况 我们感兴趣的问题是探索世界各地已出版的书籍和相关信息。 这些数据将能够帮助人们选择书籍,因为它将提供有关评级,可负担性以及其他影响他们选择的领域的更多信息。 摘录-拟议的数据来源 •数据位于何处? 卡格勒 Google图书•数据集格式是什么? CSV JSON•您将如何获取此数据? (例如API,抓取的数据,下载的数据) 原料药 API•我们的数据将提供以下信息:〜ISBN〜书名〜作者〜描述〜语言〜页码〜出版商〜出版年份〜评级〜国家〜零售价格〜货币代码〜打印类型 转换-建议的清理和分析•您将对数据进行哪些转换? (例如,过滤,聚合,派生列)过滤和派生列•您将采取什么步骤来


【文件预览】:
ETL-Project-main
----BookData_Analysis.ipynb(135KB)
----sql_script.sql(508B)
----ETL_prototype()
--------Untitled.ipynb(72B)
--------sql_script.sql(2KB)
--------ETL_prototype.ipynb(99KB)
--------data()
--------__pycache__()
--------bookData_analysis.ipynb(416KB)
--------Kaggle_API_Script.sh(6KB)
--------config.py(88B)
--------.ipynb_checkpoints()
--------books_db_load.ipynb(2KB)
----ETL Project Report.docx(1.42MB)
----~$L Project Proposal - Team 4.docx(162B)
----Kaggle API and data()
--------Kaggle_csvData()
--------Kaggle_API_Script.sh(558B)
--------Instructions to run Kaggle API.txt(3KB)
----Resources()
--------ia-isbns-uniq 103118 Master.xlsx(10.95MB)
----ETL Project Proposal - Team 4.docx(52KB)
----.ipynb_checkpoints()
--------BookData_Analysis-checkpoint.ipynb(135KB)
----README.md(2KB)
----.gitattributes(66B)
----books_db_load.ipynb(2KB)

网友评论