ETL-Project

时间:2024-04-20 03:26:51
【文件属性】:

文件名称:ETL-Project

文件大小:76.52MB

文件格式:ZIP

更新时间:2024-04-20 03:26:51

JupyterNotebook

考特尼·戈麦斯| 丽莎·哈雷尔(Lisa Harrell)| 卡洛斯·基洛兹(Carlos Quiroz)| 杰拉尔德·沃茨三世 介绍 该项目的目的是说明使用Excel,Python和SQL的提取转换负载(ETL)。 ETL是计算中通常完成的一个过程,该过程将获取原始数据,将其清除并存储以供以后使用。 提取阶段确定目标并检索数据。 转换操作并清除数据。 然后,通常将数据加载到数据仓库中进行存储。 ETL完成后,可以将数据用于分析以帮助实现业务目标。 主要目标 从各种维护的来源收集数据 对所有正在使用的数据执行清理,合并,过滤,规范化和聚合 将文件上传到数据库中,以进行更全面的分析 就可以从数据集中得出哪些类型的问题或分析提出意见 数据来源和说明 我们从获得了3个数据文件 IMDb films.csv IMDb名称.csv IMDb title_principles.csv 数据提取 在


【文件预览】:
ETL-Project-main
----.gitignore(2KB)
----Resources()
--------IMDb title_principals.csv(34.14MB)
--------IMDb_movies.csv(45.62MB)
--------IMDb names.csv.zip(45.79MB)
----README.md(4KB)
----schema.sql(1KB)
----Images()
--------imdb.jpg(17KB)
--------morpheus.jpg(250KB)
--------houston.jpg(9KB)
--------ERD.png(43KB)
--------truth.jpg(9KB)
--------th.jpg(5KB)
--------IMDb_Header.jpg(140KB)
----extract_and_transform.ipynb(45KB)

网友评论

相关文章