文件名称:sql-challenge:#9-员工数据库
文件大小:120KB
文件格式:ZIP
更新时间:2024-04-14 05:05:04
JupyterNotebook
colleen547-sql-挑战 员工SQL数据库:两部分之谜在该项目中,表被设计为以CSV格式保存数据,将CSV导入到SQL数据库中,并通过执行以下步骤来回答有关数据的问题: 1.)数据建模 2.)数据工程 3.)数据分析 背景场景想象一下,您刚刚被录用为新的数据工程师,而您的第一个主要任务是针对1980年代和1990年代公司员工的研究项目,但是该时期员工数据库中剩下的全部是六个CSV文件。 资料建模 使用检查了CSV并草绘了表格的ERD。 数据工程 使用获得的信息,为六个CSV文件中的每一个创建一个表模式,包括指定数据类型,主键,外键和其他约束。 对于主键,检查列以识别列是否唯一,否则创建一个复合键,该键需要两个主键才能唯一地标识一行。 注意以正确的顺序创建表以处理外键。 接下来,将每个CSV文件以创建表的相同顺序并考虑标题以避免错误将其导入到相应SQL表中。 数据分
【文件预览】:
sql-challenge-master
----QuickDBtxt-DataEngineering ERD (Colleen).txt(526B)
----Employee Database Table Schema - Colleen.sql(3KB)
----employees_db_Colleens.ipynb(73KB)
----Queries - Colleen.sql(3KB)
----static()
--------images()
----QuickDBDdiagram-DataModeling ERD (Colleen).png(55KB)
----.gitignore(2KB)
----README.md(4KB)