专案_2

时间:2024-03-10 12:35:17
【文件属性】:

文件名称:专案_2

文件大小:109KB

文件格式:ZIP

更新时间:2024-03-10 12:35:17

JupyterNotebook

项目2 ETL项目(提取,转换,加载) 项目报告 原始数据源 所需的数据清理和转换 使用熊猫将CSV读取到Jupyter Notebook以提取数据并创建两个数据框 重命名列以合并并设置为索引,删除了不必要的列 为了在“ abv”中显示适当的值,对表进行了更改,并在“ abv”列中确定了将INT更改为REAL的需要。 ALTER TABLE为了完成此任务。 另外,在更改,更改和重新加载数据之前,请清除表中的所有数据,以适应新的更改。 最初,使用INNER JOINS查询数据以进行汇总 平均列 计数值 使用通配符'%'的LIKE函数 合并数据帧以减少SQL中的JOIN查询 将新的已清理数据帧导出到CSV文件 创建结果表? 最终数据库,表/集合 为了方便查询数据而在Panda中创建了“ merged-db”,在SQL中形成了“ merged”表以进行查询-该技术用于消除引用联接,从而提高了


【文件预览】:
Project_2-master
----Queries.sql(2KB)
----Project_2.ipynb(31KB)
----Resources()
--------beers.csv(142KB)
--------beers2.csv(148KB)
--------breweries.csv(23KB)
--------breweries2.csv(25KB)
----README.md(1KB)

网友评论