Databases

时间:2024-04-20 04:11:40
【文件属性】:

文件名称:Databases

文件大小:2.28MB

文件格式:ZIP

更新时间:2024-04-20 04:11:40

Scala

资料库 该存储库包含三个使用SQL,XML,PostgreSQL,MongoDB,Apache Spark和AWS的数据库项目 SQL和PostgreSQL 在这个项目中,我将PostgreSQL数据库用于数据处理任务: 预处理原始数据:我使用python库psycopg2连接到我的postgres数据库,在其中我根据原始数据架构创建了不同的表以供将来存储。 然后,我使用python库xml.sax解析了xml文件,清理了原始数据,并将其存储在表中。 数据分析:我执行了几个SQL查询来分析数据。 查询包括获取每个表的元组数,通过添加列并填充来更改架构,以及对多个表进行更复杂的查询以收集信息。 数据可视化:我执行了更多查询,并使用表,折线图和条形图可视化了结果。 MongoDB的 在这个项目中,我使用MongoDB来存储数据。 我写了几个查询来分析数据。 Spark和AWS 在这个


【文件预览】:
Databases-main
----.gitignore(23B)
----MongoDB()
--------2.2.js(428B)
--------1.2.js(318B)
--------Query.pdf(121KB)
--------update.js(264B)
--------MongoDB_tutorial.pdf(179KB)
--------2.3.js(409B)
--------2.1.js(221B)
--------1.1.js(75B)
----SQL_PostgreSql()
--------Data Visualization.xml(5KB)
--------data()
--------Data Analysis.xml(5KB)
--------Visualization Report.pdf(170KB)
--------XML Parser()
--------Instruction.pdf(203KB)
----README.md(1KB)
----Spark_AWS()
--------template_file()
--------spark_tutorial-local.pdf(324KB)
--------spark_local()
--------spark_aws()
--------spark_tutorial-aws.pdf(102KB)
--------Instruction.pdf(352KB)

网友评论