self-learning-blank-space

时间:2024-05-08 00:29:23
【文件属性】:

文件名称:self-learning-blank-space

文件大小:8KB

文件格式:ZIP

更新时间:2024-05-08 00:29:23

Python

ETL流程 在行业中,数据人员经常会处理大量或大量数据。 此任务的目的是可以从文件夹中多个文件的组合中提取,转换并将其加载到一个文件中(在此存储库中,数据位于data文件夹中)。 过程 提取:读取文件。 转换:根据需要选择某些字段(在这种情况下,有10个字段),并根据需要选择流派和语言字段。 加载:从合并的所有文件中合并文件,然后将其保存在output_file.json中 输出 您可以下载输出文件共有3个输出文件: 日志文件:显示每个进程的日志 error_rpt:进程运行时显示错误报告 output_data:此ETL过程的结果 安装 使用git克隆此存储库 git clone https://github.com/fdhanh/self-learning-blank-space.git 如何使用 确保您拥有.json文件,或者您可以在下载并放置到文件夹data 在命令提示符下


【文件预览】:
self-learning-blank-space-master
----src()
--------__init__.py(52B)
--------script.py(847B)
--------my_func.py(1KB)
--------__pycache__()
----README.md(1KB)
----main.py(75B)
----Requirements.txt(11B)

网友评论