DataWrangling:使用Python和R进行数据处理的最终参考指南

时间:2024-05-30 12:30:09
【文件属性】:

文件名称:DataWrangling:使用Python和R进行数据处理的最终参考指南

文件大小:28KB

文件格式:ZIP

更新时间:2024-05-30 12:30:09

R

着急开始吗? |专区 数据整理 数据科学部门90%的人清理数据,而10%的人抱怨清理数据。 在数据争用领域中,来自R的和来自Python的占据了主导地位。 此回购旨在提供有关如何使用data.table和pandas进行常见操作的全面,易于使用的参考指南,包括它们之间的交叉引用以及速度比较。 文件和数据 此仓库由三个主要目录组成: Python和R目录每个都包含三个结构相似的文件: / 具有目标和答案(用于学习) / 仅具有目标(用于测试您的技能) / README.md(R) -具有目标,答案和pandas-data.table交叉引用 wrangle文件使用了Data目录中的四个数据集: products.csv sessions.csv Transactions.csv users.csv 这些数据集很小,仅用于说明目的。 如果要测试熊猫和data.tab


【文件预览】:
DataWrangling-master
----.gitignore(65B)
----R()
--------wrangle.R(15KB)
--------README.md(27KB)
--------wrangle_blank.R(9KB)
----README.md(3KB)
----Data()
--------products.csv(90B)
--------make_data.R(6KB)
--------README.md(3KB)
--------users.csv(235B)
--------transactions.csv(258B)
--------sessions.csv(186B)
----Python()
--------wrangle.py(14KB)
--------wrangle_blank.py(9KB)
--------README.md(27KB)

网友评论