eazieda:一种快速简便的方法来进行一些次要的EDA和数据清理

时间:2024-03-27 07:47:12
【文件属性】:

文件名称:eazieda:一种快速简便的方法来进行一些次要的EDA和数据清理

文件大小:52KB

文件格式:ZIP

更新时间:2024-03-27 07:47:12

Python

埃济埃达 几乎每个数据分析项目都涉及进行一些探索性数据分析(EDA)和数据预处理的过程。 通常,它们是数据分析工作流程中非常关键且不可避免的步骤。 EDA中有一些非常常见的任务,其中包括: 检查缺失值 检测异常值 在特征之间绘制相关图 为每个特征绘制直方图/条形图 通常,在这些步骤之后进行一些预先处理,例如插补和处理离群值。 所有这些步骤在一起可能需要大量的编码工作,并且可以在多个项目中重复进行。 为了解决这个问题,我们设计了Python软件包eazieda ,它将所有这些代码行包​​装为四个便捷的函数,这些函数将使您能够快速,轻松地执行EDA以及仅需几行代码就可以进行一些简单的预处理! 安装 $ pip install -i https://test.pypi.org/simple/ eazieda 特征 missing_detect :此函数将接收一个数据帧并生成一个表,该表列出每


【文件预览】:
eazieda-master
----poetry.lock(79KB)
----.gitignore(2KB)
----.readthedocs.yml(99B)
----pyproject.toml(814B)
----eazieda()
--------missing_detect.py(1KB)
--------histograms.py(3KB)
--------__init__.py(22B)
--------corr_plot.py(4KB)
--------outliers_detect.py(4KB)
--------missing_impute.py(3KB)
--------eazieda.py(2KB)
----LICENSE(1KB)
----.github()
--------workflows()
----README.md(5KB)
----tests()
--------test_eazieda.py(116B)
--------__init__.py(0B)
--------test_corr_plot.py(2KB)
--------test_missing_detect.py(841B)
--------test_outlier_detect.py(4KB)
--------test_histograms.py(2KB)
--------test_missing_impute.py(2KB)
----CONDUCT.rst(3KB)
----CONTRIBUTING.rst(4KB)
----docs()
--------Makefile(608B)
--------index.rst(759B)
--------conf.py(5KB)
--------installation.rst(2KB)
--------make.bat(769B)
--------usage.rst(69B)
--------source()
--------conduct.rst(28B)
--------contributing.rst(33B)

网友评论