数据集预处理:对流行数据集进行预处理(目前从UCI存储库中获取)

时间:2024-03-09 13:18:08
【文件属性】:

文件名称:数据集预处理:对流行数据集进行预处理(目前从UCI存储库中获取)

文件大小:56KB

文件格式:ZIP

更新时间:2024-03-09 13:18:08

Python

数据集预处理 流行数据集的预处理(目前来自UCI存储库)。 这些方法包括: 一键编码分类变量 数值变量的最小-最大缩放范围为[0,1] 生成元数据信息: 样品数 功能数量 变量类型 一键编码字典 类名 还包括用于下载数据集并使用默认参数进行预处理的脚本。 先决条件 该项目是使用python 2.7.12和以下软件包开发的: numpy == 1.15.1 scikit学习== 0.19.2 scipy == 1.1.0 仅在下载和提取压缩文件内容时才需要这样做: wget == 3.2 xlrd == 1.1.0 用pip安装: pip install -r requirements.txt


【文件预览】:
dataset-pre-processing-master
----.gitignore(1KB)
----requirements.txt(81B)
----dataset_pre_processing()
--------print_metadata.py(2KB)
--------uci()
--------__init__.py(0B)
--------scaling.py(360B)
--------fold_split.py(6KB)
--------train_test_split.py(4KB)
--------split_by_class.py(2KB)
--------metadata.py(6KB)
--------merge_labels.py(4KB)
----README.md(799B)

网友评论