文件名称:smote的matlab代码-smogn:用于回归的合成少数过采样技术
文件大小:566KB
文件格式:ZIP
更新时间:2024-07-09 00:54:42
系统开源
smote的matlab代码 高斯噪声回归的合成少数过采样技术 描述 用于高斯噪声回归的合成少数过采样技术 (SMOGN) 的 Python 实现。 使用传统插值以及引入高斯噪声 (SMOTER-GN) 进行回归的合成少数过采样技术 (SMOTER)。 根据给定观察结果的 KNN 距离在两种过采样技术之间进行选择。 如果距离足够近,则应用 SMOTER。 如果距离太远,则应用 SMOTER-GN。 适用于回归适用的预测问题,但用于预测的值很少或不常见。 这也可以作为对倾斜响应变量进行日志转换的有用替代方法,尤其是在生成合成数据也很有趣的情况下。 特征 唯一的开源 Python 支持版本的合成少数回归过采样技术。 支持包含混合数据类型的 Pandas DataFrame 输入、按数据类型自动选择距离度量以及可选的自动删除缺失值。 灵活的输入可用于在连续响应变量和友好参数内控制感兴趣的区域,以对合成数据进行过采样。 纯粹的 Pythonic,为一致性、可维护性和未来改进而开发,没有原始 R 实现中包含的对 C 或 Fortran 的外部函数调用。 要求 Python 3 NumPy 熊猫
【文件预览】:
smogn-master
----MANIFEST.in(203B)
----smogn()
--------box_plot_stats.py(3KB)
--------phi.py(5KB)
--------phi_ctrl_pts.py(7KB)
--------__init__.py(354B)
--------smoter.py(11KB)
--------over_sampling.py(19KB)
--------dist_metrics.py(3KB)
----UPDATES(2KB)
----media()
--------literature()
--------images()
----examples()
--------smogn_example_2_int.ipynb(41KB)
--------smogn_example_3_adv.ipynb(40KB)
--------smogn_example_1_beg.ipynb(37KB)
----.travis.yml(296B)
----LICENSE(34KB)
----setup.py(1KB)
----README.md(3KB)
----data()
--------housing.csv(450KB)
----.gitignore(73B)