文件名称:tabular_automl_NNI:PAKDD AutoML挑战第二功能工程部分
文件大小:203KB
文件格式:ZIP
更新时间:2024-06-13 10:01:19
Python
如何使用NNI进行自动要素工程? 什么是表格数据? 表格数据是按行和列或可能更复杂的结构排列的数据。 通常,我们将列视为要素,将行视为数据。 用于表格数据的AutoML,包括自动特征生成,功能选择以及对各种表格数据原语(例如数字,类别,多类别,时间戳等)的超调。 快速开始 在此示例中,我们将展示如何在nni上进行自动要素工程。 我们将自动要素工程(auto-fe)视为两步任务。 特征生成探索与特征选择。 我们举一个简单的例子。 调谐器调用AutoFETuner首先会生成一个命令,询问Trial原功能的feature_importance 。 试用版将在第一次迭代中将feature_importance返回给Tuner 。 然后, AutoFETuner将根据搜索空间的定义来估计功能重要性排名并决定要生成的功能。 在以下迭代中, AutoFETuner更新估计的功能重要性排名。
【文件预览】:
tabular_automl_NNI-master
----AutoFEOp.md(5KB)
----search_space.json(923B)
----autofe_tuner.py(8KB)
----main.py(2KB)
----model.py(4KB)
----const.py(1KB)
----config.yml(440B)
----benchmark()
--------heart()
--------criteo()
--------cancer()
--------titanic()
--------haberman()
----README.md(6KB)
----train.tiny.csv(491KB)
----AutoFETutorial.md(6KB)
----fe_util.py(7KB)
----requirments.txt(48B)