文件名称:slicefinder:自动数据切片
文件大小:2.31MB
文件格式:ZIP
更新时间:2024-05-20 08:44:49
JupyterNotebook
切片查找器 数据切片在ML系统中很重要,因为可以在数据子集中更好地理解和验证经过训练的模型(例如,模型在整个数据集上表现良好,但是对于数据的特定子集却惨败)。 实际上,这通常是由事先知道重要数据切片的人类策展人完成的(例如,“性别=女性” ^“年龄> = 18” ^“国家=美国”数据切片); 但是,策划的切片并不总是可用。 自动数据切片带来了两个挑战:第一,搜索空间呈指数级增长,而具有较高ML性能指标的任意小切片不一定是令人感兴趣的-切片的可解释性是自动切片工具应考虑的另一个问题。 切片查找器测试用例 python slice_finder_test . py
【文件预览】:
slicefinder-master
----.gitignore(70B)
----.ipynb_checkpoints()
--------SliceFinder_demo-checkpoint.ipynb(811KB)
--------credit_fraud-checkpoint.ipynb(32KB)
----data()
--------.ipynb_checkpoints()
--------adult.names(5KB)
--------adult.data(3.79MB)
--------adult.test(1.91MB)
----__init__.py(0B)
----slice_finder_test.py(36KB)
----slice_finder.py(11KB)
----slices_ver2.pkl(2.58MB)
----README.md(799B)
----risk_control.py(1KB)
----SliceFinder_demo.ipynb(685KB)
----decision_tree.py(5KB)
----encoders.pkl(2KB)