文件名称:reskit:一个用于创建和管理用于科学和工业机器学习的可复制管道的库
文件大小:36.29MB
文件格式:ZIP
更新时间:2024-02-24 19:01:54
python pipeline reproducible-research scikit-learn grid-search
Reskit Reskit(研究人员工具包)是一个库,用于创建和管理用于科学和工业机器学习的可复制管道。 Reskit可以自然地将scikit-learn管道扩展到一般的管道类,从而可以对每个管道步骤进行有效且透明的优化。 主要功能包括数据缓存,与大多数scikit学习对象的兼容性,优化约束(例如,禁止的组合)以及用于质量指标的表生成。 Reskit还允许将自定义指标注入到基础scikit框架中。 Reskit适用于需要适合版本控制和可复制性的管线,但同时也需要进行大量实验的研究人员。 产品特点 能够在实验列表中将管道与相等数量的步骤组合,运行并以方便人类食用的格式返回结果(Pandas数据
【文件预览】:
reskit-master
----setup.py(959B)
----.gitignore(99B)
----Dockerfile(434B)
----requirements.txt(191B)
----.travis.yml(252B)
----MANIFEST.in(43B)
----LICENSE(1KB)
----setup.cfg(40B)
----README.md(8KB)
----tutorials()
--------.ipynb_checkpoints()
--------1. Getting Started.ipynb(8KB)
--------4. Machine Learning on Graphs.ipynb(11KB)
--------3. Transformers Guide.ipynb(5KB)
--------2. Pipeliner Class Usage.ipynb(26KB)
----docs()
--------Makefile(607B)
--------source()
----reskit()
--------features.py(6KB)
--------datasets()
--------__init__.py(20B)
--------datasets.py(234B)
--------tests()
--------core.py(21KB)
--------normalizations.py(5KB)
----requirements-dev.txt(36B)