文件名称:pipeline-gridsearch-scikitlearn-tutorial:scikit-learn中的管道和Gridsearch教程
文件大小:3.73MB
文件格式:ZIP
更新时间:2024-06-07 14:17:02
HTML
使用scikit-learn的动手管道和Gridsearch 使用scikit-learn讨论管道和Gridsearch的材料(jupyter笔记本)。 该演讲于2018年5月16日在Jetbrains Event Space举办的。 作者:弗洛伦·马丁(Florent Martin)和科恩·范·沃尔登(Koen van Woerden) 抽象的 建立数据科学模型通常涉及许多步骤:清理,预处理,矢量化,预测等。特别是对于交互式笔记本,很容易失去对各种中间数据输出的跟踪。 改变中间处理步骤也非常麻烦。 最重要的是,尝试优化超参数需要大量工作。 我们将使用带有scikit-learn的Pipelines和Gridsearch显示这些问题的解决方案。 这些技术将在NLP分类问题上得到证明。 该演讲还将作为scikit-learn的介绍。 如何阅读笔记本? 在哪里启动笔记本 必须运行的jupy
【文件预览】:
pipeline-gridsearch-scikitlearn-tutorial-master
----.gitignore(994B)
----Makefile(2KB)
----data()
--------sample()
--------raw()
--------.gitkeep(0B)
--------talk()
----src()
--------trainvalsplit.py(566B)
--------.DS_Store(6KB)
----notebooks()
--------tutorial.pdf(77KB)
--------.gitkeep(0B)
--------.DS_Store(6KB)
--------test.ipynb(107KB)
--------tutorial.ipynb(53KB)
--------tutorial.html(412KB)
----README.md(3KB)
----img()
--------src()
--------.DS_Store(6KB)
--------figures()