详解随机森林-随机森林在乳腺癌数据上的调参【菜菜的sklearn课堂笔记】
视频作者:菜菜TsaiTsai链接:【技术干货】菜菜的机器学习sklearn【全85集】Python进阶_哔哩哔哩_bilibilifrom sklearn.datasets import load_breast_cancerfrom sklearn.ensemble import RandomFo...
详解随机森林-机器学习中调参的基本思想【菜菜的sklearn课堂笔记】
视频作者:[菜菜TsaiTsai]链接:[【技术干货】菜菜的机器学习sklearn【全85集】Python进阶_哔哩哔哩_bilibili]调参的方式总是根据数据的状况而定,所以没有办法一概而论那我们首先来讲讲正确的调参思路。模型调参,第一步是要找准目标:我们要做什么?一般来说,这个目标是提升某个模...
详解随机森林-用随机森林回归填补缺失值【菜菜的sklearn课堂笔记】
视频作者:[菜菜TsaiTsai]链接:[【技术干货】菜菜的机器学习sklearn【全85集】Python进阶_哔哩哔哩_bilibili]我们现实收集到的数据往往是有缺失值的,我们可以选择含有缺失值的数据,有时候填补缺失值会比直接丢弃样本效果更好,即便我们其实并不知道缺失值的真实样貌。在sklea...
Sklearn实现流形学习
高维数据集通常难以可视化。虽然,可以通过绘制两维或三维的数据来显示高维数据的固有结构,但与之等效的高维图不太直观。为了促进高维数据集结构的可视化,必须以某种方式降低维度。通过对数据的随机投影来实现降维是最简单的方法。虽然这样做能实现数据结构一定程度的可视化,但这种随机选择方式仍有许多有待改进之处。在...
Python: 安装 sklearn 包出现错误的解决方法
今天在安装 Python 的 sklearn 包时出现了 Cannot uninstall 'numpy' 和 Cannot uninstall 'scipy' 错误,下面记录了我尝试了很多网上的方法后最终成功的解决方法。终端执行 pip install scikit-learn 后,出现 Cann...
编程作业1.1——sklearn机器学习算法系列之LinearRegression线性回归
知识点scikit-learn 对于线性回归提供了比较多的类库,这些类库都可以用来做线性回归分析。我们也可以使用scikit-learn的线性回归函数,而不是从头开始实现这些算法。 我们将scikit-learn的线性回归算法应用于编程作业1.1的数据,并看看它的表现。一般来说,只要觉得数据有线性关...
sklearn机器学习算法--K近邻
K近邻构建模型只需要保存训练数据集即可。想要对新数据点做出预测,算法会在训练数据集中找到最近的数据点,也就是它的“最近邻”。1、K近邻分类#第三步导入K近邻模型并实例化KN对象from sklearn.neighbors import KNeighborsClassifier#其中n_neighbo...
Python线性回归算法【解析解,sklearn机器学习库】
一.概述参考博客:https://www.cnblogs.com/yszd/p/8529704.html二.代码实现【解析解】 import numpy as np import matplotlib.pyplot as plt __author__ = 'zhen' # 这里相当于是随机X维度X1...
sklearn简单实现机器学习算法记录
sklearn简单实现机器学习算法记录需要引入最重要的库:Scikit-learn一、KNN算法from sklearn import datasetsfrom sklearn.model_selection import train_test_splitfrom sklearn.neighbors...
【计算机视觉(CV)】sklearn之分类算法与手写数字识别
【计算机视觉(CV)】sklearn之分类算法与手写数字识别作者简介:在校大学生一枚,华为云享专家,阿里云专家博主,腾云先锋(TDP)成员,云曦智划项目总负责人,全国高等学校计算机教学与产业实践资源建设专家委员会(TIPCC)志愿者,以及编程爱好者,期待和大家一起学习,一起进步~.博客主页:ぃ灵彧が...
详解随机森林-概述【菜菜的sklearn课堂笔记】
作者:[菜菜TsaiTsai]集成算法概述继承学习不是一个单独的机器学习算法,而是通过在数据上构建多个模型,继承所有模型的建模结果。集成算法的目标是:集成算法会考虑多个评估器的建模结果,汇总之后得到一个综合的结果,以此来获取比单个模型更好的回归或分类表现多个模型集成成为的模型叫做集成评估器,组成集成...
详解随机森林-分类森林【菜菜的sklearn课堂笔记】
视频作者:菜菜TsaiTsai链接:【技术干货】菜菜的机器学习sklearn【全85集】Python进阶_哔哩哔哩_bilibiliRandomForestClassifier( ["n_estimators='warn'", "criterion='gini'", 'max_depth=No...
AI | 第1章 机器学习 Sklearn 入门笔记
AI | 第1章 机器学习 Sklearn 入门笔记前言1. 机器学习概述1.1 人工智能、机器学习、深度学习的联系1.2 机器学习、数据集值概述1.3 机器学习算法分类1.4 机器学习开发流程1.5 机器学习库与框架2. 数据集2...
详解决策树-用回归树拟合正弦曲线【菜菜的sklearn课堂笔记】
视频作者:菜菜TsaiTsai链接:【技术干货】菜菜的机器学习sklearn【全85集】Python进阶_哔哩哔哩_bilibiliimport numpy as npfrom sklearn.tree import DecisionTreeClassifierimport matplotlib.p...
详解决策树-分类树【菜菜的sklearn课堂笔记】
文章换行有问题,望谅解视频作者:菜菜TsaiTsai链接:【技术干货】菜菜的机器学习sklearn【全85集】Python进阶_哔哩哔哩_bilibili关键概念:节点根节点:没有进边,有出边。包含最初的,针对特征的提问。中间节点:既有进边也有出边,进边只有一条,出边可以有很多条。都是针对特征的提问...
sklearn_线性回归
1. 普通线性回归 Linear Regression(1)目标:class sklearn.linear_model.LinearRegression (fit_intercept=True, normalize=False, copy_X=True, n_jobs=None) (2)参数:(3)s...
探索sklearn | K均值聚类
1 K均值聚类K均值聚类是一种非监督机器学习算法,只需要输入样本的特征 ,而无需标记。K均值聚类首先需要随机初始化K个聚类中心,然后遍历每一个样本,将样本归类到最近的一个聚类中,一个聚类中样本特征值的均值作为这个聚类新的聚类中心,聚类中心的改变,又会改变样本的类别,如此循环往复,直至每一个样本的类别...
sklearn 中的两个半监督标签传播算法 LabelPropagation和LabelSpreading
标签传播算法是一种半监督机器学习算法,它将标签分配给以前未标记的数据点。要在机器学习中使用这种算法,只有一小部分示例具有标签或分类。在算法的建模、拟合和预测过程中,这些标签被传播到未标记的数据点。 LabelPropagation LabelPropagation是一种在图中查找社区的快速算法。它...
使用sklearn之LabelEncoder将Label标准化的方法
今天小编就为大家分享一篇使用sklearn之LabelEncoder将Label标准化的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
Python sklearn KFold 生成交叉验证数据集的方法
今天小编就为大家分享一篇Python sklearn KFold 生成交叉验证数据集的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧