简单线性回归:
一个因变量一个自变量
公式: y = a + bx + e 常数项: a 回归系数:b 随机误差:e
from sklearn.linear_model import LinearRegression 从sklearn中导入线性回归模型
model = LinearRegression() 创建模型
(x, y) 使用自变量和因变量对模型进行训练
(x, y) 使用自变量和因变量对模型进行评分
() 输入参数进行预测
多重线性回归:
一个因变量和多个自变量
公式:y = a + b1X1 + b2X2 + 。。。bnXn + e 常数项: a 偏回归系数:bn 随机误差:e
导入的包和建模训练过程和简单线性回归相同。
一元非线性回归分析:
一个因变量一个自变量
公式:
表现为一元n次方程 y = aX ² + bX ¹ + c X º
求解方法:将一元非线性回归方程转化为多重线性回归(多元一次)方程
from sklearn.linear_model import LinearRegression 从sklearn中导入线性回归模型
from import PolynomialFeatures 从sklearn中导入处理一元非线性回归方程输入参数的预处理包
po = PolynomialFeatures(degree=n) 创建预处理类 n为一元n次方程的最高次数
fit_x = po. fit_transform(x) 将原参数x转换成为新的fit_x
model = LinearRegression() 创建线性回归模型
(fit_x, y) 使用转换自变量和因变量对模型进行训练
(fit_x, y) 使用转换自变量和因变量对模型进行评分
(po. fit_transform()) 输入转换参数进行预测
逻辑回归:
针对因变量为分类变量进行回归分析的统计方法,算法易于实现和部署,执行效率和准确率高
查看数据中的离散型特征:
1:离散型特征没有大小意义:例如性别
pandas.get_dummies() 进行虚拟变量转化同时参数 drop_first=True来消除共线性
2:离散型特征存在大小意义:例如学历
将数据中的所有存在大小意义的数据用数字进行大小表示
from sklearn.linear_model import LogisticRegression 从sklearn线性模型中导入逻辑回归模型
model = LogisticRegression() 创建模型
(x , y) 将进行虚拟化后筛选出的特征自变量输入模型,因变量输入,进行模型训练
(x , y) 模型评分
model. predict (x1) 将进行同样虚拟化的特征参数输入模型进行预测