pandas 常用回归模型总结

简单线性回归：

一个因变量一个自变量

公式： y = a + bx + e 常数项: a 回归系数：b 随机误差:e

from sklearn.linear_model import LinearRegression 从sklearn中导入线性回归模型

model = LinearRegression() 创建模型

(x, y) 使用自变量和因变量对模型进行训练

(x, y) 使用自变量和因变量对模型进行评分

() 输入参数进行预测

多重线性回归：

一个因变量和多个自变量

公式：y = a + b1X1 + b2X2 + 。。。bnXn + e 常数项: a 偏回归系数：bn 随机误差:e

导入的包和建模训练过程和简单线性回归相同。

一元非线性回归分析：

一个因变量一个自变量

公式：

表现为一元n次方程 y = aX ² + bX ¹ + c X º

求解方法：将一元非线性回归方程转化为多重线性回归(多元一次)方程

from sklearn.linear_model import LinearRegression 从sklearn中导入线性回归模型

from import PolynomialFeatures 从sklearn中导入处理一元非线性回归方程输入参数的预处理包

po = PolynomialFeatures(degree=n) 创建预处理类 n为一元n次方程的最高次数

fit_x = po. fit_transform(x) 将原参数x转换成为新的fit_x

model = LinearRegression() 创建线性回归模型

(fit_x, y) 使用转换自变量和因变量对模型进行训练

(fit_x, y) 使用转换自变量和因变量对模型进行评分

(po. fit_transform()) 输入转换参数进行预测

逻辑回归：

针对因变量为分类变量进行回归分析的统计方法，算法易于实现和部署，执行效率和准确率高

查看数据中的离散型特征：

1：离散型特征没有大小意义：例如性别

pandas.get_dummies() 进行虚拟变量转化同时参数 drop_first=True来消除共线性

2：离散型特征存在大小意义：例如学历

将数据中的所有存在大小意义的数据用数字进行大小表示

from sklearn.linear_model import LogisticRegression 从sklearn线性模型中导入逻辑回归模型

model = LogisticRegression() 创建模型

(x , y) 将进行虚拟化后筛选出的特征自变量输入模型，因变量输入，进行模型训练

(x , y) 模型评分

model. predict (x1) 将进行同样虚拟化的特征参数输入模型进行预测

秒客网