pandas 常用回归模型总结

时间:2025-02-11 11:25:17

简单线性回归:

一个因变量一个自变量

公式: y = a + bx + e  常数项: a  回归系数:b   随机误差:e

from sklearn.linear_model import LinearRegression 从sklearn中导入线性回归模型

model = LinearRegression()   创建模型

(x, y)  使用自变量和因变量对模型进行训练

(x, y) 使用自变量和因变量对模型进行评分

()  输入参数进行预测

多重线性回归:

一个因变量和多个自变量

公式:y =  a + b1X1 + b2X2 + 。。。bnXn + e  常数项: a  偏回归系数:bn   随机误差:e

导入的包和建模训练过程和简单线性回归相同。

一元非线性回归分析:

一个因变量一个自变量

公式:

表现为一元n次方程   y = aX ² + bX ¹ + c X º

求解方法:将一元非线性回归方程转化为多重线性回归(多元一次)方程

from sklearn.linear_model import LinearRegression 从sklearn中导入线性回归模型

from import PolynomialFeatures  从sklearn中导入处理一元非线性回归方程输入参数的预处理包

po = PolynomialFeatures(degree=n)  创建预处理类 n为一元n次方程的最高次数

fit_x = po. fit_transform(x) 将原参数x转换成为新的fit_x

model = LinearRegression()  创建线性回归模型

(fit_x, y)  使用转换自变量和因变量对模型进行训练

(fit_x, y) 使用转换自变量和因变量对模型进行评分

(po. fit_transform())  输入转换参数进行预测

逻辑回归:

针对因变量为分类变量进行回归分析的统计方法,算法易于实现和部署,执行效率和准确率高

查看数据中的离散型特征:

       1:离散型特征没有大小意义:例如性别

              pandas.get_dummies() 进行虚拟变量转化同时参数 drop_first=True来消除共线性

       2:离散型特征存在大小意义:例如学历

              将数据中的所有存在大小意义的数据用数字进行大小表示

from sklearn.linear_model import LogisticRegression   从sklearn线性模型中导入逻辑回归模型

model = LogisticRegression() 创建模型

(x , y) 将进行虚拟化后筛选出的特征自变量输入模型,因变量输入,进行模型训练

(x , y)  模型评分

model. predict (x1)  将进行同样虚拟化的特征参数输入模型进行预测