文件名称:回归分析-tinyxml指南[中文]
文件大小:6.46MB
文件格式:PDF
更新时间:2024-07-04 16:39:28
RapidMiner
第10章 线性回归与逻辑回归 10.1 回归分析 回归分析是通过建立模型来研究变量之间相互关系的密切程度、结构状态及进行模型预 测的一种有效工具,在工商管理、经济、社会、医学和生物学等领域应用十分广泛。从 19 世纪初高斯提出最小二乘估计算起,回归分析的历史已有 200 多年。从经典的回归分析方法 到近代的回归分析方法,按照研究方法划分,回归分析研究的范围大致如下: 一元线性回归 线性回归 多元线性回归 多个因变量与多个自变量的回归 如何从数据推断回归模型基本假设的合理性 基本假设不成立时如何对数据进行修正 回归诊断 判断回归方程拟合的效果 选择回归函数的形式 自变量选择的标准 回归变量选择 逐步回归分析法回归分析 偏最小二乘回归 参数估计方法改进 岭回归 主成分回归 一元非线性回归 非线性回归 分段回归 多元非线性回归 自变量含有 含有定性变量的回归 定性变量的情况 因变量含有定性变量的情况 在数据挖掘环境下,自变量与因变量具有相关关系,自变量的值是已知的,因变量是要 预测的。 常用的回归模型见表 10-1。 表 10-1 主要回归模型分类 回归模型名称 适用条件 算法描述 线性回归 因变量与自变量是 线性关系 对一个或多个自变量和因变量之间的线性关系进 行建模,可用最小二乘法求解模型系数。 非线性回归 因变量与自变量之 间不都是线性关系 对一个或多个自变量和因变量之间的非线性关系 进行建模。如果非线性关系可以通过简单的函数变 换转化成线性关系,用线性回归的思想求解;如果 不能转化,用非线性最小二乘方法求解。