文件名称:应用预测建模 Applied Predictive Modeling
文件大小:74.6MB
文件格式:PDF
更新时间:2021-07-04 03:59:15
R语言 数据分析 数据挖掘 机器学习
译者序 前言 第1章 导论 1.1 预测与解释 1.2 预测模型的关键部分 1.3 专业术语 1.4 实例数据集和典型数据场景 1.5 概述 1.6 符号 第一部分 一般策略 第2章 预测建模过程简介 2.1 案例分析:预测燃油效能 2.2 主题 2.3 总结 第3章 数据预处理 3.1 案例分析:高内涵筛选中的细胞分组 3.2 单个预测变量数据变换 3.3 多个预测变量数据变换 3.4 处理缺失值 3.5 移除预测变量 3.6 增加预测变量 3.7 区间化预测变量 3.8 计算 习题 第4章 过度拟合与模型调优 4.1 过度拟合的问题 4.2 模型调优 4.3 数据分割 4.4 重抽样技术 4.5 案例分析:信用评分 4.6 选择调优参数值 4.7 数据划分建议 4.8 不同模型间的选择 4.9 计算 习题 第二部分 回归模型 第5章 衡量回归模型的效果 5.1 模型效果的定量度量 5.2 方差偏差的权衡 5.3 计算 第6章 线性回归及其扩展 6.1 案例分析:定量构效关系建模 6.2 线性回归 6.3 偏最小二乘法 6.4 惩罚模型 6.5 计算 习题 第7章 非线性回归模型 7.1 神经网络 7.2 多元自适应回归样条 7.3 支持向量机 7.4 K近邻 7.5 计算 习题 第8章 回归树与基于规则的模型 8.1 简单回归树 8.2 回归模型树 8.3 基于规则的模型 8.4 装袋树 8.5 随机森林 8.6 助推法 8.7 Cubist 8.8 计算 习题 第9章 溶解度模型总结 第10章 案例研究:混凝土混合物的抗压强度 10.1 模型构建策略 10.2 模型性能 10.3 优化抗压强度 10.4 计算 第三部分 分类模型 第11章 分类模型的效果度量 11.1 类预测 11.2 评估预测类 11.3 评估类概率 11.4 计算 第12章 判别分析和其他线性分类模型 12.1 案例分析:预测是否成功申请经费 12.2 逻辑回归 12.3 线性判别分析 12.4 偏最小二乘判别分析 12.5 惩罚模型 12.6 最近收缩质心 12.7 计算 习题 第13章 非线性分类模型 13.1 非线性判别分析 13.2 神经网络 13.3 灵活判别分析 13.4 支持向量机 13.5 K近邻 13.6 朴素贝叶斯 13.7 计算 习题 第14章 分类树与基于规则的模型 14.1 基本的分类树 14.2 基于规则的模型 14.3 装袋决策树 14.4 随机森林 14.5 助推法 14.6 C5.0 14.7 比较两种分类预测变量编码方式 14.8 计算 习题 第15章 经费申请模型的总结 第16章 对严重类失衡的补救方法 16.1 案例分析: 预测房车保险所有权 16.2 类失衡的影响 16.3 模型调优 16.4 选择截点 16.5 调整先验概率 16.6 不等案例权重 16.7 抽样方法 16.8 成本敏感度训练 16.9 计算 习题 第17章 案例研究:作业调度 17.1 数据切分和模型策略 17.2 结果 17.3 计算 第18章 衡量预测变量重要性 18.1 数值结果变量 18.2 分类结果变量 18.3 其他方法 18.4 计算 习题 第19章 特征选择介绍 19.1 使用无信息预测变量的结果 19.2 减少预测变量个数的方法 19.3 绕封法 19.4 过滤法 19.5 选择偏差 19.6 案例分析:预测认知损伤 19.7 计算 习题 第20章 影响模型表现的因素 20.1 第Ⅲ类错误 20.2 结果变量的测量误差 20.3 预测变量的测量误差 20.4 连续变量离散化 20.5 模型预测何时是可信的 20.6 大样本的影响 20.7 计算 习题 附录 附录A 各种模型的总结 附录B R语言介绍 附录C 值得关注的网站 参考文献