从事机器学习,数据分析,数据挖掘的同学们以及python使用者
课程概述
选择经典案例基于真实数据集,从数据预处理开始到建立机器学习模型以及效果评估,完整的讲解如何使用python及其常用库进行数据的分析和模型的建立。对于每一个面对的挑战,分析解决问题思路以及如何构造合适的模型并且给出合适评估方法。在每一个案例中,同学们可以快速掌握如何使用pandas进行数据的预处理和分析,使用matplotlib进行可视化的展示以及基于scikit-learn库的机器学习模型的建立。
课程目录
章节1:使用Python库分析处理Kobe Bryan职业生涯数据
课时1课程简介 03:01
课时2课程数据,代码下载4
课时3使用Anaconda搭建python环境 13:10
课时4Kobe Bryan生涯数据读取与简介 07:45
课时5特征数据可视化展示 11:41
课时6数据预处理 12:32
课时7使用scikit-learn建立分类模型 10:12
章节2:信用卡欺诈行为检测
课时8数据简介及面临的挑战 10:56
课时9数据不平衡问题解决方案 13:14
课时10逻辑回归进行分类预测 15:26
课时11使用阈值来衡量预测标准 17:04
课时12使用数据生成策略 11:00
章节3:鸢尾花数据集分析
课时13数据简介与特征课时化展示 11:10
课时14不同特征的分布规则 06:32
课时15决策树模型参数详解 11:07
课时16决策树中参数的选择 09:28
课时17将建立好决策树可视化展示出来 08:47
章节4:泰坦尼克号获救预测
课时18船员数据分析 06:10
课时19数据预处理 13:36
课时20使用回归算法进行预测 14:30
课时21使用随机森林改进模型 12:56
课时22随机森林特征重要性分析 10:40
章节5:级联结构的机器学习模型
课时23级联模型原理 05:06
课时24数据预处理与热度图 10:25
课时25二阶段输入特征制作 06:35
课时26使用级联模型进行预测 13:29
章节6:员工离职预测
课时27数据简介与特征预处理 13:34
课时28员工不同属性指标对结果的影响 15:42
课时29数据预处理 12:03
课时30构建预测模型 10:28
课时31基于聚类模型的分析 05:42
章节7:使用神经网络进行手写字体识别(mnist)
课时32tensorflow框架的安装 07:09
课时33神经网络模型概述 12:53
课时34使用tensorflow设定基本参数 09:52
课时35卷积神经网络模型 10:49
课时36构建完整的神经网络模型 14:32
课时37训练神经网络模型 12:34
章节8:主成分分析(PCA)
课时38PCA原理简介 05:34
课时39数据预处理 08:42
课时40协方差分析 10:27
课时41使用PCA进行降维 07:46
章节9:基于NLP的股价预测
课时42数据简介与故事背景 04:11
课时43基于词频的特征提取 10:25
课时44改进特征选择方法 12:25
章节10:借贷公司数据分析
课时45数据清洗 12:08
课时46数据预处理 10:12
课时47盈利方法和模型评估 13:26
课时48预测结果 12:47
下载地址:百度网盘下载