文件名称:带有Python的数据科学项目:使用Python,Pandas和Scikit-Learn的成功数据科学项目的案例研究方法
文件大小:17.02MB
文件格式:ZIP
更新时间:2024-02-24 02:29:06
python data-science machine-learning numpy pandas-dataframe
使用Python进行数据科学项目 旨在为您提供有关中行业标准数据分析和机器学习工具的实用指南,并提供实际数据。 本课程将帮助您了解如何使用pandas和Matplotlib来严格检查具有摘要统计信息和图形的数据集,并提取要寻求的见解。 使用scikit-learn包,您将在学习如何准备数据并将其提供给机器学习算法(例如正则化逻辑回归和随机森林)的过程中继续建立自己的知识。 您将发现如何调整算法,以对新的和看不见的数据提供最佳预测。 在后面的章节中,您将能够了解这些算法的工作原理和输出结果,不仅可以深入了解模型的预测能力,还可以深入了解进行这些预测的原因。 Stephen Klosterman撰写的 您将学到什么 安装所需的软件包以设置数据科学编码环境 将数据加载到运行Python的Jupyter笔记本中 使用Matplotlib创建数据可视化 使用scikit-learn拟合模型 使用套索和岭回归对模型进行正则化 拟合和调整随机森林模型,并将性能与逻辑回归进行比较 使用Jupyter笔记本的输出创建视觉效果 使用k倍交叉验证选择超参数的最佳组合 硬件要求 为了获得最佳的学生体验,我们
【文件预览】:
Data-Science-Projects-with-Python-master
----Lesson04()
--------.ipynb_checkpoints()
--------Lesson04.ipynb(2.94MB)
----Lesson05()
--------.ipynb_checkpoints()
--------Lesson05.ipynb(1.6MB)
----LICENSE(1KB)
----Lesson02()
--------.ipynb_checkpoints()
--------Lesson02.ipynb(1.11MB)
----README.md(3KB)
----Lesson01()
--------.ipynb_checkpoints()
--------Lesson01.ipynb(1.19MB)
--------Exercise01.py(228B)
----Data()
--------default_of_credit_card_clients__courseware_version_1_21_19.xls(5.93MB)
--------Chapter_1_cleaned_data.csv(3.22MB)
----Lesson06()
--------.ipynb_checkpoints()
--------Lesson06.ipynb(1.02MB)
----Lesson03()
--------.ipynb_checkpoints()
--------Lesson03.ipynb(1.87MB)