大多数朋友学习python的目的是要进行数据处理和数据分析。利用python进行数据分析推荐大家学习《利用Python进行数据分析(第2版)》和《Python数据科学手册》。
《Python数据科学手册》是对以数据深度需求为中心的科学、研究以及针对计算和统计方法的参考书。
《Python数据科学手册》共五章,每章介绍一到两个Python数据科学中的重点工具包。首先从IPython和Jupyter开始,它们提供了数据科学家需要的计算环境;第2章讲解能提供ndarray对象的NumPy,它可以用Python高效地存储和操作大型数组;第3章主要涉及提供DataFrame对象的Pandas,它可以用Python高效地存储和操作带标签的/列式数据;第4章的主角是Matplotlib,它为Python提供了许多数据可视化功能;第5章以Scikit-Learn为主,这个程序库为最重要的机器学习算法提供了高效整洁的Python版实现。
学习参考:
《Python数据科学手册》原版中文PDF,474页,带书签目录,文字可以复制。
《Python数据科学手册》原版英文PDF,548页,带书签目录,文字可以复制。
配套源代码。
下载: https://pan.baidu.com/s/1cE7VsR115Bgg7Yb-axrdfw
提取码: 9n94
应该算利用 Python 进行数据分析的入门书,涉及到
1. IPython
2. Numpy
3. Pandas
4. Matplotlib
5. Machine learning
在编排上主要考虑了系统性和完整性,从数据分析的角度来看,一般只要掌握 pandas 就可以了,不需要再深入了解底层的 Numpy。此外,最好用 IDE 例如 Jetbrains 家的 Pycharm,之前也曾经试过折腾用 Emacs 搭建 Python 环境,还是不如直接上 IDE 来得方便。
《Python数据科学手册》适合有编程背景,并打算将开源Python工具用作分析、操作、可视化以及学习数据的数据科学研究人员。
如果有一定的数据分析与机器学习理论与实践基础,这本书是绝佳选择。
另推荐学习另一本数据分析好书:
《利用Python进行数据分析(第2版)》中文版pdf+英文版pdf+源代码
下载:https://pan.baidu.com/s/1SW6x6tHWD_VMjD3CkqIi6w