Numpy
Numpy 提供数组支持,以及相应的高效处理函数。由于 Numpy 还是很多高级扩展库的依赖库,通常在安装其他扩展库之前,需要完成 Numpy 的安装。
Downloads: 点击打开链接
https://pypi.org/project/numpy/#files
在 Windows 中,可以通过 pip 安装:
- 在 pip 所在目录下打开命令窗口,执行命令:
pip install numpy.whl
例:pip install numpy-1.14.3-cp36-none-win_amd64.whl
Note: 这里下载的 wheel 文件的文件名不可随意更改,更改后可能出现错误:“xxx.whl is not a valid filename”
Numpy API REFERENCE: https://docs.scipy.org/doc/numpy/reference/c-api.html
Scipy
Scipy 提供矩阵支持,以及矩阵相关的数值计算模块。Scipy 依赖于 Numpy ,因此安装前需要先安装 Numpy。
Downloads:点击打开链接
https://github.com/scipy/scipy/releases
在 Windows 中,可以通过 pip 安装:
- 在 pip 所在目录下打开命令窗口,执行命令:
pip install scipy.whl
例:pip install scipy-1.1.0-cp36-none-win_amd64.whl
Scipy API REFERENCE: https://docs.scipy.org/doc/scipy/reference/api.html
Matplotlib
Matplotlib 是强大的数据可视化工具,作图库,主要用于二维绘图和简单的三维绘图。通过 Matplotlib 可以快捷地用 Python 可视化数据,并且输出多种图像格式。
Matplotlib 的上级依赖库相对较多,具体包括(建议如下顺序安装各个库):
- numpy:下载地址 https://pypi.org/project/numpy/#files
- six: dateutil 和 cycler 依赖于 six 的 安装。下载地址 https://pypi.org/project/six/#files
- dateutil:下载地址 https://pypi.org/project/python-dateutil/#files
- pytz:下载地址 https://pypi.org/project/pytz/#files
- pyparsing:下载地址 https://pypi.org/project/pyparsing/#files
- kiwisolver:下载地址 https://pypi.org/project/kiwisolver/#files
- setuptools:下载地址 https://pypi.org/project/setuptools/#files
- cycler:下载地址 https://pypi.org/project/Cycler/#files
部分依赖库安装示例如下:
在 Windows 中,可以通过 pip 安装:
- 在 pip 所在目录下打开命令窗口,执行命令:
pip install xxx.whl
Note:出现 error “Could not find a version satisfies the requirments ... ... ”,则说明存在依赖库未安装成功。
以上依赖库均安装成功后,方可安装 Matplotlib
在 Windows 中,可以通过 pip 安装:
- 在 pip 所在目录下打开命令窗口,执行命令:
pip install matplotlib.whl
例:pip install matplotlib-2.2.2-cp36-cp36m-win_amd64.whl
安装示例:
参考链接:
http://www.numpy.org/
http://www.scipy.org/
http://www.matplotlib.org/
Matplotlib API REFERENCE: https://matplotlib.org/api/pyplot_summary.html#the-pyplot-api
Pandas
Pandas 主要用于数据的读取和处理,带有丰富的数据处理函数,支持时间序列分析功能,确实数据的处理等,是 Python 下最强大的数据分析和探索工具。Pandas 构建在 Numpy 之上。
Downloads: https://pypi.org/project/pandas/#files
在 Windows 中,可以通过 pip 安装:
- 在 pip 所在目录下打开命令窗口,执行命令:
pip install pandas.whl
安装完成后,需要安装 xlrd 和 xlwt 库才能支持 Excel 的读写:
Downloads:https://pypi.org/project/xlrd/#files
https://pypi.org/project/xlwt/#files
安装方法与其他库相似,使用 pip 安装,执行命令: pip install xlrd
pip install xlwt
Pandas API REFERENCE: http://pandas.pydata.org/pandas-docs/stable/api.html
Note:若要使用 pandas 读取数据库文件 read_sql,需要知道以下依赖:依赖SQLAlchemy库,而SQLAlchemy库依赖于 PyMySQL。
Pandas在读取数据(不管是csv、xls、sql),都是将全部数据读入内存中,因此在数据量较大时难以实现。所以pandas提供了 chunksize参数,以分块读取大数据文件。
StatsModels
StatsModels 主要用于数据的统计建模分析,支持与 Pandas 进行数据交互,其安装依赖于 Pandas 和 patsy。
Downloads: https://pypi.org/project/statsmodels/#files
https://www.lfd.uci.edu/~gohlke/pythonlibs/#statsmodels
在 Windows 中,可以通过 pip 安装:
- 在 pip 所在目录下打开命令窗口,执行命令:
pip install statsModels.whl
Pandas API REFERENCE:
Scikit-learn
Scikit-learn 提供了完善的机器学习工具箱,包括数据预处理、分类、回归、聚类、预测和模型分析等。Scikit-Learn 的安装依赖于 Numpy、Scipy、Matplotlib。
Note: 依赖库的安装很重要,只有先把依赖库安装成功,然后安装 scikit-learn 就会很容易
Downloads: https://pypi.org/project/scikit-learn/#files
在 Windows 中,可以通过 pip 安装:
- 在 pip 所在目录下打开命令窗口,执行命令:
pip install scikit-learn.whl
Scikit-Learn API REFERENCE: http://scikit-learn.org/stable/modules/classes.html
PyWavelets
StatsModels 是一个较全面的信号处理库,其安装依赖于 Cython,Numpy,Matplotlib。
Downloads: https://pypi.org/project/Cython/#files
https://pypi.org/project/PyWavelets/#files
在 Windows 中,可以通过 pip 安装:
- 在 pip 所在目录下打开命令窗口,执行命令:
pip install Pywavelets.whl
Graphviz
Graphviz 是一个跨平台、基于命令行的绘图工具。主要用于决策树生成后的格式转换,将决策树导出结果 “tree.dot” 转换为 PDF或 PNG 等格式。
Downloads: http://www.graphviz.org/Download_windows.php
双击 .msi 文件进行安装,安装完成后将 dot.exe 的目录添加到系统环境变量
检查安装: dot -version
TSNE
TSNE 是聚类结果可视化工具,提供有效的数据降维方式,可以在2 维或3 维的空间中展示聚类结果。其安装依赖于 Cython,Numpy,Scipy
Downloads: https://pypi.org/project/tsne/#files
解压并运行 setup.py 进行安装