前言:
既然我们选择使用Python来进行机器学习,就需要对Python的机器学习环境有所了解,除了安装Python之外,我们还需要NumPy、SciPy、matplotlib等相关组件,NumPy系统是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix)),SciPy是一款方便、易于使用、专为科学和工程设计的Python工具包.它包括统计,优化,整合,线性代数模块,傅里叶变换,信号和图像处理,常微分方程求解器等等,Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。
下面我们开始基于Python的机器学习环境的搭建:
第一步:安装Python
无论我们选用的是Python2.x还是Python3.x,一定要弄清楚你的机器是32位的还是64位的,我之前下的是32位的Python(机器是64位)在之后使用easy_install安装其他组件时出现错误(要切记)。Python下载网址为:https://www.python.org/downloads/windows/,选择对应的版本即可(带installer)
此时有一点需要注意在安装的时候记得勾选自动配置path,免得之后自己去环境变量里配置。
此时你可以搜索cmd命令打开命令符窗口进行验证,输入Python之后入出现如下信息证明安装成功
第二步:下载相关组件
接下来我们需要安装NumPy、SciPy、matplotlib等组件,在此之前我们需要验证一下是否安装pip,依旧在命令符窗口键入pip --version后如图所示证明安装成功(一般前面步骤没有问题的话,此处不会出现问题)
之后我们就需要去下载NumPy、SciPy、matplotlib等组件,地址为https://www.lfd.uci.edu/~gohlke/pythonlibs/,此处切记下载跟自己Python对应版本的插件,我的如图所示:
之后找到Python的Scripts目录然后将刚才下载的组件拷贝到该目录,例如我的目录为:C:Python\Python36\Scripts,之后再命令符窗口使用cd C:Python\Python36\Scripts 进入到该目录,然后分别执行相关命令安装相关组件,命令为:pip install 文件名称,例如我的是 pip install numpy-1.13.3+mkl-cp36-cp36m-win_amd64.whl(另外两个组件只要更改成对应的文件名就可以),之后执行pip install -U scikit-learn指令安装scikit-learn,安装完毕之后执行pip list 查看安装列表如图所示表示安装完毕:
至此环境搭建完毕。
第四步:验证
打开Python 界面,依次输入
from numpy import *
randMat = mat(random.rand(4,4))
invRandMat = randMat.I
myEye = randMat * invRandMat
myEye - eye(4)
如果顺利完成这些指令表示环境搭建成功,下面就可以进行机器学习的相关学习和开发了。