随着大数据时代的到来,数据挖掘与分析愈发火热,一个好的工具可以使我们快速赶上这趟快车。由于python和R语言的简单易学,外加有丰富的优秀的第三方库直接可以用于数据挖掘和分析,所以目前大部分的数据分析师都流行左手python右手R。
那如何选择一个较好的IDE来做我们的数据分析工作呢?对于IDE优劣的争议太多,我不想陷入该争议中,但是,可以安利几个大家比较认可的IDE。对于python而言,Atom、pycharm、Anaconda等都是不错的选择,对于高手可以使用Vim,Sublime Text等编辑器;而对R语言来讲,Rstudio是最佳的选择。我所使用的IDE主要是Anaconda和Rstudio。那有没有一种可以集两者于一体可*切换的呢?答案就是Jupyter notebook。
Jupyter notebook是一款神器,充分体现了share精神,可以一键markdown,方便大家的交流与学习。一般而言,如果你已安装Anaconda,便已安装Jupyter notebook。对于Anaconda的安装,很简单,直接官网下载相应版本(目前是py2.7和py3.6),选择安装路径安装即可。如果你安装的是Anaconda py2.7,如何在windows环境下配置Jupyter notebook的python3与R运行环境呢?其实,Jupyter notebook可以支持很多语言,这里主要介绍python3与R运行环境的配置。
首先,在‘开始’菜单下找到‘Anaconda2’,打开其Anaconda Prompt,在打开的黑色的类似cmd窗口中输入jupyter notebook
并回车。
在你的默认浏览器下,会打开一个Home页面,单击右上角new的下拉菜单。
你会发现有python2,还没有出现我已安装好的R,那如何配置R环境呢?其实是Jupyter nootebook缺少一个R的运行核IRkernel,安装即可。首先,假定你已在本地安装好R并能正确运行R。比如我的安装路径是D:\program files\R\R-3.3.3\bin\x64,该路径下一定要有R.exe,务必将该路径加入环境变量path中。
关掉Jupyter notebook在浏览器打开的Home,点击Anaconda prompt命令框,Ctrl + C中止Jupyter(红框显示),然后输入R
,如下图所示,输入光标已变成“>”,表示已进入R环境,如果你没有将包含有R.exe的路径加入到环境变量path就会报错。
因为IRkernel包托管在github上,需要先加载devtools这个包,如果之前没有安装devtools,这时需要你在命令窗口的“>”提示符后面输入以下语句install.packages('devtools')
,选择相应的镜像(只要带有China字样的都可以),下载安装devtools包。然后执行devtools::instal_github('IRkernel/IRkernel')
IRkernel::installspec()
安装完成后,输入q()退出R环境,再次执行jupyter notebook。这样就会在new的下拉菜单下多出一个R的选项。点击该R就可以建立R的笔记,便可愉快地开始R的学习旅程。
对于python3的环境配置,如果你不想改变Anaconda的python版本,可以搭建一个python3的虚拟环境。同样,先进入Anaconda Prompt命令行模式,执行conda create -n python3 python=3
其中,python3可以改写,可以取你自己喜欢的名字,选择y。
注意,这里可能会有一个Httperror的错误,解决的方法也很简单,就是把你的Anaconda Cloud的账号重新登录一遍就OK了。
这时,在你的Anaconda安装目录下envs文件夹下,多出一个python3这样一个文件夹,并且提示你,使用这个虚拟环境之前需要先**这个虚拟环境。
执行activate python3
此时,会变成(python3)>输入提示符,此时已进入虚拟的python3环境,可以执行pip install tensorflow
,欢迎入坑,然后再执行jupyter notebook
,打开new的下拉菜单。
what?什么也没有变化,还是以前的python2和R环境。没关系,功夫不负有心人,这时你需要,关闭Home网页,Ctrl + C停止Jupyter的运行,执行conda install nb_conda
。
选择y,成功之后,再次输入jupyter notebook
。
此时你所搭建的python3虚拟环境也就有了。
实验一下。
成功!让我们一起开启快乐的深度学习和迁移学习之旅吧!
By the way:当Jupyter notebook 需要使用python3虚拟环境时,一定记住先在Anaconda Prompt执行activate python3
**虚拟环境,再进入Jupyter。