Jupyter Notebook为用户提供一种称为notebook工作环境——基于web浏览器,交互式的进行程序的开发、调试、分享。
基于Jupyter Notebook的工作环境,进行以下工作:
- 基于浏览器管理文件系统的文件(创建、删除、更名、编辑)。
- 基于浏览器的远程命令窗口。
- 基于浏览器的程序编写,调试。
- 分享notebook的内容。
如果安装于树莓派上,那JupyterNotebooks绝对是一个神器。在这上面进行操作,所有的操作都可以基于浏览器进行,而且不必再使用linux命令行下那些晦涩的文本编辑器(比如vim)。
前提:操作系统这里以Ubuntu为例,已安装docker引擎。
1、下载镜像
下面是我们网站(dataquestio)目前提供的数据科学开发专用镜像:dataquestio/python3-starter
这个镜像已经安装好了Python 3, Jupyter notebook和许多其他流行的数据科学库,包括numpy,pandas,scipy,scikit-learn和nltk。
输入命令: sudo docker pull dataquestio/python3-starter
2、查看镜像
输入命令: sudo docker images dataquestio/python3-starter
3、新建一个文件夹
在本地创建一个文件夹,用于存放notebooks。这个文件夹中将储存你所有的工作文件,并会持续存在于你的机器中,即使是你销毁了docker容器。在这里,我们将创建下面这个文件夹, /home/hanhui/notebooks。
4、运行镜像
通过 docker run运行该镜像。我们还需要传入一些选项,确保镜像配置正确。
-p 选项用于设置虚拟机的端口,让我们可以在本地访问Jupyter notebook服务器。
-d 选项用于以detached模式运行容器,也就是作为背景进程运行。
-v 选项让我们指定在本地机器中使用哪个文件夹存储notebook。
完整的运行命令是类似这样的:
sudo docker run -d -p 8888:8888 -v /home/hanhui/notebooks:/home/ds/notebooks dataquestio/python3-starter
你应该将/home/hanhui/notebooks更改为你用于存储文件的地址。
执行 docker run命令将会创建一个Docker容器。这是与你的本地机器相隔绝的,也可以把它看作是一台单独的电脑。在容器内部,会运行一个Jupyter notebook服务器,并可以让我们使用许多数据科学工具包。
另外, docker run命令也会在终端打印出容器的编码(container id ),在通过其他docker容器对该容器进行修改时,就必须要使用这个编码。
5、查看notebook服务器
这里是Ubuntu的Linux操作系统,本机只需要在浏览器中打开localhost:8888,之后应该就能看到运行中的notebook。局域网内的电脑访问只需要Ubuntu的IP:8888即可。