安装完MXNet之后,运行了官网的手写体识别的例子,这个相当于深度学习的Hello world了吧。。
http://mxnet.io/tutorials/python/mnist.html
运行的过程中开始想的是新建一个文件夹专门存放我的工程,但是在导入mxnet的过程中又出现了错,于是将minist的脚本文件放在了与mxnet平行的目录下,可以运行,并且十分节省显存!!但是有以下的问题:
1、在GTX1080的显卡上训练,网络是不收敛的,但是在980或者更旧的显卡上就可以,在github上也有别人遇到了一样的问题,目前不知道如何解决;
2、在开始发现GTX1080训练不首先之后,我就想尝试CPU的训练,但是将mx.model.FeedForward()中的参数由GPU直接改成CPU后报错,后来想了一下,因为mxnet的GPU和CPU的版本是分开的,编译生成的dll也不同,由于我下载的是GPU版本的dll,因此运行cpu模式不可行,如果要采用cpu进行训练的话,就需要下载相应的cpu版本的dll才可以;
现在还是下载别人编译好的dll,没有自己进行编译,这样比较受限,因为不能在代码级别进行调试与修改,如果需要打印出来调试信息或者需要按照自己的需求进行修改时,这样就不可行了。