FCN.tensorflow环境配置总结

时间:2021-04-26 13:50:35

五一收假,按照计划,本来是该集成linemod到ros下我之前写的一个工程中。由于rgbd camera和机器人都被借走了,决定先做分割

下面是我的工作总结,包括遇到的问题及解决方案:

1.在工作站上面开了个用户
2.fork了一份FCN.tensorflow https://github.com/shekkizh/FCN.tensorflow的代码,决定先跑跑看
3.运行失败,IO error,发现mat文件没有完全下载下来,以为是网络问题。
4.用笔记本download 500M大小的mat文件,打算scp到工作站上,失败,没有足够空间
5.df了一下发现挂载家目录的磁盘空间所剩不少,于是将所有内容移动至工作站的raid下
6.继续运行发现仍然有错,google了一下找到原来是tensorflow的版本有问题
7.用virtuaenv重新开了一个python环境,不过很多包需要重新下载。
8.python FCN.py 运行仍然不过,依然是tensorflow版本问题,将github的代码check out到tensorflow0.11的兼容版本就可以了
9.开始下载数据集
10.AttributeError: ‘module’ object has no attribute ‘imread’
这里pip install pillow
11.memory 错误,检测发现是gpu的问题,通过环境变量把GPU强行选择一下就ok
12.由于ssh到工作站,关终端可能发送异步信号SIGINT,因此在工作站上运行TMUX,至此开始训练

环境:
主机:ubuntu14.04
工作站:4块TitanX,这里我就用了一块