搞了两天,一遍一遍的操作,终于算是搞定了。我写在这里就算是个笔记,供自己和大家方便!
我以前是在Windows系统里面做这些的,也安装成功了的。现在为了研究Paragraph Vector,我把主要的工作都转到了Ubuntu下面,在选择Java和Python这两种语言的时候,最终还是选择了Python,因为里面很多工具都是现成的,方便后面的研究。
既然选择了Python,就得选个牛逼的IDE吧,因为在Windows下的经历,Eric4成了不二的选择,那就是怎么安装的问题了。
1、安装Eric4
网上真是装法多样,各有各的牛叉,但是我主要是参照两篇博客的内容配合起来就能完成安装:
http://www.linuxidc.com/Linux/2012-10/72417.htm
http://hi.baidu.com/deacys/item/22d831e51bebfcf5e0a5d41f
这主要是动手的问题,我是这个行不通了就换另外一个的内容,反正配合起来,就安装成功了,preference的设置也是参照第一篇博客的设置。
完了试下helloword,成功运行,就OK了。
2、安装gensim
这玩意是谁挖的坑,太深了,摔得我不轻,耗了我两天时间,不厚道。
首先是官网http://radimrehurek.com/gensim/install.html,那叫一个忽悠,easy_install。我在Windows下也搞了很久,最后放弃。
在Ubuntu下,用的这个命令wget https://bootstrap.pypa.io/ez_setup.py -O - | sudo python,一会功夫成功了,然后就是
easy_install numpy
easy_install scipy
不是root账户的,请自觉加sudo.
哎哟妈呀,那个警告那个提示吓到我了,勉强安装完成,我就安装gensim,出现个错误AttributeError,“dist" can't set attribute "_numpy_"记得不是太清了,反正不让我安装了。
那就只能google之,最后听人说要先卸载,还好easy_install -m能够卸载包,可是发现不能去除.egg。真是事多,只能到root下,rm -rf 删之,以前没用过,删时左右忐忑,还好系统没有崩溃(菜鸟)。
算了,不废话了,后面还有几个曲折的过程就不讲了,上正餐。
参考博客http://www.52nlp.cn/%E5%A6%82%E4%BD%95%E8%AE%A1%E7%AE%97%E4%B8%A4%E4%B8%AA%E6%96%87%E6%A1%A3%E7%9A%84%E7%9B%B8%E4%BC%BC%E5%BA%A6%E4%BA%8C
人家就是牛,三个命令搞定了:
sudo apt-get install python-numpy
sudo apt-get install python-scipy
一个警告都没,心里一下有底了,然后下载gensim.tar.gz,然后提取,最后sudo python setup.py install
输入from gensim import corpora, models, similarities没有出错,就说明安装成功了。
好了,总结一下,easy_install我是真心怕了,以后我是不敢乱用了。