python3安装nltk

时间:2024-05-31 11:26:27

NLTK在自然语言处理方面很方便,最近正好在学习tensorflow,利用neural network对文本分类

完成上一篇博客中ubuntu14.04下python3安装tensorflow1.1的配置后,安装nltk

安装nltk
pip3 install nltk (为了后续实验方便,这里采用python3, pip3安装)
完成后import nltk 没有出现错误
python3
import nltk

手动下载数据集

由于在国外的网站下载实在太慢了,对于Python3,所对应的nltk_data数据包nltk_data-gh-pages.zip。其他博客中提到的nltk_data.zip数据集对应的是python2。

查看数据集存放位置

from nltk.book import *
出现如下错误:
LookupError:
Resource u’corpora/gutenberg’ not found. Please use the NLTK
Downloader to obtain the resource: >>> nltk.download()
Searched in:
- ‘/root/nltk_data’
- ‘/home/nltk_data’
- ‘/usr/share/nltk_data’
- ‘/usr/local/share/nltk_data’
- ‘/usr/lib/nltk_data’
- ‘/usr/local/lib/nltk_data’
将下载好的nltk_data-gh-pages.zip数据集复制到/root/目录下,并解压
unzip nltk_data-gh-pages.zip
cd nltk_data-gh-pages
将nltk_data-gh-pages文件夹下的packages文件夹复制到/root/nltk_data目录下
mkdir /root/nltk_data
cp -r packages/* /root/nltk_data/

完成

python3安装nltk

(最好将nltk_data子目录下的压缩文件都解压)

nltk_data-gh-pages.zip:
http://pan.baidu.com/s/1dEPZSR3 密码:0zsa