1. 我们在可以使用Python中的第三方库来帮助我们分词,统计汉字中出现的单词的频率,一般是需要借助于Python中的第三方库来帮助我们进行分词,这里就需要使用到Python中的第三方库jieba,因为是第三方库,所以我们需要对其进行安装
使用在线安装感觉好麻烦,安装的过程容易出现各种各样的错误,我自己使用在线安装也没有成功,所以下面采用的是离线安装jieba库
安装前需要注意查看python的安装路径和Scripts的路径是否配置已经配置到环境变量中,假如没有那么需要先配置这些环境变量才可以在Windows的cmd命令行中运行pip命令,在用户变量中将python安装中的Scripts路径拷贝到path中即可,注意在路径中需要加上分号分割
2. 具体步骤如下:
① 首先需要从官网上下载压缩包
https://pypi.org/project/jieba/
② 解压到其中的一个盘,进入到存在setup文件夹的目录,在文件导航栏中输入cmd,回车
③ 输入python setup.py install 回车假如没有什么错误可以看到安装过程中的相关信息
④ 使用命令pip list查看安装的jieba库是否成功