【文件属性】:
文件名称:textstem:快速文本提取和词义化的工具
文件大小:139KB
文件格式:ZIP
更新时间:2021-05-14 20:31:33
text-mining r stemming lemmatization R
文本干
textstem是用于词干和词素化的工具集。 词干处理是去除词缀的过程。 合法化是将变形的形式分组为单个基本形式的过程。
目录
合法化
默认引理词典
Hunspell引理字典
koRpus Lemma字典
拔牙速度
与其他文字工具结合
职能
下表总结了主要功能,任务类别和说明:
功能
任务
描述
stem_words
词干
词干
stem_strings
词干
茎线
lemmatize_words
形容词
使单词合法化
lemmatize_strings
形容词
使字符串放缩
make_lemma_dictionary_words
形容词
为文本生成引理字典
安装
要下载textstem的开发版本:
下载zip球或tar球,解压缩并运行R CMD INSTALL ,或使用pacman软件包安装开发版本:
if (!require("pacman")) inst