textstem:快速文本提取和词义化的工具

时间:2021-05-14 20:31:33
【文件属性】:
文件名称:textstem:快速文本提取和词义化的工具
文件大小:139KB
文件格式:ZIP
更新时间:2021-05-14 20:31:33
text-mining r stemming lemmatization R 文本干 textstem是用于词干和词素化的工具集。 词干处理是去除词缀的过程。 合法化是将变形的形式分组为单个基本形式的过程。 目录 合法化 默认引理词典 Hunspell引理字典 koRpus Lemma字典 拔牙速度 与其他文字工具结合 职能 下表总结了主要功能,任务类别和说明: 功能 任务 描述 stem_words 词干 词干 stem_strings 词干 茎线 lemmatize_words 形容词 使单词合法化 lemmatize_strings 形容词 使字符串放缩 make_lemma_dictionary_words 形容词 为文本生成引理字典 安装 要下载textstem的开发版本: 下载zip球或tar球,解压缩并运行R CMD INSTALL ,或使用pacman软件包安装开发版本: if (!require("pacman")) inst

网友评论