文件名称:Text-mining:各种文字娱乐
文件大小:9.82MB
文件格式:ZIP
更新时间:2024-07-24 06:29:27
R
文本挖掘工具和解决方案 等级制度: * \data* - 输入输出数据的文件夹。 但是不要尝试在此处添加大量数据 - 没有人在 repo 中需要它 * \R* - R 代码 * \R\data processing* - 从不同来源提取数据的方法 * \R\data 重排* - 数据预处理方法(词干提取、停用词去除等) * \R\feature engineering* - 为您的解决方案创建功能(DTM 矩阵,流行词计数器) * \R\models* - 类似于功能,但更复杂的任务模型(如聚类方法) * \R\solutions* - 在不同的解决方案中,您可以组合不同的方法来实现结果 * \R\ visualisations * - 你的可视化方法 \R\libraries.R - 解决方案所需的库列表
【文件预览】:
Text-mining-master
----.gitignore(27B)
----R()
--------data rearrangement()
--------data processing()
--------models()
--------solutions()
--------feature engineering()
--------libraries.R(222B)
----data()
--------raw()
--------tidy()
--------vocabularies()
----README.md(804B)