文件名称:文本挖掘处理参数设置界面-tinyxml指南[中文]
文件大小:6.46MB
文件格式:PDF
更新时间:2024-07-04 16:39:33
RapidMiner
图 12.7 单词在每篇文档中出现的情况 在“Process Documents from Data”操作符参数设置里,如图 12.8 我们可以进行许多 的参数调整,例如 vector creation 中除了可以选择“TF-IDF”以外,我们还可以选择“Term Occurrences”单词出现的频率统计,或者“Binary Term Occurrences”二值属性作为输出 结果的统计形式。 图 12.8 文本挖掘处理参数设置界面