文件名称:论文研究-分布式检索系统中基于混合模型的多站点融合.pdf
文件大小:604KB
文件格式:PDF
更新时间:2022-10-01 06:58:34
论文研究
连续属性的离散化是数据预处理的重要工作。论文分析了基于熵的离散化方法的不足,从估计训练样本的概率分布的角度出发,提出基于样本分布与熵相结合的处理数值型属性的方法。基于UCI数据的实验结果表明,该方法不仅具有比较好的判决精度,而且具有更快的计算速度。
文件名称:论文研究-分布式检索系统中基于混合模型的多站点融合.pdf
文件大小:604KB
文件格式:PDF
更新时间:2022-10-01 06:58:34
论文研究
连续属性的离散化是数据预处理的重要工作。论文分析了基于熵的离散化方法的不足,从估计训练样本的概率分布的角度出发,提出基于样本分布与熵相结合的处理数值型属性的方法。基于UCI数据的实验结果表明,该方法不仅具有比较好的判决精度,而且具有更快的计算速度。