文件名称:基于信息熵的粗糙集连续属性多变量离散化算法 (2013年)
文件大小:402KB
文件格式:PDF
更新时间:2024-06-05 01:13:50
自然科学 论文
属性离散化能够降低问题的复杂度,得到更加简短、精确且易于理解的规则。针对现有离散化方法在选择断点时没有考虑属性间和属性内断点的互斥性且不能保证保持决策表的不可分辨关系,本研究提出一种新的基于信息熵的粗糙集连续属性多变量离散化算法(PAD)。它以信息熵作为选择断点的衡量标准,以不可分辨关系为停止标准并引入5条断点预选确选策略。实验结果表明,引入断点预选、确选策略的PAD算法与Ros tta软件中的5个离散化算法相比,具有较高的预测精度和较少的断点数目。