文件名称:论文研究-基于特征的数据规格化方法.pdf
文件大小:231KB
文件格式:PDF
更新时间:2022-08-11 12:01:02
数据清洗,最大熵,马尔可夫模型,重叠特征
针对数据清洗时数据的标准化问题提出采用基于特征的马尔可夫模型来解决这一问题。在学习模型的过程中,通过最大熵方法提高样本学习的泛化能力。这种方法能够充分利用数据的重叠特征来辨识数据项对应的状态,结合了统计模型和规则模型的优点。理论分析和实验表明,该方法可以有效地实现数据清洗时的数据规格化。
文件名称:论文研究-基于特征的数据规格化方法.pdf
文件大小:231KB
文件格式:PDF
更新时间:2022-08-11 12:01:02
数据清洗,最大熵,马尔可夫模型,重叠特征
针对数据清洗时数据的标准化问题提出采用基于特征的马尔可夫模型来解决这一问题。在学习模型的过程中,通过最大熵方法提高样本学习的泛化能力。这种方法能够充分利用数据的重叠特征来辨识数据项对应的状态,结合了统计模型和规则模型的优点。理论分析和实验表明,该方法可以有效地实现数据清洗时的数据规格化。