文件名称:Web日志挖掘中的数据预处理研究 (2012年)
文件大小:1.61MB
文件格式:PDF
更新时间:2024-06-06 23:46:13
自然科学 论文
Web日志挖掘中,数据源(日志文件)的复杂性是挖掘所面临的主要问题之一.针对Web日志挖掘的数据预处理问题,全面梳理了数据预处理的全过程.针对日志文件数据量巨大的难题,使用Python语言程序高效的实现了数据清理.在用户识别、会话识别和路径完善中,在传统方法的基础上引入了启发性规则,通过实验数据验证了方法的有效性.
文件名称:Web日志挖掘中的数据预处理研究 (2012年)
文件大小:1.61MB
文件格式:PDF
更新时间:2024-06-06 23:46:13
自然科学 论文
Web日志挖掘中,数据源(日志文件)的复杂性是挖掘所面临的主要问题之一.针对Web日志挖掘的数据预处理问题,全面梳理了数据预处理的全过程.针对日志文件数据量巨大的难题,使用Python语言程序高效的实现了数据清理.在用户识别、会话识别和路径完善中,在传统方法的基础上引入了启发性规则,通过实验数据验证了方法的有效性.