Web日志挖掘中的数据预处理研究 (2012年)

时间:2024-06-06 23:46:13
【文件属性】:

文件名称:Web日志挖掘中的数据预处理研究 (2012年)

文件大小:1.61MB

文件格式:PDF

更新时间:2024-06-06 23:46:13

自然科学 论文

Web日志挖掘中,数据源(日志文件)的复杂性是挖掘所面临的主要问题之一.针对Web日志挖掘的数据预处理问题,全面梳理了数据预处理的全过程.针对日志文件数据量巨大的难题,使用Python语言程序高效的实现了数据清理.在用户识别、会话识别和路径完善中,在传统方法的基础上引入了启发性规则,通过实验数据验证了方法的有效性.


网友评论