文件名称:csc8101:CSC8101 的 Cassandra 课程作业
文件大小:25KB
文件格式:ZIP
更新时间:2024-07-16 06:26:38
Java
CSC8101 网络日志分析课程,2014/15 学年 本课程向您介绍实时分析和基本流处理。 一些分析应用程序要求报告或可视化按需提供,通常在亚秒响应时间内,即与浏览大多数现代动态呈现的网站相当的体验。 此类分析的典型应用领域是系统日志或指标处理,例如用于监控一组服务器上的活动。 满足这样的响应时间目标,特别是在高负载下,通常需要以最小化查询执行所需的磁盘读取活动的方式存储数据。 这反过来可能需要对数据进行非规范化并预先计算汇总统计数据。 在本练习中,您将获得 Web 服务器活动数据,包括站点访问活动的时间顺序列表。 客户端 IP 地址已被替换为匿名的唯一标识符。 对于第一部分,所需的查询是: 对于给定的一组 URL,开始时间和结束时间,显示每个 url 在该时间段内每小时的访问总数。 您应该编写代码来处理日志数据并编写一个数据库表,以便可以通过最少的磁盘读取有效地满足每个应
【文件预览】:
csc8101-master
----src()
--------main()
--------test()
----LICENSE(11KB)
----pom.xml(9KB)
----README.md(4KB)