点击流数据仓库

时间:2011-08-14 03:33:59
【文件属性】:

文件名称:点击流数据仓库

文件大小:15.16MB

文件格式:PDF

更新时间:2011-08-14 03:33:59

Database


【原 书 名】 Clickstream Data Warehousing
【原出版社】 John Weley
【作 者】(美)Mark Seiger,Mark R.Madsen,Jimmy Langston,Howard Lombard
【译 者】 陆昌辉 张光剑 陈佐 张丽
【丛 书 名】 数据仓库与数据挖掘技术应用丛书

http://images.china-pub.com/ebook15001-20000/16342/shupi.jpg


本书解释了构建点击流数据仓库所需要的Web技术和IT基础设施,并对设计、实现点击流数据仓库的整个过程提供全面的指导,包括:计划、人员分工以及管理整个工程;使用创新的元模式设计模板设计点击流数据仓库;挑选合适的数据仓库软件和存储子系统以支撑点击流数据仓库;建立抽取、变形和装载(即ETL)机制,以及将数据传送给分析这些数据的终端用户。 本书主要面向学习或在工作中运用点击流数据仓库技术的教师、学生或工程技术人员,特别适合对数据仓库技术有所了解,但希望进一步提高构建点击流数据仓库能力的应用开发人员。


第一篇 点击流数据仓库的构建基础
第1章 典型电子商务体系结构
◣ 1.1 电子商务体系结构简述
◣ 1.2 INTERNET服务提供商——ISP
◣ 1.3 多种INTERNET连接服务
◣ 1.4 多种物理WEB服务器
◣ 1.5 不同类型的备份WEB服务器
◣ 1.6 集群商业交易系统
◣ 1.7 点击流数据仓库
◣ 1.8 规范的电子商务体系结构
◣ 1.9 小结
第2章 Web应用环境
◣ 2.1 状态无关的HTTP事务模型
◣ 2.2 HTTP事务间的信息交互
◣ 2.3 查询字符串
◣ 2.4 COOKIES, 用户标识以及WEB服务器日志记录
◣ 2.5 站点点击、页面访问和用户会话
◣ 2.6 使用CGI调用其他可执行程序
◣ 2.7 使用脚本语言记录用户行为
◣ 2.8 网页服务器、应用服务器及动态生成WEB页
◣ 2.9 动态生成WEB页和搜索引擎
◣ 2.10 小结
第3章 点击流数据源和Web服务器日志文件
◣ 3.1 WEB服务器日志
3.1.1 标准日志文件格式
3.1.2 扩展Web服务器的日志
3.1.3 Cookies
◣ 3.2 内部数据源
3.2.1 Web站点和日志文件分析工具
3.2.2 其他的Web服务器相关系统
3.2.3 商务应用
3.2.4 客户联系系统
◣ 3.3 外部数据源
3.3.1 内容缓存服务
3.3.2 合作伙伴
3.3.3 在线广告数据
3.3.4 代理商的关于用户或商业的数据
◣ 3.4 小结
第4章 用Cookies和其他机制跟踪用户身份
◣ 4.1 维持应用状态的WEB编程技术
4.1.1 Cookies
4.1.2 查询字符串和URL重写
4.1.3 隐藏表单域
◣ 4.2 管理会话并跟踪用户
4.2.1 用Cookies跟踪会话
4.2.2 用URL重写来跟踪会话
4.2.3 用隐藏域来跟踪会话
4.2.4 会话管理的设计技术
4.2.5 跟踪用户
◣ 4.3 用户的身份验证和用户概要信息
4.3.1 在线用户分类
4.3.2 用户身份验证
4.3.3 处理用户身份的数据
4.3.4 建立用户概要信息
◣ 4.4 网站的个性化和用户概要信息
4.4.1 基本的个性化方法
4.4.2 个性化的类型
4.4.3 数据仓库和Web站点概要信息之间的链接
◣ 4.5 隐私权政策对点击流数据仓库的影响
◣ 4.6 小结
第二篇 逐步建立点击流数据仓库
第5章 点击流数据仓库的计划、管理及其人员配置
◣ 5.1 点击流数据仓库项目流程简介
◣ 5.2 项目管理
5.2.1 第1阶段:项目定义和计划
5.2.2 第2阶段:商业需求分析
5.2.3 第3阶段:数据仓库设计
5.2.4 第4阶段:数据仓库的实现
5.2.5 第5阶段:部署阶段
◣ 5.3 项目人员配置和组织
5.3.1 项目角色
5.3.2 项目组织
5.3.3 项目人员
◣ 5.4 小结
第6章 点击流数据仓库的元模式
◣ 6.1 由销售分析基准发展到元模型
6.1.1 CRM客户维
6.1.2 用户行为/站点点击事实表
6.1.3 用户维
6.1.4 财政时间维和用户时间维
6.1.5 物理、Web和站点地理维
6.1.6 内容和活动维
6.1.7 内部促销维和外部促销维
6.1.8 用户活动/站点点击元模式
◣ 6.2 元模式属性
6.2.1 财政时间维属性
6.2.2 用户时间维属性
6.2.3 物理地理维属性
6.2.4 Web地理维属性
6.2.5 站点地理维属性
6.2.6 用户维属性
6.2.7 内容维属性
6.2.8 活动维属性
6.2.9 内部促销维属性
6.2.10 外部促销维属性
6.2.11 用户活动/站点事实表属性
◣ 6.3 页面活动和会话活动聚合
6.3.1 页面维
6.3.2 会话维
6.3.3 会话聚合
◣ 6.4 元模式的B2B应用
◣ 6.5 对现有面向商务模式加入点击流特征
◣ 6.6 用多个冗余WEB服务器来支持大型的站点
◣ 6.7 小结
第7章 实现合适的点击流数据仓库的技术基础
◣ 7.1 点击流数据仓库的数据库支持
7.1.1 RDBMS的批装载器
7.1.2 分区
7.1.3 索引
7.1.4 特殊的联接(joins)
7.1.5 聚合的创建、认识和管理
7.1.6 并行性
7.1.7 对SQL的有用分析扩展
◣ 7.2 磁盘驱动和卷管理
7.2.1 逻辑卷管理
7.2.2 数据库对象
7.2.3 对数据库对象磁盘布局的建议
◣ 7.3 选择合适的基础结构供应商
7.3.1 数据库软件
7.3.2 逻辑卷管理软件(LVM)和磁盘子系统
◣ 7.4 小结
第8章 建立点击流的抽取、转换和装载机制
◣ 8.1 抽取、转换和装载的体系结构
◣ 8.2 点击流ETL体系结构
8.2.1 更加复杂的点击流环境
8.2.2 点击流ETL体系结构
◣ 8.3 建立ETL子系统
8.3.1 第1步:数据分析
8.3.2 第2步:使Web站点适合点击流
8.3.3 第3步:创建高层ETL设计和体系结构
8.3.4 第4步:设计特定点击流的组件
8.3.5 第5步:设计和建立ETL组件维表
8.3.6 第6步:设计和建立事实表ETL组件
8.3.7 第7步:建立数据装载机制和整合ETL程序
8.3.8 第8步:为数据管理建立支持
◣ 8.4 小结
第9章 点击流数据仓库中的数据分析
◣ 9.1 OLAP 工具
9.1.1 MOLAP概述
9.1.2 ROLAP 概述
9.1.3 HOLAP 概述
9.1.4 今天的OLAP
◣ 9.2 分析特点和技术
9.2.1 查询工具相关特点和技术
9.2.2 数据模型相关的特点和技术
9.2.3 数据库引擎相关特性和技术
◣ 9.3 小结


http://www.china-pub.com/16342


网友评论

  • 还行吧,感谢分享。
  • 终于看完了! 效果还行, 就是不太清晰
  • 相当棒的一本书,赞一个
  • 不用积分下载,真是好人啊。慢慢学习。知识就该共享。
  • 还不错,慢慢了解,慢慢看~
  • 还不错 了解写知识
  • 马上要接触数据仓库方面知识,先下载资料学习。谢谢分享!
  • 对网站分析很有用的资料,就是不大清晰。
  • 哥哥,这是一本影印版的书记!如果要看完420页 ,不花费点功夫不行啊 !!
  • 比较经典的一本书
  • 东抄西抄了一堆东西,核心问题没讲清楚
  • 感觉没什么实用意义啊,对数据仓库软件和分析方法等都没有怎么介绍。。。
  • Iommon的又一力作,看他的书总觉得说得很有道理,但在实际中还是不知道怎么用,有的时候受开发环境限制,也不一定能够按照理论上的去做。
  • 谢谢!挺有用的, 点击流数据仓库是不可或缺的
  • 3Q,第一次接触这个东西,感觉挺有用的。就是有关键的地方说得不太清楚