文件名称:数据仓库准备工作-ubuntu18.04.2下安装 rtx2080 nvidia显卡驱动的方法
文件大小:1.59MB
文件格式:PDF
更新时间:2024-07-15 23:12:29
电商 用户画像 大数据
七、 电商用户画像数据仓库建立 7.1 数据仓库准备工作 为什么要对数据仓库分层? 用空间换时间,通过大量的预处理来提升应用系统的用户体验(效率), 因此数据仓库会存在大量冗余的数据; 如果不分层的话,如果源业务系统的业务规则发生变化将会影响整个数 据清洗过程,工作量巨大 通过数据分层管理可以简化数据清洗的过程,因为把原来一步的工作分 到了多个步骤去完成,相当于把一个复杂的工作拆成了多个简单的工作,把 一个大的黑盒变成了一个白盒,每一层的处理逻辑都相对简单和容易理解, 这样我们比较容易保证每一个步骤的正确性,当数据发生错误的时候,往往 我们只需要局部调整某个步骤即可。 数据仓库标准上可以分为四层:ODS(临时存储层)、PDW(数据仓库层)、MID