数据仓库3-数据仓库中的数据及组织

《数据仓库3-数据仓库中的数据及组织》由会员分享,可在线阅读,更多相关《数据仓库3-数据仓库中的数据及组织(44页珍藏版)》请在文档大全上搜索。
1、1第第3 3讲讲 数据仓库中的数据及组织数据仓库中的数据及组织2数据数据仓库产生的原因仓库产生的原因数据处理的类型 操作型处理(OLTP):数据的收集、整理、存储、查询和增、删、改操作。 分析型处理(OLAP):数据的再加工,往往要访问大量的历史数据,进行复杂的统计分析。3数据仓库的四个基本特征:u数据仓库的数据是面向主题的(Subject Oriented);u数据仓库的数据时集成的(Integrate);u数据仓库的数据不可更新(Non-Volatile);u数据仓库的数据时随时间不断变化(Time Variant)的。 数据仓库的基本概念4数据仓库的体系结构5v 数据库和数据仓库两层体系
2、结构(DB-DW)并不能涵盖企业所有的数据处理要求。v 某些应用既不是纯粹的联机事务处理,又不是高层决策分析。什么是什么是ODSODS6ODSODS的定义及特点的定义及特点v 定义:是用于支持企业日常的全局应用的数据集合。v ODS中的数据具有4各基本特征:面向主题的、集成的、可更新的、数据是当前或接近当前的。v ODS中只存放当前或接近当前的数据,并且可以进行联机修改,包括增、删、改等操作。7vDWDW与与ODSODS面向不同的用户、不同的需求面向不同的用户、不同的需求,都有,都有其其不可替代的作用不可替代的作用,彼此间不是相互包含的,彼此间不是相互包含的,同时两者又可以相互结合、相互补充。
3、同时两者又可以相互结合、相互补充。DBDBDBDBDBDBODSODSDWDW应用应用操作型环境操作型环境分析型环境分析型环境三层体系结构三层体系结构83.1 3.1 数据仓库中的数据组织数据仓库中的数据组织3.2 3.2 数据仓库中数据的追加数据仓库中数据的追加3.3 3.3 数据仓库中的元数据数据仓库中的元数据9v 数据仓库中存储两类数据: 业务数据和元数据3.13.1数据仓库中的数据组织数据仓库中的数据组织10数据仓库的体系结构11v 数据仓库中存储的数据 3.13.1数据仓库中的数据组织数据仓库中的数据组织后备数据后备数据后备数据高度综合级轻度综合级当前细节级早期细节级元元数数据据12
4、v 源数据经过抽取、转换后,首先进入当前细节级,再根据具体需要进行进一步的综合,从而进入轻度综合级乃至高度综合级。v 老化的数据进入早期细节级。 3.13.1数据仓库中的数据组织数据仓库中的数据组织13v 数据组织的实例 3.13.1数据仓库中的数据组织数据仓库中的数据组织数数据据仓仓库库层层后备数据后备数据后备数据高度综合级高度综合级轻度综合级轻度综合级当前细节级当前细节级早期细节级早期细节级2015每“月”电话呼叫情况信息2015每“天”电话呼叫情况信息2015每个电话呼叫情况信息20102014电话呼叫明细情况信息141 1)数据粒度)数据粒度v 数据粒度是数据仓库的重要概念。存在两种形
5、式,形式一: 粒度是对数据仓库中数据的综合程度高低的一个度量。 粒度越小,细节程度越高,综合程度越低。15v 不同的情况组织数据的粒度会不同。如:v 电信通话 细节数据:记录每一次通话情况。 轻度综合数据:记录顾客每天的通话情况。 高度综合数据:记录顾客每月的通话情况。 1 1)数据粒度)数据粒度16v 超市购物 细节数据:记录顾客每一次购物细节。 轻度综合数据:记录每个顾客每次的购物金额,或每种商品每一天的销售数据。 高度综合数据:记录每个顾客每月或每年的购物金额,或每种商品每月或每年的销售数据。 1 1)数据粒度)数据粒度171 1)数据粒度)数据粒度 数据粒度的确定是业务分析、硬件、软件
6、的一个折中。 在数据仓库中多重粒度是必不可少的181 1)数据粒度)数据粒度v 数据粒度是数据仓库的重要概念。存在两种形式,形式二: 样本数据库,其粒度是根据采样率的高低来划分的。 盖洛普民意测验是一种观点的民意测验,其特点是用简单的随机取样法并且试图把偏差度保持在最低。192)2)数据分割数据分割v 数据分割是数据仓库中的另一个重要概念。v 它是指将数据分布到各自的物理单元中,以便能分别独立处理,提高数据分析效率。v 数据分割后的数据单元称为分片。20MySQLMySQLMySQLMySQLMySQLMySQLMySQLMySQLMySQLMySQLMySQLMySQLMySQL212)2)
7、数据分割数据分割v 数据分割的标准可以根据实际情况来确定,通常选择:按日期、地域、业务领域等来进行。222)2)数据分割数据分割v 数据分割的方法 垂直分割:垂直分割就是把一个表垂直分成两部分。 水平分割:水平分割就是把表按行分成两部分。23AppIDIDMEMBE_IDMEMBE_IDINFOINFO1pavarotti1711pavarotti17MySQLIDIDMEMBE_IDMEMBE_IDINFOINFO4test12345test1234IDIDMEMBE_IDMEMBE_IDINFOINFO3abcd9abcd20abcdMySQLMySQLCobarProxyAppAppAp