
《第10章数据仓库学习教案》由会员分享,可在线阅读,更多相关《第10章数据仓库学习教案(63页珍藏版)》请在文档大全上搜索。
1、会计学1第第10章数据仓库章数据仓库第一页,共63页。第1页/共62页第二页,共63页。第2页/共62页第三页,共63页。第3页/共62页第四页,共63页。第4页/共62页第五页,共63页。第5页/共62页第六页,共63页。第6页/共62页第七页,共63页。第7页/共62页第八页,共63页。第8页/共62页第九页,共63页。第9页/共62页第十页,共63页。第10页/共62页第十一页,共63页。第11页/共62页第十二页,共63页。OLTP系统系统(xtng)RDBMSSybaseVSAMSAP/ERP5-10 年年过去过去(guq)详细数据详细数据当前当前详细数据详细数据轻度轻度汇总数据汇总
2、数据高度高度汇总数据汇总数据数据集市数据集市分析型分析型CRM业务指标分析业务指标分析数据仓库数据仓库/决策分析系统决策分析系统EXCEL第12页/共62页第十三页,共63页。第13页/共62页第十四页,共63页。第14页/共62页第十五页,共63页。n在数据仓库的细节级上创建两种在数据仓库的细节级上创建两种粒度粒度n短期储存的低粒度(真实档案),短期储存的低粒度(真实档案),满足细节查询满足细节查询n具有综合的高粒度(轻度综合),具有综合的高粒度(轻度综合),做分析做分析第15页/共62页第十六页,共63页。第16页/共62页第十七页,共63页。第17页/共62页第十八页,共63页。n地理位
3、置地理位置n组织单位组织单位.第18页/共62页第十九页,共63页。第19页/共62页第二十页,共63页。第20页/共62页第二十一页,共63页。第21页/共62页第二十二页,共63页。第22页/共62页第二十三页,共63页。第23页/共62页第二十四页,共63页。第24页/共62页第二十五页,共63页。第25页/共62页第二十六页,共63页。进进第26页/共62页第二十七页,共63页。式的分析式的分析n数据数据(shj)集市(集市(Data Mart)n特定的、面向部门的小型数据特定的、面向部门的小型数据(shj)仓库仓库n是为满足用户特定需求而创建的是为满足用户特定需求而创建的数据数据(s
4、hj)仓库仓库n是数据是数据(shj)仓库的子集仓库的子集第27页/共62页第二十八页,共63页。第28页/共62页第二十九页,共63页。第29页/共62页第三十页,共63页。第30页/共62页第三十一页,共63页。第31页/共62页第三十二页,共63页。CustSalesLocationSalesProdSalesTimeSalesSalestime idproduct idlocation idcustomer idsales revenueunits soldProductproduct idmakemodelTimetime iddateyearquartermonthweekLoca
5、tionlocation idregiondistrictstoreCustomercustomer idcategorygroupSales factSales measuresTime dimensionAttributes of the time dimension第32页/共62页第三十三页,共63页。第33页/共62页第三十四页,共63页。第34页/共62页第三十五页,共63页。第35页/共62页第三十六页,共63页。n是整个系统发挥作用的关键是整个系统发挥作用的关键第36页/共62页第三十七页,共63页。第37页/共62页第三十八页,共63页。lDesignlWarehouse A
6、rchitectlManagelSybase ASIQlIntegratelInformatica lEnterprise ConnectlReplication ServerlVisualizelBriolCognoslAdministerlWarehouse Control Center第38页/共62页第三十九页,共63页。第39页/共62页第四十页,共63页。第40页/共62页第四十一页,共63页。第41页/共62页第四十二页,共63页。第42页/共62页第四十三页,共63页。第43页/共62页第四十四页,共63页。nn预测趋势和行为预测趋势和行为第44页/共62页第四十五页,共63页
7、。第45页/共62页第四十六页,共63页。(chngyun)是该数据项在该维中是该数据项在该维中位置的描述位置的描述n多维数组可以表示为(维多维数组可以表示为(维1,维维2,变量),如(地区变量),如(地区,时间时间,销销售渠道售渠道,销售额)销售额)n多维数组的取值称为数据单元(单多维数组的取值称为数据单元(单元格)元格)n可以理解为交叉表的数据格可以理解为交叉表的数据格第46页/共62页第四十七页,共63页。第47页/共62页第四十八页,共63页。第48页/共62页第四十九页,共63页。第49页/共62页第五十页,共63页。第50页/共62页第五十一页,共63页。桌面桌面(zhumin)级
8、工具级工具BrioQuery (ROLAP)Business Objects (ROLAP)Cognos Impromptu (ROLAP)Cognos PowerPlay (MOLAP)服务器级服务器级OLAPArbor Software Essbase (MOLAP)MicroStrategy DSS Agent (ROLAP )Oracles Express (hybrid MOLAP/ROLAP)第51页/共62页第五十二页,共63页。SQL3对聚集对聚集(jj)的扩展的扩展(在在Group By中扩展中扩展)SP(S#,P#,QTY)S#P#QTYS1P1300S1P2200S2P1
9、300S2P2400S3P2200S4P2200Selectsum(QTY) as TOTQTYFromSP;SelectS#,Sum(QTY) as TOTQTYFromSPGroup By S#;.第52页/共62页第五十三页,共63页。 SQL3对聚集对聚集(jj)的扩展的扩展(在在Group By中中扩展扩展) Grouping Sets:支持多个分组同时运算:支持多个分组同时运算 Select S#,P#,SUN(QTY) as TOTQTY From SP Group By Grouping Sets (S#) , (P#)S#P#TOTQTYS1Null500S2Null 700
10、S3Null 200S4Null 200NullP1600NullP21000第53页/共62页第五十四页,共63页。SQL3对聚集对聚集(jj)的扩展的扩展(在在Group By中扩展中扩展)Rollup:上卷:上卷Select S#,P#,SUN(QTY) as TOTQTYFrom SPGroup By Rollup (S# , P#)等同于等同于Group By Grouping Sets (S#, P#) , (S#),( )S#P#TOTQTYS1P1300S1P2200S2P1300S2P2400S3P2200S4P2200S1Null500S2Null 700S3Null 20
11、0S4Null 200NullNull1600第54页/共62页第五十五页,共63页。 SQL3对聚集对聚集(jj)的扩展的扩展(在在Group By中扩展中扩展) Cube:立方体(交叉表):立方体(交叉表) Select S#,P#,SUN(QTY) as TOTQTY From SP Group By Cube (S# , P#) 等同于等同于 Group By Grouping Sets (S#, P#) , (S#) , (P#) , ( )S#P#TOTQTYS1P1300S1P2200S2P1300S2P2400S3P2200S4P2200S1Null500S2Null 700S
12、3Null 200S4Null 200NullP1600NullP21000NullNull1600第55页/共62页第五十六页,共63页。 数据挖掘(数据挖掘(Data Mining) 探测型的数据分析探测型的数据分析 发现信息、发现知识发现信息、发现知识 基于人工智能基于人工智能(zh nn)、机器学习、统、机器学习、统计学计学 由计算机自动智能由计算机自动智能(zh nn)地分析数据地分析数据,获取信息,作出预测或帮助决策,获取信息,作出预测或帮助决策 需要算法的支持和机器的环境需要算法的支持和机器的环境第56页/共62页第五十七页,共63页。 数据挖掘的常用方法数据挖掘的常用方法 决策
13、树方法决策树方法 利用信息论中的互信息,寻找数据库中利用信息论中的互信息,寻找数据库中具有最大信息量的属性具有最大信息量的属性(shxng)字段,字段,建立决策树的节点,再根据该属性建立决策树的节点,再根据该属性(shxng)字段的不同取值建立树的分支字段的不同取值建立树的分支 在每个分支子集中重复建立下层节点和在每个分支子集中重复建立下层节点和分支分支第57页/共62页第五十八页,共63页。 数据挖掘分析方法数据挖掘分析方法 关联分析关联分析 为了挖掘出隐藏在数据间的相互关系为了挖掘出隐藏在数据间的相互关系 支持度支持度/置信度作为输入的条件,进行筛选、置信度作为输入的条件,进行筛选、分析分
14、析 序列模式分析序列模式分析 类似与关联分析类似与关联分析 着重于分析数据的前因后果着重于分析数据的前因后果 分类分析分类分析 对于不同分类的数据进行分析,找出他们的对于不同分类的数据进行分析,找出他们的规律、特征规律、特征 聚类分析聚类分析 是分类的逆过程是分类的逆过程(guchng) 根据数据特征,进行分类根据数据特征,进行分类第58页/共62页第五十九页,共63页。 数据挖掘的步骤数据挖掘的步骤 数据准备数据准备 数据集成数据集成(j chn) 数据选择和预分析数据选择和预分析 挖掘挖掘 利用前述的方法对数据进行分析利用前述的方法对数据进行分析 表述表述 利用可视化工具,将结果展现给分析
15、利用可视化工具,将结果展现给分析员员 评价评价 评估结果,递归上述过程评估结果,递归上述过程第59页/共62页第六十页,共63页。 数据挖掘与数据挖掘与OLAP 都属于分析型工具都属于分析型工具 DM是挖掘型工具是挖掘型工具 DM试图自动地发现隐藏在数据中的模试图自动地发现隐藏在数据中的模式式(msh)或规律或规律 OLAP是验证型工具是验证型工具 OLAP更多地依赖于用户的输入和假设更多地依赖于用户的输入和假设 两者相辅相成,互补两者相辅相成,互补 以以DM挖掘潜在的模式挖掘潜在的模式(msh)、预测未、预测未来趋势来趋势 以以OLAP来验证来验证DM的结果的结果第60页/共62页第六十一页,共63页。第61页/共62页第六十二页,共63页。感谢您的观看感谢您的观看(gunkn)!第62页/共62页第六十三页,共63页。
文档来源:https://www.renrendoc.com/paper/212448178.html
文档标签:10 数据仓库 学习 教案