1. 首页
  2. 文档大全

《数据仓库》课程设计报告

上传者:秋迪 2022-06-29 11:11:56上传 DOCX文件 601.52KB
《数据仓库》课程设计报告_第1页 《数据仓库》课程设计报告_第2页 《数据仓库》课程设计报告_第3页

《《数据仓库》课程设计报告》由会员分享,可在线阅读,更多相关《《数据仓库》课程设计报告(8页珍藏版)》请在文档大全上搜索。

1、GDOU-B-11-112广 东 海 洋 大 学 学 生 实 验 报 告 书 ( 学 生 用 表 )实验名称 关于福布斯排行榜的数据挖掘课程名称 数据仓库设计与应用课程号学院(系)信息学院专业信息管理与信息系统班级信管 1124学生姓名一、实验目的学号实验地点科技楼关于福布斯排行榜的数据挖掘实验日期2015 年 11月 28 日(1) 了解数据挖掘中的聚类分析;(2) 充分了解 IBM SPSS Modeler 的数据挖掘能力;二、实验目标(1) 理解聚类分析的概念;(2) 对福布斯排行榜的数据(源数据来源:福布斯中文网,经过加工整理)进行聚类分析,掌握 SPSS 软件进行数据挖掘的常用步骤;

2、(3) 了解聚类分析中各个数据模型的内涵和意义。三、实验内容及结果1. 用自己的话概括 数据挖掘中的聚类分析 概念。答:聚类分析是将一组对象分成若干类,想同类中的对象具有相似性,不同类中的对象相异性较大。聚类与分类不同的是后者不依赖给定的标准给对象进行分类。2. 使用“福布斯排行榜”数据进行数据挖掘分析。根据 2010 年至 2015 年福布斯企业排行榜 50 强在Excel 表格中计算 5 年各自的平均销售额、平均利润、平均资产和平均市值,并在 IBM SPSS Modeler 中用“Excel”节点导入数据。图 1“2010-2015 总汇”节点预览图 2“多重散点图”编辑窗口在进行完 X

3、 轴及 Y 轴的设置后,运行得到如图 3 显示的多重散点图。这一结果反映了从2010 年到 2015 年能进入福布斯排行榜前列对其规模、盈利能力和在资本市场影响力的要求不断提高。图 32010-2015 年福布斯排行榜 50 强(平均)金额变化趋势此“Excel”节点的数据来自 2015 年福布斯排行榜 100 强,在图 4 编辑窗口中,选择过滤“排行”和“企业(名)”,以方便后面的聚类分析。图 4原始数据过滤在“Excel”节点之后建立“类型”节点,如图 5 所示,六个字段的角色均设置为“输入”, 其它参数为默认。图 5“类型”节点编辑窗口图 6“类型”节点预览建立“K-Means”节点。如


文档来源:https://www.renrendoc.com/paper/212651815.html

文档标签:

下载地址