数据标准化方法.pdf
上传者:guoxiachuanyue003
2022-06-03 00:16:11上传
PDF文件
194 KB
数据标准化方法
问题 1:将一个人的体重和身高相加在一起有无什么意义?
答:量纲(就是单位)不同的量相加是没有意义的。不加处理就将两个不同量纲的量相加这
是数学建模的大忌!
问题 2:如何将一个人的体重 G 和身高 H 这两个指标综合为一个指标用以评价一个人身材?
答:通常考虑加法模型和乘法模型。乘法模型在这里不太适合,故考虑加法模型,一般采用
加权组合的方式,即 P w G w H ,这里 w w 1 ,但是这样就犯了一个严重的错误。
1 2 1 2
因此需要先对 G , H 进行预处理→无量纲化 ,也就是数据标准化方法。
数据标准化方法主要有以下三种:
(1)规范化方法
对序列 x , x ,..., x 进行变换:
1 2 n
x m in{ x }
i j
y 1 j n
i m ax{ x } m in{ x }
j j
1 j n 1 j n
则新序列 y , y ,..., y [0, 1] 且无量纲。一般的数据需要时都可以考虑先进行规范化处
1 2 n
理。
(2)正规化方法
对序列 x , x ,..., x 进行变换:
1 2 n
x x 1 n 1 n
y i ,这里 x x , s ( x x ) 2
i s n i n 1 i
i 1 i 1
则新序列 y , y ,..., y 的均值为 0,而方差为 1,且无量纲。
1 2 n
(3)归一化方法
对正项序列 x , x ,..., x 进行变换:
1 2 n
x
y i
i n
问题 1:将一个人的体重和身高相加在一起有无什么意义?
答:量纲(就是单位)不同的量相加是没有意义的。不加处理就将两个不同量纲的量相加这
是数学建模的大忌!
问题 2:如何将一个人的体重 G 和身高 H 这两个指标综合为一个指标用以评价一个人身材?
答:通常考虑加法模型和乘法模型。乘法模型在这里不太适合,故考虑加法模型,一般采用
加权组合的方式,即 P w G w H ,这里 w w 1 ,但是这样就犯了一个严重的错误。
1 2 1 2
因此需要先对 G , H 进行预处理→无量纲化 ,也就是数据标准化方法。
数据标准化方法主要有以下三种:
(1)规范化方法
对序列 x , x ,..., x 进行变换:
1 2 n
x m in{ x }
i j
y 1 j n
i m ax{ x } m in{ x }
j j
1 j n 1 j n
则新序列 y , y ,..., y [0, 1] 且无量纲。一般的数据需要时都可以考虑先进行规范化处
1 2 n
理。
(2)正规化方法
对序列 x , x ,..., x 进行变换:
1 2 n
x x 1 n 1 n
y i ,这里 x x , s ( x x ) 2
i s n i n 1 i
i 1 i 1
则新序列 y , y ,..., y 的均值为 0,而方差为 1,且无量纲。
1 2 n
(3)归一化方法
对正项序列 x , x ,..., x 进行变换:
1 2 n
x
y i
i n
数据标准化方法