请问数据标准化和统计学的关系
数据标准化是统计学中对数据进行分析前处理的一种方法,目的在于消除数据计量单位及变异程度。
例如:第1个变量的单位是kg,第2个变量的单位是cm,那么在计算绝对距离时将出现将两个事例中第1个变量观察值之差的绝对值(单位是kg)与第2个变量观察值之差的绝对值(单位是cm
)相加的情况。使用者会说5kg的差异怎么可以与3cm的差异相加?不同变量自身具有相差较大的变异时,会使在计算出的关系系数中,不同变量所占的比重大不相同。例如如果第1个变量(两水稻品种米粒中的脂肪含量)的数值在2%到4%之间,而第2个变量(两水稻品种的亩产量)的数值范围都在1000与5000之间。为了消除量纲影响和变量自身变异大小和数值大小的影响,故将数据标准化。
请问数据标准化和统计学的关系
数据标准化是统计学中对数据进行分析前处理的一种方法,目的在于消除数据计量单位及变异程度。
例如:第1个变量的单位是kg,第2个变量的单位是cm,那么在计算绝对距离时将出现将两个事例中第1个变量观察值之差的绝对值(单位是kg)与第2个变量观察值之差的绝对值(单位是cm )相加的情况。使用者会说5kg的差异怎么可以与3cm的差异相加?不同变量自身具有相差较大的变异时,会使在计算出的关系系数中,不同变量所占的比重大不相同。例如如果第1个变量(两水稻品种米粒中的脂肪含量)的数值在2%到4%之间,而第2个变量(两水稻品种的亩产量)的数值范围都在1000与5000之间。为了消除量纲影响和变量自身变异大小和数值大小的影响,故将数据标准化。
什么是数据标准 数据标准是什么
1、数据标准是进行数据标准化的主要依据,构建一套完整的数据标准体系是开展数据标准管理工作的良好基础,有利于打通数据底层的互通性,提升数据的可用性。本章从数据标准的概念入手,多角度探讨数据标准的内涵,构建数据标准分类体系,并阐述了数据标准作为数据资产管理核心要素的重要性。
2、“数据标准”并非是一个专有名词,而是一系列“规范性约束”的抽象。但是,数据标准的具体形态通常是一个或多个数据元的集合,即数据元是数据标准的基本单元。每一个数据元应由数据元中文名称、数据元英文名称、数据元标识符、说明、数据类型、取值、IMIX 域名七个属性组成,每一个数据元属性的描述包括该属性的注释以及相关标准规则。