1、向量归一化法有两种形式,一种是把数变为(0,1)之间的小数,一种是把有量纲表达式变为无量纲表达式。
2、主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速,应该归到数字信号处理范畴之内。
3、归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量。
4、比如,复数阻抗可以归一化书写:Z=R + jωL=R(1 + jωL/R) ,复数部分变成了纯数量了,没有量纲。
如何进行特征向量的归一化1、定义数据的归一化处理,即将数据统一映射到[0,1]区间上。
2、方法1)最大最小标准化(Min-Max Normalization)本归一化方法又称为离差标准化,使结果值映射到[0 ,1]之间,转换函数如下:应用场景:在不涉及距离度量、协方差计算、数据不符合正太分布的时候,可以使用第一种方法或其他归一化方法(不包括Z-score方法)。
3、比如图像处理中,将RGB图像转换为灰度图像后将其值限定在[0,255]的范围。
4、2)Z-score标准化方法数据处理后符合标准正态分布,即均值为0,标准差为1,其转化函数为:其中μ为所有样本数据的均值,σ为所有样本数据的标准差。
5、应用场景:在分类、聚类算法中,需要使用距离来度量相似性的时候、或者使用PCA技术进行降维的时候,Z-score standardization表现更好。
6、3)非线性归一化本归一化方法经常用在数据分化比较大的场景,有些数值很大,有些很小。
7、通过一些数学函数,将原始值进行映射。
8、该方法包括 对数,正切等,需要根据数据分布的情况,决定非线性函数的曲线:log对数函数转换方法:y=log10(x),即以10为底的对数转换函数,对应的归一化方法为:x'=log10(x) /log10(max)其中max表示样本数据的最大值,并且所有样本数据均要大于等于1.atan反正切函数转换方法利用反正切函数可以实现数据的归一化,即x'=atan(x)*(2/pi)使用这个方法需要注意的是如果想映射的区间为[0,1],则数据都应该大于等于0,小于0的数据将被映射到[-1,0]区间上.L2范数归一化方法L2范数归一化就是特征向量中每个元素均除以向量的L2范数:
9、作用那么我们为什么要对数据进行归一化呢?举个例子:假定为预测房价的例子,自变量为面积,房间数两个,因变量为房价。
10、那么可以得到的公式为:y yy=θ1x1+θ2x2 θ_1x_1+θ_2x_2θ 我们给出两张图代表数据是否均一化的最优解寻解过程:未归一化:归一化之后:我们在寻找最优解的过程也就是在使得损失函数值最小的theta1,theta2。
11、上述两幅图代表的是损失函数的等高线。
n维向量的归一化处理1、n维向量 e={e1,e2,...,en}
2、其模为 |e|=√(e12+e22+...+en2)
3、那么其归一化向量为 e0=e/|e|=[1/√(e12+e22+...+en2)]*{e1,e2,...,en}
4、n维向量 e={e1,e2,...,en}
5、其模为 |e|=√(e12+e22+...+en2)
6、那么其归一化向量为 e0=e/|e|=[1/√(e12+e22+...+en2)]*{e1,e2,...,en}
7、n维向量 e={e1,e2,...,en}
8、其模为 |e|=√(e12+e22+...+en2)
9、那么其归一化向量为 e0=e/|e|=[1/√(e12+e22+...+en2)]*{e1,e2,...,en}