高斯分布
其中参数: 被叫做均值, 被叫做方差,方差的平方根,由 给定,叫作标准差,方差的倒数 ,叫作精度。
根据上式,我们可以得到:
并且很容易证明高斯分布式高度归一化的,因此:
因此式(1.46)满足合理地概率密度函数的两个要求。
我们已经能够找到关于 的函数在高斯分布下的期望,特别地, 的平均值为:
的方差被定义为:
分布的最大值被叫做众数,对于高斯分布,众数与均值恰好相等。
对于 维向量 的高斯分布:
上式就是高斯分布的似然函数。
使用一个观测数据集来决定概率分布的参数的一个通用规则是寻找使似然函数取得最大值的参数值。简化后续数学分析和有助于数值计算,写作对数形式:
关于 ,最大化函数可以求得最大似然解:
这是样本均值,及观测到的{ }的均值。关于 最大化函数,我们求得方差的最大似然解:
这是关于样本均值 的样本方差,注意我们要同时关于 和 来最大化函数,但是在高斯分布的情况下, 的解和 无关,因此我们可以先对 求解,然后再对 求解。
下面的对于方差参数的估计是无偏的:
高斯分布和正态分布是什么?
高斯分布,也称正态分布,又称常态分布。对于随机变量X,其概率密度函数如图所示。称其分布为高斯分布或正态分布,记为N(μ,σ2),其中为分布的参数,分别为高斯分布的期望和方差。当有确定值时,p(x)也就确定了,特别当μ=0,σ2=1时,X的分布为标准正态分布。μ正态分布最早由棣莫佛于1730年在求二项分布的渐近公式时得到。后拉普拉斯于1812年研究极限定理时也被引入;高斯(Gauss)则于1809年在研究误差理论时也导出了它。高斯分布的函数图象是一条位于x轴上方呈钟形的曲线,称为高斯分布曲线,简称高斯曲线。高斯分布的特征: 变量的频数分布由μ、σ完全决定。 (1)μ是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以X=μ为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于μ。 (2)σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。
什么是高斯分布是不是正态分布两者有什么区别
高斯分布,也称正态分布,又称常态分布。 对于随机变量X,其概率密度函数如图所示。 称其分布为高斯分布或正态分布,记为N(μ,σ2),其中为分布的参数,分别为高斯分布的期望和方差。 当有确定值时,p(x)也就确定了,特别当μ=0,σ2=1时,X的分布为标准正态分布。 μ正态分布最早由棣莫佛于1730年在求二项分布的渐近公式时得到;后拉普拉斯于1812年研究极限定理时也被引入;高斯(Gauss)则于1809年在研究误差理论时也导出了它。 高斯分布的函数图象是一条位于x轴上方呈钟形的曲线,称为高斯分布曲线,简称高斯曲线。 1809年,高斯(Carl Friedrich Gauss,1777—1855)发表了其数学和天体力学的名著《绕日天体运动的理论》。 在此书末尾,他写了一节有关“数据结合”(data bination)的问题,实际涉及的就是这个误差分布的确定问题。 他的做法与拉普拉斯相同。 但在往下进行时,他提出了两个创新的想法。 一是他不采取贝叶斯式的推理方式,测量误差是由诸多因素形成,每种因素影响都不大。 按中心极限定理,其分布近似于正态分布是势所必然。 其实,早在1780年左右,拉普拉斯就推广了狄莫佛的结果,得到了中心极限定理的比较一般的形式。 可惜的是,他未能把这一成果用到确定误差分布的问题上来。 高斯的第二点创新的想法是:他把问题倒过来,先承认算术平均是应取的估计,然后去找误差密度函数条件下才能成立,这就是正态分布。 一种概率分布。 正态分布是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是遵从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2 )。 遵从正态分布的随机变量的概率规律为取μ邻近的值的概率大,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。 正态分布的密度函数的特点是:关于μ对称,在μ处达到最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点。 它的形状是中间高两边低,图像是一条位于x轴上方的钟形曲线。 当μ=0,σ2=1时,称为标准正态分布,记为N(0,1)。 μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。 多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。 正态分布最早由A.棣莫弗在求二项分布的渐近公式中得到。 C.F.高斯在研究测量误差时从另一个角度导出了它。 P.S.拉普拉斯和高斯研究了它的性质。 高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。 高斯是一个伟大的数学家,重要的贡献不胜枚举。 但现今德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。 这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。