高斯分布又叫正态分布,是一种连续性分布。前面讲的泊松分布和二次项分布都是离散型分布。两类函数有啥区别?连续性研究的概率是物质以什么状态存在。离散型分布研究的物质什么时候存在。用物体波粒二象性来解释的话,离散型研究的是能量态,也就是粒子态,研究粒子存在的概率。连续性分布研究的是信息态,信息即能量,持续存在的能量稳定性。
对于持续存在的物体,期望值从出现的概率p变成了实际的均值p.用标准差代替方差更适合表达。平均值和标准差分别决定高斯曲线的位置和形态。
作为信息态,我们就得考虑它的置信度了。我举个栗子!假如有两个班,一班数学平均分80分。二班平均分85分。你能说二班比一班成绩好吗?答案肯定不能。因为你只考虑了均值,而没有考虑标准差。置信度是两个班级分数信息稳定性条件。一班如果标准差是5分,一班的成绩有百分之68概率在75到85之间。百分之95概率在70到90之间。百分99.7概率在65到95之间。同理二班85的均值,百分之99.7的概率在70到100之间。这也是三西格玛原则。我们要充分考虑到随机波动的影响,要证明二班比一班好,只有降低标准差,让信息更准确,才能做比较。
要降低标准差。我们只有加大样本的采集量。没有被重复多次的经验,只能理解为个案。
高斯分布应用到现实中有一个前提条件。还拿成绩说事,个体考分相互独立,要出现一个学霸把试卷给其他人抄的话,那统计出来结果就数据不符合事情了。
网友评论