标准偏差是什么意思-标准偏差量化波动性
要是数据散开得了得,标准差就大;要是数据死死挤在平均值旁边,标准差就小。想象一下,一群人站成一排,要是都能站在你面前 2 米宽的范围里,那他们的凝聚力就强,标准差就小;要是散开成棒子,李大爷在 5 米外,老张在 3 米外,那这组数据的散度就大了,标准差自然就大。 大量人一听标准差就怕,总认定它意味着不稳定,要么数据乱七八糟。
实际上不然,标准差就是“稳定性”的另一种说法。它告诉你,这些数字能不能靠得住。做生意,你赚的钱标准差大,说明业绩忽高忽低,风险大;赚的钱标准差小,说明每天差不多,稳如老狗。在医疗上,病人的体重好不好,用标准差说事。医学生说,这个标准差小,说明每个人长个都挺像,手术风险低;标准差大,说明有人巨胖有人瘦,手术可能搞不那会儿。在金融里,股价波动大,标准差就大,意味着你随时可能爆仓;股价像没事人一样,标准差就小,你认定这票是稳当的,实际上它可能只是坑钱罢了。 那为啥要搞出个玩意儿叫标准差,非要扯个平方的啊?这得讲个笑话。你听我讲个故事,关于几个哥们儿约饭。你叫一声,哥们儿 A 在 2 米外,哥们儿 B 在 3 米外,哥们儿 C 在 1.5 米外。你问他们:你们离我的平均距离是几米?他们齐声说:“是 2 米。”对啊,没错,这就是平均值。
那好,目前把他们的坐标都加平方。A 是 4,B 是 9,C 是 2.25。加起来是 15.25。你再除以人数 3 人,拿到 5.08,这就是方差。好,能不能把方差开根号?对,就是 2.25 米。
这时候,你再想啊,5 米是平均距离,2.25 米是平均偏离距离。你要是说“平均偏离 2.25 米”,大家算出来都是 2.25 米,那肯定是对的。你用了数学公式,它逻辑自洽,不废话,不忽悠。 那要是不用这个公式呢?不用方差这个累活,直接说标准差。好,标准差就是把方差的平方根开出来。
这就好比有人问你:“你认定这路稳不稳?”你指着路边那堆散落的石子说:“我看这石子散得挺远,挺宽的。”没人信,你指着那堆石子按手算。你让他们把石子往一个点凑,要是凑得近,说明他们离中轴线近,标准差小,路稳;凑得远,说明他们离中轴线远,标准差大,路不稳。 那为啥标准差如此受欢迎?出于它是个“诚实”的鬼。它不给你承诺,它不给你漂亮数字,它只给你真的分布。当你告诉你一个平均值时,你保证的是平均水平;但你说出来标准差时,你保证的是这平均水平下,别人能站在你身边的可能性。
要是你的标准差是 0,那意味着啥?意味着所有人要么是平均值,要么就是平均值。
这就好比一锅炖菜,大家长得彻底一样,要么彻底一样都不中。而在实际世界里,没人长得彻底一样。 这就把标准差和方差搞混了。大量初学者天天纠结:方差大是不是不好?标准差大是不是不好?实际上不,看场景。
要是数据是个正态分布的尾巴,方差变大意味着数据往两边飘,可能有的数据特别远,有的特别近。
这时候标准差就代表着“离群点”的多少。
要是数据是极度两极分化的,比如 2000 年和 2020 年的营收,方差可能挺大,但标准差也可能挺大。
这时候你关心的不是方差,而是标准差。方差只关心中间那条腿有没有疼,标准差关心你有没有有人躺在外头喊救命。 再打个比方,你考了一场数学卷子,满分 100。
要是大家都拿 80 分,那均值是 80,方差可能是 1,标准差也是 1。
这时候你挺淡定,说明大家都靠谱。但要是有人拿了 40,有人拿了 100,大家平均分还是 70,方差突然变成了 20,标准差变成了 10。
这时候你再看看卷子,你会发现大头朝下了,小头朝上了。
这时候,标准差告诉你:原来大家离平均值有 10 分的差距。
要是标准差变小了,说明这卷子的题大家都做得挺顺,没出岔子。
要是标准差变大了,说明有人翻车,有人顺风顺水。
这时候,均值只是个虚数,标准差才是实锤。 并且,标准差的单位跟数据统一的单位直接挂钩。
要是说股价涨了 10 个点,标准差就是 10 个点,跟原值没啥关系。
要是说体重差 5 公斤,标准差就是 5 公斤。而方差呢?5 个 10 点方差是 50,5 个 10 公斤方差是 25000。
这就尴尬了,你如何比较?要是你拿 50 跟 25000 比,哪位大哪位是小?这就没法说了。
这时候得换单位,要么干脆别用方差,直接拿标准差比。
毕竟,直接用标准差讲话,大家心里都有数,不用换算单位。 最终说点实际的。在科研里,我们测了一百万个样本。我们算出平均身高是 175 cm,标准差是 10cm。
这时候,我们说这组数据挺稳定。
为啥?出于别人也差不多长得 165 到 185 之间,离中轴线都不远。
要是标准差大了 20cm,那咱们就得说,这组数据忒散了,有的可能 160,有的可能 190,咱没法说这身高普遍性。在质量管住上,要是零件尺寸标准差大了,说明质量把控不住,废品率可能高。
要是标准差小了,说明每批出来都是合格的,差不多。 故此,当你下次在报告里提到标准差,别把它当成一个冷冰冰的数学符号。把它当成一个哥们儿,一个比哪位更靠谱、哪位更稳、哪位更散损的哥们儿。
要是没有标准差,均值就是个没头苍蝇,只能到处撞。有了标准差,均值才像个靠谱的向导,告诉你“大约行”,带你看看背后那波乱的神秘局势。标准差不是要替代均值,它是给均值披上一层血肉,告诉你这玩意儿底下有多少个坑,还有多少个人站着不稳。
声明:演示网站所有内容,若无特殊说明或标注,均来源于网络转载,仅供学习交流使用,禁止商用。若本站侵犯了你的权益,可联系本站删除。
