现在的位置: 首页 > 读书笔记 > 正文
【读书笔记】全是平均值
2018年11月10日 读书笔记 ⁄ 共 2063字 【读书笔记】全是平均值已关闭评论 ⁄ 被围观 94 views+

《数理统计学简史》相对于我的阅读目标而言,内容显得有点深,但是其中的一段话令人印象深刻:

一部数理统计学的历史,就是从纵横两个方向对算术平均不断深入的研究的历史,纵的方面指平均值本身。伯努利及其后众多的大数律、狄莫弗-拉普拉斯中心极限定理、高斯的正态误差理论,这些在很大程度上可视为对算术平均的研究成果,如今成了支撑数理统计学这座大厦的支柱……

除算术平均外,在统计方法中处于次一位重要地位的量是方差(标准差),但方差不具备平均值所有的独立品格,它在很大程度上是因平均值精度研究的需要而引进。

从横的方向来看,是指有许多统计方法,看似与算术平均很不同,但从某种意义上看,是算术平均思想的发展。其中最重要的一项就点到本章的主题——最小二乘法。”

——《数理统计学简史》第4章

在《统计学漫话》的第4章“平均值与比率的精度”中,当我看到作者为了讨论用样本平均值去估计总体平均值的精度问题时,而引入了方差,特别是在例题中将各种情况下的样本平均值一一罗列出来时,样本平均值的概念突然就不再是公式里那个死气沉沉的结果了,通过推论的方式,最终得出了样本平均值的方差与原总体方差关系的重要结论——这结论又是小岛宽之先生在《极简统计学》中推导许多结论的前提。

以前总不明白F分布到底是什么?《统计学漫话》的第9章“方差分析法”终于对这个问题进行了解释,而这种解释的基础是将方差分解为各种因子和随机误差的线性组合,不同于《漫画统计学之因子分析》这样直接引用结论的书,本书直接向读者展示了如何分解的操作过程,这体现在随后的“完全随机化设计”中:通过将数据分组求平均值、对所有数据求平均值,再做进一步推导的处理思想。

上述过程中,方差似乎与平均值无关,然而,《极简统计学》第二章附录中关于取平均值方法的讨论,可以让我们看到:方差其实也是一种平均值。并且与《数理统计学简史》作者认为方差重要性不如平均值的观点不同,《极简统计学》的作者在序章中就表明“本书最重视标准差”(标准差就是将方差开方所得)。尽管如此,作为读者,我却认为这几本书的互补性很好。

就这样,经过上述知识的熏陶,我发现,原本以为简单的平均值其实一点都不简单,甚至连这些平均值最基本的分类及其对应的用途,我都没有完全搞清楚。所以,《极简统计学》关于平均值的讨论仍然让我长了不少知识。

小时候一直认为平均值就是“两数相加的和除以二”——算术平均值,后来听说过几何平均值,但是因为实际中没有用过,逐渐将其定义也忘记了,再后来学概论统计知道了中位数、众数的概念——并且掌握了用途,如今,通过《极简统计学》才知道,平均数的大家庭里原来还有均方根、调和平均数。

下面以x和y分别表示两个数,

“这些平均值全都存在于x和y之间,实际上也就是选出某一个数的操作。根据平均的方法,选择的数值各不相同,但都是“选出x和y之间的某一个数”。至于哪个数更“适合代表x和y”,取决于“想通过全部数据知道什么”。即以用途来区别使用就可以了。

如果“想在合计的意义上保持其本质”应该使用算术平均数;如果是“对待成长率等情况,想在乘法的意义上保持其本质”则使用几何平均数;另外,对待“速度”应该使用调和平均数。

比如,思考一下两个考试分数——10分和90分的平均数。

算术平均数是(10+90)/2=50

几何平均数是(10×90)^(1/2)=30

均方根值是[(10^2+90^2)/2]^(1/2)=64.03

调和平均数是2/(1/10+1/90)=18

(每个都是在10和90之间的数)。

因此,如果这两个分数是你两次考试的结果,那么告诉父母的时候,说均方根值可以使他们看到更大的平均值。另外,当自己考了10分,朋友考了90分的时候,告诉父母调和平均数,就可以辩解说“自己的成绩10分虽然很差,但平均18分说明大家都很差”。”

——《极简统计学》第2章

以下对上述平均值的理解做个说明:

  • 调和平均数:2/(1/x+1/y),将x理解为去程的时速,y理解为返程的时速,调和平均数就是平均时速。单程按照1公里来算,去程花费的时间为1/x,返程花费的时间为1/y,往返2公里花费的时间就是1/x+1/y,所以平均时速就是2/(1/x+1/y)。

  • 均方根值:[(x^2+y^2)/2]^1/2,对比方差的公式即可发现,假设有两个数a1和a2,两者的算术平均值为b=(a1+a2)/2,如果令x=a1-b,y=a2-b,则原式正是将方差开方得到的标准差。

  • 几何平均数:(x×y)^1/2,例如:某企业的销售额某年增长了50%,次年减少了4%,即x=1.5,y=0.96,那么从这两年来看企业的增长率即为(1.5×0.96)^1/2=1.44^1/2=1.2,即20%。也就是与连续两年各增长20%的结果相同,即1.2×1.2=1.44,表示连续两年各增长20%,销售额达到最初的1.44倍,这与第一年增长50%,第二年减少4%的结果一致,因为1.5×0.96=1.44。事实上,根据复利的计算公式,我们可以看到,其实几何平均数算出来的正是按照复利计算的年增长率。

抱歉!评论已关闭.

×