现在的位置: 首页 > 思想碎片 > 正文
【思想碎片】对假设检验和区间估计的理解
2018年10月24日 思想碎片 ⁄ 共 1393字 【思想碎片】对假设检验和区间估计的理解已关闭评论 ⁄ 被围观 79 views+

假设检验中,对于“零假设”和“备择假设”的理解,一直是读来让人困扰的问题。在《漫画玩转统计学》这样的书中,作者不过是将其分为几类,读者只需要按照分类操作即可。但这始终无法解释:为什么零假设是这样?而备择假设是那样?两种假设能否互换?

《机会的数学》中,作者对此的解释是:“无罪推定”。假设要验证某种药物对疾病的治疗效果,也就是说这种药到底对于治疗有没有用,零假设一定认为是没有用,而备择假设则认为是有用,由此展开后续的检验。《统计学关我什么事》虽然主要是介绍贝叶斯统计方法,但是对于内曼-皮尔逊式假设检验也提出了一个更清晰的解释:“若假设A成立,再设定一个只有在小概率α的情况下能观察到的现象X。”再结合《爱上统计学》中有关显著性检验的解释。

于是,我们可以这样理解“假设检验”:寻找/构造一个统计量,使其能够在满足零假设的条件下,对应一种小概率的事件/现象,然后人为设定这个小概率事件的可接受的最小发生概率值——如果事件发生的概率比这个值还低,就认为这种事件/现象不可能发生,通常可接受的最小发生概率被设定为0.05或0.01(所谓的p值,愿意承受的风险水平,也就是显著性水平——低于这个值就不显著了)。结合概率密度的分布图(面积才是概率),如果实际计算出来的概率密度的值(例如:z值、t值、卡方值等)大于所设定概率对应的概率密度值,则事件/现象的发生概率比可接受的最小值还小,这被认为是不可能发生的“小概率事件”,所以零假设被拒绝,我们接受备择假设;如果实际计算出来的概率密度值小于所设定概率对应的概率密度值,则无法做出判断,这种情形下,零假设的解释只能被认为是目前最好的解释。

那么,我们能否将零假设与备择假设互换呢?依照上面的假设:如果我们能够寻找/构造一个统计量,使其在满足备择假设的条件下,对应一种小概率的事件/现象,那么我们也可以将两种假设互换。但是现实情况下,能够并不容易找到满足以上条件的统计量(将“没有影响”作为零假设时,样本多时可以使用正态分布、样本少时可以使用t分布,或者通过它们构造新的分布,往往可以得到需要的统计量,但是将“有影响”作为零假设时,则没有现成可用的统计量——没人以前研究过你这种特定情形的概率分布,以供你参考对比),所以通常不会将两种假设互换。

对于“区间估计”,结合《漫画玩转统计学》中的相关操作(《机会的数学》中置信区间的表达更加详细),考虑到标准正态分布(概率密度图)有这种特性:均值(数学期望)为零,并且均值两边对称,且在均值两侧一个、两个、三个标准差以内的概率(面积)分别约为68.27%、95.45%、99.73%。其中,95%的概率(即显著性水平为p=1-0.95=0.05)对应于1.96个标准差(z=1.96),这可以解释为:符合该概率分布的事件以95%的可能性落在(-1.96,1.96)内(均值为0),这就是置信区间。另一方面,任何正态分布都可以通过z变换为标准正态分布,于是,通过z变换的表达式即可解出在这种显著性水平下,该正态分布的置信区间。最后,大数定律和中心极限定律又保证了这种估计方法的应用范围较广。

那么,对于非标准正态分布——例如偏态分布而言呢?根据上面的理解思路,如果无法将偏态分布转换为某种标准形式,我们只能借助于微积分工具,针对特定的概率密度函数做“置信区间”的计算,而且需要借助于“偏度”、“峰度”的辅助描述。

抱歉!评论已关闭.

×