Skip to content

“我们到底为什么要接受公理呢?既然人们一直都坚持什么都要数学证明,那我们怎么能不加证明地接受如“过不同的两点有且仅有一条直线”这样的公理呢?”

——《技术进化史》第3章

在讨论法国数学巨匠亨利·庞加莱给出上述问题的一个答案时,本书作者讲述了这样一个颇有趣味的故事:

一位探险家在一个与世隔绝的小岛上发现了会讲法语的居民群体,传说是在很久以前,一艘法国船只在小岛附近发生了海难,岛上的居民就是船上水手的后代。但奇怪的是,岛民说他们会捉空中飞的鱼来吃,这种鱼有两只翅膀、两个爪子和一个尖嘴,既会做窝也会唱歌。探险家试着解释:鱼生活在海里,有鳞有腮,不会发声,但是反而逗笑岛民。探险家终于明白:海难发生后,岛民所说的法语与大陆所说的法语都发生了演变,于是岛民所说的“鱼”其实是“鸟”。

现在问题来了,探险家是如何搞清楚岛民所说的“鱼”这个词的意思?大致有三种方法:

  • 第一种方法是,让岛民指给他看一只“鱼”,如果对方指的是一只鸟、一条蛇或一只蛙,他就可以明白这个词的意思。但是这种方法只适用于表示具体事物的词,而无法用于理解“团结”、“交换性”这种词的意思。

  • 第二种方法是,让岛民给出“鱼”这个词的定义,或者从岛民语言的词典中找出定义。但是这种方法也需要知道用以解释这个词的其他词语的意思,否则就要先查询用来解释的词语的含义。

  • 第三种方法是,问岛民一些关于“鱼”这个词的命题,看看他们认为哪些命题成立。

探险家采用了第三种方法,他发现岛民认为“鱼在天上飞”、“鱼有两种翅膀”等命题成立,就这样理解了“鱼”真正的意思。

“哲学家正是这样定义了“含义”一词的含义:一个词的含义就是与该词相关的所有真命题的集合。因此,我们无法孤立地定义某个词的含义,虽然词典让众人以为这是可能的。语言中所有的真命题同时定义了所有词的含义。命题“鸟在天上飞”成立这件事同时对“鸟”“天”和“飞”这三个词的定义有所贡献。更确切地说,定义了语言中词的含义的并不是所有真命题的集合,因为这个集合无穷大而且还很复杂。而确定什么命题成立的那些标准,才真正定义了词的含义。对于数学语言而言,这些标准就是公理和演绎规则。

这一思想就回答了为什么我们接受公理的问题:我们接受公理“过两点有且只有一条直线”,是因为这一公理本身就是“点”“直线”“过”这些词定义的一部分。

这个答案是由庞加莱提出的,比传统的答案更让人满意。只要我们搞清楚“点”“直线”“过”等词的含义,这一命题很显然就成立了。自庞加莱以后,我们就了解到,并不是因为我们知道了这些词的含义,这条公理就奇迹般地成了一个看似显然的命题,而是因为公理恰恰是这些词定义的一部分,我们才认为它成立。

这种对于定义的理解,解决了欧几里得《几何原本》中因定义“点”的概念而带来的一个古老问题。欧几里得对“点”的定义相当模糊:“点是没有部分的东西。”然后,他提出了各种公理并证明了各种定理,却从来没有用到过“点”的定义。那么这个定义到底是干什么用的呢?在庞加莱看来,这个定义根本没有用——“点”这一概念的真正定义并不在这句含义不明的话里,而在于几何的公理之中。”

——《技术进化史》第3章

统计学是研究如何通过数据处理来获取结论的学问——尽管目前看来这门学问还只是各种数据处理方法的汇总,但是不可否认,多数情况下,这些方法已经人类在是现实中能够做到的最好程度了。最近看过的书中,讲解概率、各类统计分布、实验设计等内容的不少,但是就调查问卷这一具体数据收集工具而论的不多,《漫画统计学之因子分析》刚好有所涉及,虽然内容很简单,甚至原则更简单:调查者想清楚需要通过问题获取什么信息,在此基础上站在问卷受访者的角度来设计问题即可。但是,我认为这些内容仍然值得一看。

调查问卷的最佳结构:

询问“现状”(是否接触过、是否拥有、什么时候买的、在哪里买的,等等)

——>

询问“意识”(满意或不满意之处、满意或不满意的理由、价值观,等等)

——>

询问“属性”(性别、年龄、婚姻状况、收入、最高学历、家庭结构,等等)

“在调查问卷中,首先要询问受访者的行为或经验这些“现状”层面的东西,接下来在询问感觉啦、想法啦这些“意识”层面的东西,最后再询问“属性”层面的东西。这样的结构才是最佳结果。”

——《漫画统计学之因子分析》第2章

至于为什么要如此设计,原书有简单的说明,我们只要站在回答者的立场上想一想,也很容易明白,例如:如果先问性别、年龄等“属性”,回答者就会想问什么要问我的隐私?同样,如果回答者都没有接触过这种产品(“现状”),如何知道是否满意(“意识”)呢?

调查问卷的设计问题:

1.问题的分类:

  • 单项选择题:几个问题的选项相同时,可以做成表格共享选项,从而节省纸张。

  • 多项选择题:避免让受访者必须浏览全部选项才能作答,从而增加负担。

  • 数量题(需要回答具体数值的问题):用方格将每一位数字分开,避免受访者书写错误。

  • 文字题(需要自由作答的问题)

2.应当避免的问题:

  • 避免对过于隐私的问题问得太具体。

  • 避免表达不明确的问题,而应当询问得具体些。例如:询问红茶的价格如何?而不是笼统的价格如何?

  • 避免同一个问题包含两层以上的意思。例如:询问服务生的态度如何?而不是服务生的制服和态度如何?

  • 需要仔细斟酌排序的问题。例如:让受访者按照喜好程度给红茶排序,需要考虑到两种红茶喜欢程度相同的情况。

  • 避免诱导回答的问题。

  • 避免等级程度太多的问题。

  • 评分的问题要避免给受访者造成困扰。例如:没有对分数间隔定义、没有对最高分最低分设定标准、没有配图说明等。

  • 征集自由回答的问题也需要避免让受访者不知如何作答,并且避免各种千奇百怪的答案给后期处理数据造成巨大的负担。

《数理统计学简史》相对于我的阅读目标而言,内容显得有点深,但是其中的一段话令人印象深刻:

一部数理统计学的历史,就是从纵横两个方向对算术平均不断深入的研究的历史,纵的方面指平均值本身。伯努利及其后众多的大数律、狄莫弗-拉普拉斯中心极限定理、高斯的正态误差理论,这些在很大程度上可视为对算术平均的研究成果,如今成了支撑数理统计学这座大厦的支柱……

除算术平均外,在统计方法中处于次一位重要地位的量是方差(标准差),但方差不具备平均值所有的独立品格,它在很大程度上是因平均值精度研究的需要而引进。

从横的方向来看,是指有许多统计方法,看似与算术平均很不同,但从某种意义上看,是算术平均思想的发展。其中最重要的一项就点到本章的主题——最小二乘法。”

——《数理统计学简史》第4章

在《统计学漫话》的第4章“平均值与比率的精度”中,当我看到作者为了讨论用样本平均值去估计总体平均值的精度问题时,而引入了方差,特别是在例题中将各种情况下的样本平均值一一罗列出来时,样本平均值的概念突然就不再是公式里那个死气沉沉的结果了,通过推论的方式,最终得出了样本平均值的方差与原总体方差关系的重要结论——这结论又是小岛宽之先生在《极简统计学》中推导许多结论的前提。

以前总不明白F分布到底是什么?《统计学漫话》的第9章“方差分析法”终于对这个问题进行了解释,而这种解释的基础是将方差分解为各种因子和随机误差的线性组合,不同于《漫画统计学之因子分析》这样直接引用结论的书,本书直接向读者展示了如何分解的操作过程,这体现在随后的“完全随机化设计”中:通过将数据分组求平均值、对所有数据求平均值,再做进一步推导的处理思想。

上述过程中,方差似乎与平均值无关,然而,《极简统计学》第二章附录中关于取平均值方法的讨论,可以让我们看到:方差其实也是一种平均值。并且与《数理统计学简史》作者认为方差重要性不如平均值的观点不同,《极简统计学》的作者在序章中就表明“本书最重视标准差”(标准差就是将方差开方所得)。尽管如此,作为读者,我却认为这几本书的互补性很好。

就这样,经过上述知识的熏陶,我发现,原本以为简单的平均值其实一点都不简单,甚至连这些平均值最基本的分类及其对应的用途,我都没有完全搞清楚。所以,《极简统计学》关于平均值的讨论仍然让我长了不少知识。

小时候一直认为平均值就是“两数相加的和除以二”——算术平均值,后来听说过几何平均值,但是因为实际中没有用过,逐渐将其定义也忘记了,再后来学概论统计知道了中位数、众数的概念——并且掌握了用途,如今,通过《极简统计学》才知道,平均数的大家庭里原来还有均方根、调和平均数。

下面以x和y分别表示两个数,

“这些平均值全都存在于x和y之间,实际上也就是选出某一个数的操作。根据平均的方法,选择的数值各不相同,但都是“选出x和y之间的某一个数”。至于哪个数更“适合代表x和y”,取决于“想通过全部数据知道什么”。即以用途来区别使用就可以了。

如果“想在合计的意义上保持其本质”应该使用算术平均数;如果是“对待成长率等情况,想在乘法的意义上保持其本质”则使用几何平均数;另外,对待“速度”应该使用调和平均数。

比如,思考一下两个考试分数——10分和90分的平均数。

算术平均数是(10+90)/2=50

几何平均数是(10×90)^(1/2)=30

均方根值是[(10^2+90^2)/2]^(1/2)=64.03

调和平均数是2/(1/10+1/90)=18

(每个都是在10和90之间的数)。

因此,如果这两个分数是你两次考试的结果,那么告诉父母的时候,说均方根值可以使他们看到更大的平均值。另外,当自己考了10分,朋友考了90分的时候,告诉父母调和平均数,就可以辩解说“自己的成绩10分虽然很差,但平均18分说明大家都很差”。”

——《极简统计学》第2章

以下对上述平均值的理解做个说明:

  • 调和平均数:2/(1/x+1/y),将x理解为去程的时速,y理解为返程的时速,调和平均数就是平均时速。单程按照1公里来算,去程花费的时间为1/x,返程花费的时间为1/y,往返2公里花费的时间就是1/x+1/y,所以平均时速就是2/(1/x+1/y)。

  • 均方根值:[(x^2+y^2)/2]^1/2,对比方差的公式即可发现,假设有两个数a1和a2,两者的算术平均值为b=(a1+a2)/2,如果令x=a1-b,y=a2-b,则原式正是将方差开方得到的标准差。

  • 几何平均数:(x×y)^1/2,例如:某企业的销售额某年增长了50%,次年减少了4%,即x=1.5,y=0.96,那么从这两年来看企业的增长率即为(1.5×0.96)^1/2=1.44^1/2=1.2,即20%。也就是与连续两年各增长20%的结果相同,即1.2×1.2=1.44,表示连续两年各增长20%,销售额达到最初的1.44倍,这与第一年增长50%,第二年减少4%的结果一致,因为1.5×0.96=1.44。事实上,根据复利的计算公式,我们可以看到,其实几何平均数算出来的正是按照复利计算的年增长率。

《一本书读懂财报》是一位投资人士推荐我阅读的,推荐理由是:“与XX那本相比,这本书写的更通透一些。”我读完之后,的确从字里行间感受到作者对财务报表,甚至金融理论的清晰理解——知识在这里基本是是连贯而非孤立的,故摘取其中部分观点以作记录。

一、什么是企业的营运能力?

“企业的投资回报决定于效益和效率两个方面,效益可以用净利润率和毛利率来表示,效率则可以通过总资产周转率表现……

……一般来说,用收入除以某项资产得到该资产的周转率。例如,用收入除以总资产,就得到了总资产周转率;用收入除以应收账款,就得到了应收账款的周转率;收入除以流动资产,就可以算出流动资产的周转率;收入除以固定资产,就得到了固定资产的周转率……

……虽然用收入除以存货的方法计算存货周转率并非不可行,但现实中存在着一种更为常见的方法——用成本除以存货。因为在被售出之后,存货就转化成了营业成本,所以人们更习惯用成本除以存货的方式计算存货周转率。

……

……流动资产的周转率其实是由各项流动资产周转率加权平均决定的,按它们在总资产中所占比重来加权。”(注:根据我的理解,此处应该是“按它们在流动资产中所占比重来加权”。)

——《一本书读懂财报》92页起

二、为什么流动比率等于2时,美国企业纷纷破产,而中国企业仍然生存?

流动比率是企业流动资产与流动负债的比率,反映企业短期偿债的能力。根据原书98页的图——美国健康企业与破产企业流动比率的对比,可以看到,美国企业的流动比率降低到2左右时,从相关性来看这样的企业就会破产,但是大多数中国企业的流动比率都在1到2之间,这些中国企业都活得好好的,原因何在?

“奥妙就在于短期借款。在中国,企业往往不用流动资产变现来偿还短期贷款,而是用新的借款来还,也就是借新债还旧债,借款本身实现了自我循环。在这一的模式之下,除非它所在的整个行业都完蛋,银行突然停止贷款,否则它还是能活得好好的。说穿了,短期借款其实变成了长期借款的一种替代方式,需要通过变现流动资产来偿还的负债其实不包括短期负债。

因此,虽然用所有流动资产除以所有流动负债得出的流动比率可能很低,但用流动资产除以扣除了短期借款的流动负债,得出的流动比率就没有那么低了。”

——《一本书读懂财报》98页

三、企业的长期偿债能力是什么?

我们用流动资产除以流动负债得到的流动比率可以用来衡量企业的短期偿债能力,但是却无法用长期资产除以长期负债来衡量企业的长期偿债能力,原因在于:

“当我们用流动资产除以流动负债的结果来衡量企业的短期偿债能力时,我们假设企业是用流动资产变现得到的现金去偿还流动债务的,这个假设也符合企业的实际情况。可如果用类似的方法衡量企业的长期偿债能力,言外之意就是假设企业用长期资产变现得到的现金偿还长期负债。什么是长期资产的变现?只能是把厂房、设备等都卖了。如果一家公司连自己的厂房、设备、办公室和品牌全都变卖了,那它一定不是想偿债,而是想关门。因此,别说是聪明的会计,就是世界上所有的会计都不会用这样的方式衡量企业的长期偿债能力。

那到底如何衡量长期负债的偿债能力呢?负债的偿还,包含本金和利息两个维度;偿债,也包含偿还本金和偿还利息两个维度。想要衡量企业的长期偿债能力,就要从这两个角度入手。”

——《一本书读懂财报》99页

沿着以上思路进一步分析,可以发现:

  • 利息收入倍数(也称利息保障倍数)可以用来衡量企业偿还利息的能力,它是指企业息税前利润与利息费用之比。其中,息税前利润是指扣除利息、所得税之前的利润,简称EBIT。

  • 资产负债率(也称财务杠杆)可以用来衡量企业偿还本金的能力,它是指企业负债总额占资产总额的百分比,反映了债权人向企业提供信贷资金的风险程度,也反映了企业举债经营的能力。

最后,利息收入倍数和资产负债率不止被用来衡量企业的长期偿债能力,也是企业整体偿债能力的衡量指标。

四、如何理解加权平均资本成本(WACC)?

《一本书读懂财报》134页起,加权平均资本成本(WACC)是指以企业获得的各种资本在企业全部资本中所占的比重为权数,对各种资金的资本成本加权平均计算出来的资本总成本。WACC可用来确定具有平均风险投资项目所要求的收益率,也是衡量一个公司是否赚钱的及格线。

例如:C公司40%的投资资本来自债权人,60%的投资资本来自股东,债权人的贷款利率为7%,而企业所处行业的平均盈利水平是12%,那么,不考虑税收的情况下,可以计算出这个企业的投资资本成本为40%×7%+60%×12%,这个结果就是“WACC”。

但是,现实中往往还要考虑税收的影响。假设A和B两家公司的EBIT为100元,且二者所得税税率均为25%。但是,A向银行借了钱,所以要向其支付20元利息,而B没有。这时,B的净利润为EBIT-T=100-25=75元,A的净利润为EBIT-I-T=100-20-(100-20)×25%=60元。

这里,A比B多付了20元利息,净利润却只比B少了15元,原因在于A少缴纳了5元所得税。因此,A虽然向银行付了20元利息,但实际承担的成本只有15元,其余5元的成本实际由政府税收承担。这是因为企业通常是在利息支付后才缴纳所得税,所以支付利息可以减少企业的税前利润,从而减少其所要缴纳的所得税,故而利息越高,所得税越少,这被称为“利息的税盾作用”。

如此一来,如果银行贷款的利率为7%,由企业承担的实际贷款利率绝达不到7%。因为企业要支付给银行的利息被分为以下两部分:和税率相等的部分由政府承担,即20元利息的25%,是为5元;而剩余的部分由企业承担,当为20元利息的75%,是为15元。因此事实上,由企业承担的利息成本应该是7%×(1-所得税税率),答案为5.25%。

因此,上例中C公司的投资资本成本,确切说就是WACC应当为:40%×7%×(1-所得税税率)+60%×12%。

五、为什么利润表通常比现金流量表更重要?

“企业每天都会有各种各样的现金支出,我们可以大致把这些现金支出分为两大类:一类是对未来有用的,比如说购置设备;一类是只和当下有关,投放广告就属于这种类型。无论这笔支出与什么有关,现金流量表都会体现出来,但它究竟会出现在利润表还是资产负债表上,就要看这个支出是和未来有关还是和现在有关。对未来有用的支出实际上是一个资产,通常会出现在资产负债表上;和现在有关的支出则是一个费用,会出现在利润表上。

我们曾经说过,三张报表分别构建了两个体系,一个体系由现金流量表构成,另一个体系由资产负债表和利润表共同构成,这两者都记录了企业所有现金的流入和流出。但在现金流量表上,我们不需要考虑这个支出跟未来有没有关系;而在资产负债表和利润表构成的体系当中,我们则以经济活动是否与未来有关为标准,将它们各自反映在两张报表上。实际上,两个体系描述了同样的经济活动,但它们各自描述经济活动的方式是不一样的。

因此,相比现金流量表所提供的体系,资产负债表和利润表构成的体系提供了一个额外信息,即每个经济活动是不是和未来相关。很显然,“跟未来有没有关系”这个信息对于企业做出决策很有帮助。

也就是说,从这个角度来说,利润是比现金流更重要的信息来源。”

——《一本书读懂财报》176页

六、什么情况下现金流量表比利润表重要?

“之前我们提到,利润表和资产负债表所共同构成的体系之所以优于现金流量表的体系,是因为它提供了一个额外信息,而这个信息关乎企业的未来。因此,说利润表比现金流量表更重要,这个信息就一定得是正确的。如果这个信息本身就是错的,那么整个资产负债表和利润表赖以生存的基础就不存在了,这个报表提供的信息也就失去它真正的意义。

我们知道,利润表和资产负债表包含了每笔支出是否对企业未来有用这样的信息;对未来有用的支出被记在资产负债表上,和未来无关的支出被记在利润表上。这个是否与未来相关的判断就决定了企业的资产有多少。因此说这个信息正确的意思其实就是说关于资产有多少信息是正确的。但在现实情况中,经常会有资产信息不准确的情况发生,比如应收账款收不回来、存货卖不掉、固定资产过时等,这些都会导致资产的减值,从而使资产信息不再准确。一旦这些减值的东西仍在报表里作为资产出现,它便将直接导致利润信息出错,这个时候的资产负债表和利润表就双双“阵亡”,紧接着,依据这个体系对企业的判断也会发生问题。在这种情况下,现金流量表所提供的信息无疑是非常重要的。

……

有人说,对于企业来说,追求利润最大化是最重要的目的,因为企业存在的目的就是赚钱,所以利润重要;但也有人说,现金为王,现金出问题,公司也就完了,所以现金流重要。

问题的本质是什么呢?当我们谈到利润最大化的时候,本质是在说企业追求收益的重要性;而我们说现金为王时,则是在说企业需要关注风险。

因此,当我们讨论利润和现金流哪个更重要时,我们其实讨论的是:对于一个企业来说,是追求收益重要,还是控制风险重要?

收益和风险永远是矛盾的,企业在追求更多收益的同时,必然承担了更大的风险。

……

说来说去,两个企业其实联合起来告诉了我们一个统一的结论:当一个企业遭遇巨大风险的时候,关注风险是第一位的,现金流对它来说更重要;当企业经营活动的风险在相对可控的范围内时,利润就显得更为重要。

利润和现金流那个更重要,首先和企业所处行业的风险特征有关;再者,同一个企业在不同时期,对利润和现金流的重视情况也会发生变化。经济形势不好的时候,很多企业会特别关注现金流;而经济形势好的时候,它们又会格外关注利润。这正好反映了以上道理。”

——《一本书读懂财报》177页起

可见,我们关注企业现金流的目的是为了排除/控制风险,在此基础上,才应该关注利润,否则,即使企业的利润再高,风险可能会让企业一夜破产,或者让企业所谓的利润化为泡影。而风险是时刻存在的,我们永远无法准确预测风险。

“假设你花100美元买了某一特定股票。不幸的是,你持有它的第1年它下降到了50美元,你持有的第2年它上升回到100美元,使得你回到了开始的地方(没有任何股利支付过)。

你从这项投资中得到的平均收益是多少?常识使得你认为平均收益必须刚好等于0,因为你一开始有100美元,结束的时候也是100美元。但是如果我们逐年计算收益,我们发现你在第1年损失50%(你损失了一半的钱)。第2年你赚了100%(你的钱翻倍了)。你在这两年的平均收益因此是(-50%+100%)/2=25%!

究竟哪个是正确的,0或25%?答案是两个都正确;它们回答了不同的问题。0被称作几何平均收益(geometric average return),25%是算术平均收益(arithmetic average return)。几何平均收益回答的问题是“你在一个特定期间的平均每年复合收益是多少”,算术平均收益回答的问题是“你在某一个特定期间的平均年份的收益是多少”。

……

一般来说,如果我们有T年的收益,这T年的几何平均收益用这个公式计算是:

几何平均收益=[(1+R1)×(1+R2)×…×(1+RT)]^(1/T)-1,

上式中,R为各年份的年收益率。

……

当我们观察历史收益的时候,几何平均收益和算术平均收益的差别并不难理解。换句话来说,几何平均告诉你,在按年进行复利的情况下你平均每年实际赚多少。算术平均告诉你,在一个有代表性的年份赚多少,并且这是分布平均值的无偏估计。几何平均对于描述实际的历史投资经验非常有用。算术平均在你未来进行估计的时候有用。”——《公司理财》第10章

假设检验中,对于“零假设”和“备择假设”的理解,一直是读来让人困扰的问题。在《漫画玩转统计学》这样的书中,作者不过是将其分为几类,读者只需要按照分类操作即可。但这始终无法解释:为什么零假设是这样?而备择假设是那样?两种假设能否互换?

《机会的数学》中,作者对此的解释是:“无罪推定”。假设要验证某种药物对疾病的治疗效果,也就是说这种药到底对于治疗有没有用,零假设一定认为是没有用,而备择假设则认为是有用,由此展开后续的检验。《统计学关我什么事》虽然主要是介绍贝叶斯统计方法,但是对于内曼-皮尔逊式假设检验也提出了一个更清晰的解释:“若假设A成立,再设定一个只有在小概率α的情况下能观察到的现象X。”再结合《爱上统计学》中有关显著性检验的解释。

于是,我们可以这样理解“假设检验”:寻找/构造一个统计量,使其能够在满足零假设的条件下,对应一种小概率的事件/现象,然后人为设定这个小概率事件的可接受的最小发生概率值——如果事件发生的概率比这个值还低,就认为这种事件/现象不可能发生,通常可接受的最小发生概率被设定为0.05或0.01(所谓的p值,愿意承受的风险水平,也就是显著性水平——低于这个值就不显著了)。结合概率密度的分布图(面积才是概率),如果实际计算出来的概率密度的值(例如:z值、t值、卡方值等)大于所设定概率对应的概率密度值,则事件/现象的发生概率比可接受的最小值还小,这被认为是不可能发生的“小概率事件”,所以零假设被拒绝,我们接受备择假设;如果实际计算出来的概率密度值小于所设定概率对应的概率密度值,则无法做出判断,这种情形下,零假设的解释只能被认为是目前最好的解释。

那么,我们能否将零假设与备择假设互换呢?依照上面的假设:如果我们能够寻找/构造一个统计量,使其在满足备择假设的条件下,对应一种小概率的事件/现象,那么我们也可以将两种假设互换。但是现实情况下,能够并不容易找到满足以上条件的统计量(将“没有影响”作为零假设时,样本多时可以使用正态分布、样本少时可以使用t分布,或者通过它们构造新的分布,往往可以得到需要的统计量,但是将“有影响”作为零假设时,则没有现成可用的统计量——没人以前研究过你这种特定情形的概率分布,以供你参考对比),所以通常不会将两种假设互换。

对于“区间估计”,结合《漫画玩转统计学》中的相关操作(《机会的数学》中置信区间的表达更加详细),考虑到标准正态分布(概率密度图)有这种特性:均值(数学期望)为零,并且均值两边对称,且在均值两侧一个、两个、三个标准差以内的概率(面积)分别约为68.27%、95.45%、99.73%。其中,95%的概率(即显著性水平为p=1-0.95=0.05)对应于1.96个标准差(z=1.96),这可以解释为:符合该概率分布的事件以95%的可能性落在(-1.96,1.96)内(均值为0),这就是置信区间。另一方面,任何正态分布都可以通过z变换为标准正态分布,于是,通过z变换的表达式即可解出在这种显著性水平下,该正态分布的置信区间。最后,大数定律和中心极限定律又保证了这种估计方法的应用范围较广。

那么,对于非标准正态分布——例如偏态分布而言呢?根据上面的理解思路,如果无法将偏态分布转换为某种标准形式,我们只能借助于微积分工具,针对特定的概率密度函数做“置信区间”的计算,而且需要借助于“偏度”、“峰度”的辅助描述。

“什么是测量?依据一定的规则给观察结果分配一定的数值……

测量的尺度或规则是测量观察结果的特定水平。每一个水平都有特定的属性特征集。测量尺度以四种形式(或类型)出现:定类、定序、定距和定比……

……

总之……

这些测量尺度或规则表示观察结果在特定水平被测量。而且,我们可以这样说:任何的测量结果都能够归属到四个测量尺度中的某一个。

  • 测量尺度有一定的层次,是从最不准确的定类尺度到最准确的定比尺度。

  • 测量尺度“越高”,收集的数据越准确,并且数据包含的细节和信息越多。例如,了解一些人富裕一些人贫困可能已经足够(这是定类或分类的区别),但是准确地知道每一个人收入的多少(定距或定比)会更好。一旦我们知道每一个人收入的所有信息,就很容易对其进行简单的“贫/富”划分。

  • 最后,比较高的测量尺度包含所有在其之下的测量尺度的特性,如定距尺度包含定类尺度和定序尺度的特性。例如,你知道熊的攻击平均值是350,你知道这比老虎(老虎的攻击平均值是250)好100,同样你也就知道熊比老虎好(但不知道好多少),而且熊与老虎之间存在不同(但是不知道到底怎样不同)。”——《爱上统计学》

定类测量水平:

  • 定类测量水平是以观察结果的属性特征定义,也就是观察结果只适合一个而且唯一的一个分类或层级。

  • 例如:性别、种族、政党背景都是定类变量。

  • 定类水平的变量是“名称”,而且是准确水平最低的测量。

  • 定类测量水平的各个类别相互排斥。例如:政治背景不能同时是民主党和共和党。

定序测量水平:

  • 定序测量水平的“序”表示次序,而且被测量的事物按照它们的属性特征排序。

  • 例如:一份工作的应征者的次序,我们只知道A比B靠前,但不知道靠前多少。

定距测量水平:

  • 定距测量水平是指检验或评估工具是基于某种连续统,这样我们就可以讨论一个较高的成绩比较低的成绩低多少。

  • 例如:A的词汇测试成绩是10个单词正确,B的词汇测试成绩是5个单词正确,所以A的正确数量是B的两倍。

  • 定距尺度的一个显著特征是尺度上的每个间距都相等。

定比测量水平:

  • 定比测量水平的评估工具的特征是测量尺度中有绝对零值。这意味着被测量的特质完全不存在。

  • 例如:在物理学和生物学中可以有不存在属性特征的情况,如绝对零值(没有分子运动)或零光程。在社会和行为科学中,这会使人迷惑,因为你的拼写成绩是0并不意味着你的拼写能力为零,答错了IQ测试的每个题目也不意味着你全无智力。

在终极的分析中,一切知识都是历史;

在抽象的意义下,一切科学都是数学;

在理性的基础上,所有的判断都是统计学。

……

不确定性知识+所含不确定性量度的知识=可用的知识

……

什么是创造性?创造性可以有不同的种类。最高水平的创造性是一种新思想和新理论的产生,这种新思想或新理论与任何已存在的结构有着本质的不同或是完全不一样,完全不能从已有的理论演绎而成,这种新思想或新理论可以比任何已知的理论解释更广范围的自然现象。另外一种不同水平的创造性是指在一个已存在法则范围内的新发现,但这种新发现在某个特殊的领域内具有巨大的意义。可以确认,这两种创造性均是新知识的源泉。然而两者之间存在微小的区别:第1种情形中,创造的是一种先验的思想,将由后来对事实的观察来加以验证;第2种创造性则是对现有知识在逻辑上的扩展。我们或许可以对第2种创造性的产生过程的背景做一些想象,而第1种创造性的产生却超越了我们的理解。拉曼纽扬和爱因斯坦是如何创造出他们所做的工作?尽管他们对创造性有一些神秘的解释,我们却永远不会了解他们工作的实际过程。然而我们可以用某些方法来描述创造性的特点。

非常重要的发现决不是由逻辑推断和强化观测基础来得到的。显而易见,创造性的一个必要条件是让思维不受已有知识或成形的规则所束缚,让其能自由地思考。或许产生新发现之前的思考仅仅是一个模糊的形式,是随机搜索相互作用的一次成功。这种随机搜索可以找出一些新的框架,与过去的经验和潜在的意识一致,从而缩小新发现可能产生的范围。克斯特勒(A.Koestler)在描述创造性的思维时说:

   在发现的最后的决定性阶段,思考的内容漂浮在梦里、幻想中,盘绕着整个思维,此时思潮随着自己抑扬的情绪无拘无束地活动,明显地处于一种没有任何约束的状态。

当一个发现最初被公布时,在其他人看来会没有任何意义,且看起来非常主观,实际上对爱因斯坦和拉曼纽扬的发现的反应就是如此。经过数年的实验和验证才认可了爱因斯坦的理论为一种新的规范,也许要经过半个世纪才能认识到拉曼纽扬那个看起来很离奇的公式具有深奥和意义非凡的理论基础。关于随机思维、随机性在创造性中的作用,霍夫施塔特(Hofstadter)作了如下评论:

   众所周知,随机性是创造性不可缺少的因素。……随机性是人类思维中内在的特征,不是通过赌博、衰减原子核、随机数表或其他你所知道的来人为培植的。如果认为随机性就是随心所欲的话,则是对人类创造性的侮辱。

或许,随机思考是创造性的重要成分。但是如果把它作为唯一的因素,则各种不重要的推断都会像蜘蛛网似的罩在前面,速度之快会使逻辑推导难于与其同步。所以我们要求其他的因素,如细致的心理准备,对重要的有显著意义的问题的判断能力,迅速领悟什么样的思想能够产生丰硕的结果。最重要的是要具有一定的信心去追逐研究困难的问题。最后一个方面是当今很多科学研究中所缺乏的,关于这一点,爱因斯坦曾强调:

   我丝毫不能容忍某些科学家,他们取一块木板在上面寻找最薄的部位,在那些容易打孔的地方钻开无数个孔。

我已经提到爱因斯坦和拉曼纽扬是我们这个时代两位具有创造性思维的伟大思想家或许了解一点儿有关他们创造性思维的过程是有趣的。有人问到爱因斯坦关于创造性思维的问题时,爱因斯坦这样回答:

   任何写出的、讲过的词汇或语言在我思考的结构中似乎不起任何作用,作为思维元素存在的物质实体似乎是某些符号,和一些或明或暗的想象,这些想象被‘随心所欲地’再生和组合。……这种组合性的思维活动似乎是创造性思维的基本特征——这种思维活动产生于存在一种能用文字或其他符号来与其他人交流的逻辑性结构之前。

爱因斯坦研究的是科学中的一个重要分支——物理学。一个科学理论只有当在现实世界中建立起它的实际应用时才是有价值的。但是这个科学理论在它产生的初期,是由强烈的信心而不是由演绎或归纳推导来支撑的。这个观点反映在爱因斯坦的关于神的旨意的格言中:

   神是狡猾的,但是不怀恶意。

拉曼纽扬是研究数学的,按著名数学家维纳(Wiener)的说法,在严格的意义下数学是一门精美的艺术。一个数学定理的有效性是就它严格的证明而言的。就像数学家要让人们相信的那样:与其说定理本身不如说它的证明是数学。对拉曼纽扬而言却只有定理或公式,这些定理或公式的有效性是基于它的直观或信念的。拉曼纽扬以极美的艺术品的形式记录下他的公式——他说这些公式是上帝在梦中赐给他的,一个方程除非可以用来表达上帝的一个旨意,否则对他来说就是无意义的。上帝、美和真理这三者被认为是等同的。如果拉曼纽扬不相信这一点,我们就不会有拉曼纽扬了。”

——C.R.劳《统计与真理:怎样运用偶然性》

理查德·A·布雷利等人的《公司金融》(前版又译作《公司财务原理》)彻底改变了我对各类教材普遍不好的阅读印象,特别是当我面对大量内容,感觉难以把握重点时,全书最后一章犹如点睛之笔,拨开了我对此书所论的最后一丝阴云——作者如读者所愿对全书做了总结,这其中,尤以“金融的七个最重要的思想”最为精华。当然,原书紧随其后的“我们不知道的:金融的10个未解决问题”也很棒——至少展现了作者严谨坦诚的治学态度。

一.净现值:

“你想知道二手车的价值时,你会看二手车市场中的价格。类似地,你想知道未来现金流的价值时,你看资本市场所报出的价格,未来现金流的索取权在资本市场中交易(记住,那些收入很高的投资银行家只是二手现金流的交易商)。如果你为股东买到的现金流比他们自己在资本市场上支付的价格便宜,你就增加了他们的投资的价值。

这就是净现值(NPV)背后的简单思想。我们计算投资项目的NPV,就是在问项目的价值是否超过成本。我们估计项目的价值,就是就是计算项目的现金流价值是多少,如果项目的现金流的索取权单独提供给投资者并在资本市场中交易的话。

这就是为什么我们计算NPV时,用资本机会成本来贴现未来的现金流,机会成本是与项目风险相同的证券所提供的预期收益率。在完善的资本市场中,所有风险相同的资产的定价都要提供相同的预期收益率。用资本机会成本来贴现,我们计算的是在项目的投资者所预期获得的收益率下的价格。

跟大多数好的思想一样,净现值法则是“显而易见”的。但要注意,这是个非常重要的思想。NPV法则使财富多寡不同、对风险的态度迥异的众多股东能够参与同一家公司,将公司的经营委托给职业经理人。他们给管理者一个简单的指令:“最大化净现值。””

——《公司金融》进阶篇第34章

二.资本资产定价模型:

“有人说现代金融学全部是资本资产定价模型。这是胡说八道。如果资本资产定价模型从来都没有被发明出来,我们对财务经理的建议基本上也是同样的。这个模型的魅力是它使我们用一种容易管理的方法来思考风险投资的要求收益率。

它也是一个有吸引力的简单思想。存在两种风险:能够分散掉的风险和不能够分散掉的风险。你可以度量投资的不可分散风险或市场风险,就是度量经济中所有资产的总价值的变化对投资的价值的影响程度。这称作投资的贝塔。人们只关心那些他们不能消除的风险——不可分散风险。这就是为什么资产的要求收益率与其贝塔成正比。

很多人担心资本资产定价模型背后一些相当强的假设,或者关心估计项目贝塔难度。他们担心这些事情是对的。在10年或20年的时间里,我们会有比现在更好的理论。但是,如果未来的理论没有坚持可分散风险和不可分散风险的重要区分,我们会及其惊讶,毕竟这是支撑资本资产定价模型的主要思想。”

——《公司金融》进阶篇第34章

三.有效资本市场:

“第三个基本思想是,证券价格精确反映可获得的信息,一旦新信息可获得,就迅速做出反应。这个有效市场理论有三种形式,分别对应“可获得的信息”的不同定义。弱有效(或随机漫步理论)认为价格反映所有过去价格的信息。半强有效认为价格反映所有可获得的公开信息,强有效认为价格反映所有可获得的信息。

不要误解有效市场的思想。它没有说不存在税或成本,它没有说不存在一些聪明人和一些愚蠢的人。它只是暗示,资本市场的竞争非常激烈,不存在造钱机器或套利机会,证券价格反映资产的真实基本价值。

对有效市场假说的大量实证检验大约从1970年开始。到2015年,经过40多年的工作,检验发现了很多统计上显著的异常现象。抱歉,这些公式没有换成很多容易的赚钱机会。超额收益也难以捉摸。例如,只有少数共同基金经理能够连续几年创造超额收益,并且金额也不大。统计学家能够打败市场,但实际投资者却困难得多。在这个基本问题上,现在形成了广泛共识。”

——《公司金融》进阶篇第34章

四.价值的可加性和价值守恒定律:

“价值的可加性原理是说整体的价值等于部分价值之和,有时也称为价值守恒定律(law of the conservation of value)。

我们评价产生连续现金流的项目的价值时,总是假设价值可以相加。也就是说,我们假设:

PV(项目)=PV(C1)+PV(C2)+…+PV(Ct)=C1/(1+r)+C2/(1+r)^2+…+Ct/(1+r)^t

类似地,我们假设项目A和B的现值的总和等于综合在一起的项目AB的现值。而价值的可加性也意味着,将两个公司合在一起不能增加价值,除非因此增加了总现金流。也就是说,只是为了多元化的并购没有好处。”

——《公司金融》进阶篇第34章

五.资本结构理论:

“如果现金流相加,价值守恒定律成立,那么现金流相减也成立。因此,只是将经营现金流分开的融资决策并不增加公司总价值。莫迪利亚尼和米勒著名的第一命题:在完美市场中,资本结构的变化不影响价值,背后的基本思想就是价值守恒定律。只要公司资产所产生的总现金流不因资本结构而变化,价值就与资本结构无关。馅饼的价值与如何分无关。

当然,MM命题不是标准答案,但却告诉我们如何寻找价值与资本结构有关的原因。税是一个可能性。负债为公司提供利息税盾,税盾可能足以补偿投资者为债务利息额外缴纳的个人所得税。另外,高负债率可能激励管理者更努力工作,提高管理效率。但是,负债的缺陷是可能导致高成本的财务困境。”

——《公司金融》进阶篇第34章

六.期权理论:

“在日常交流中,我们经常使用“选择权(option)”这个词来表达“选择”或“替代”,因此我们说某人有“很多选择”。在金融中,期权(option)特别指按照现在确定的条款在未来进行交易的机会。聪明的管理者知道,现在购买在未来购买或出售一项资产的期权经常是值得的。

期权很重要,财务经理要了解如何评估期权的价值。金融专家过去一直知道相关变量——期权的行权价格和行权日期、标的资产的风险和利率。而是布莱克和斯科尔斯最先说明了这些变量如何集中于一个可用的公式。

布莱克—斯科尔斯公司适用的是简单的认购期权,不能直接用于公司金融中经常遇到的更复杂期权。但是,布莱克和斯科尔斯的最基本的思想,例如他们的公式所隐含的风险中性估值方法,在公式不适用的地方是有用的。第22章讨论的实物期权估值需要额外的数据处理,而不需要新的概念。”

——《公司金融》进阶篇第34章

七.代理理论:

“现代公司是个团队合作,涉及很多参与者,如管理者、员工、股东和债权人。过去很长一段时间,经济学家常常毫无疑问地假设所有这些参与者都为共同利益行动,而在过去30年,他们对可能的利益冲突和公司如何克服这些冲突有了更多要说的。这些思想统称为代理理论(agency theory)。

例如,考虑股东和管理者的关系。股东(委托人)想要管理者(代理人)最大化公司价值。在美国,很多大公司的所有权是非常分散的,没有任何一位股东能够检查管理者或者谴责偷懒的管理者。因此,为了鼓励管理者努力做好份内的工作,公司将管理者的薪酬与他们增加的价值挂钩。对那些一直忽略股东利益的管理者,存在公司被接管、他们被赶走的威胁。

有些公司被少数股东所有,因此所有权和控制权距离不远。例如,家族、公司和银行是很多德国公司的控股股东,它们作为内部人检查高管的计划和决策。在大多数情况下,必要时它们有权力要求公司进行变革。而在德国,敌意并购很少见。”

——《公司金融》进阶篇第34章

“作为一位数学教育家,克莱因对数学史在数学教育中的作用寄语了极高的愿望。格丁根大学的传统使得他和柯朗都非常注重数学教育。在他们看来,通常数学教科书所介绍的是一些没有什么关系的数学片段,它们给出一个系统的逻辑叙述,使人们产生了这样的错觉,似乎数学家们几乎理所当然地从定理到定理,数学家们能克服任何困难。而且课本字斟句酌的叙述,不能反映数学家们艰难的探索过程,所有这些对于培养真正的富有创造力的数学家都是极其不利的。不仅如此,他还对世界范围内的数学教育深感担忧。柯朗在为克莱因的《西方文化中的数学》写的序言中指出:“科学家们与世隔绝的研究,教师们少得可怜的热情,还有大量枯燥乏味、商业气十足的教科书和无视智力训练的教学风气,已经在教育界掀起了一股反数学的浪潮。然而,我们深信,公众依然对数学有浓厚的兴趣。”为了扭转这种状况,克服数学教科书和数学教学中的诸多弊端,克莱因认为数学史能起到有效的作用。数学史可以提供整个课程的概况,使课程的内容互相联系,并且与数学思想的主干联系起来;数学史可以让学生们看到数学家们的真实创造历史——如何跌跤、如何在迷雾中摸索前进,从而鼓起研究的勇气;从历史的角度来讲解数学,是使人们理解数学内容和鉴赏数学魅力的最好的方法之一。他的这一良苦用心,今天已得到了越来越多的人士的认可。

正是从对数学历史的考察中与对数学教育特点的思考中,使克莱因认识到,学生学习数学的过程与数学发展的历程有一定的相似性,即遵从生物发生学的一个基本规律:个体的成长要经历种族成长的所有阶段,顺序相同,只是所经历的时间缩短。由此出发,他认为“新数学”过分强调逻辑数学,有悖上述规律,因此注定了要失败。他在《为什么约翰不会做加法:新数学的失败》中,就是通过历史考察对“新数学”运动提出了尖锐的批评:“由于新数学的主要革新是将演绎法用于一般的数学科目上,我们要确定的是在数学方法上,特别在能否增进学生对数学的理解上,究竟有什么优点?经多方面的考量,不能不说这一问题的答案是否定的。首先,让我们了解数学本身的发展及其发展历史上,是否提供任何有助于我们判断的证据。毕竟数学是由了解数学的人所创建,且看欧几里得、阿基米德、牛顿、欧拉以及高斯等大师是如何懂得数学的?”“直到19世纪后期,数学、代数、分析(微积分及其延展)的逻辑基础才开始建立,这一层至关重要。换句话说,多少世纪以来,数学的各主要分科的建立,几乎全未依赖逻辑发展。伟人的直觉显然比逻辑更有力量。”“从上述历史能推断出什么结论?最具有直觉意义的概念,像整数、分数及几何概念最先被接受与运用,似乎明白不过。较少直觉的概念,像无理数、负数、复数、用字母做一般系数以及微积分等概念的建立和被接受,则各需许多世纪。……直觉凭证诱导数学家加以接受,逻辑的到来通常迟于创建以后很久,并且很不容易。数学的历史虽未证明,但已提示我们逻辑方法远较困难。”近年来,数学教育中越来越重视数学史,实与柯朗、克莱因等人的呼吁有一定联系。

不考虑数学史的数学哲学是苍白无力的。在数学哲学家探讨数学的方法中,数学史提供了一种最实际、最有效的方法。克莱因准确地把握了这一点。”

——《西方文化中的数学》译者前言

本来只想摘录这段文字,但是每次读到这些内容时,不免心思潮动,想多写几句。历史本就是文化的一部分,不仅是数学,似乎每个学科的历史对于学习这门学科的学生而言,都有莫大的激励,历史激发学习知识的兴趣,诱发求知探索的热情。一门学科一旦被抹去历史,就好像有机体被剥夺了生命,立刻失去生气,变得死气沉沉,不再具有诱人好奇的气息。

无独有偶,近日读到一篇有关大学教育未必适合每个人的文章:大学的替代方案。也许,这可以让我们思考:教育的目的到底是什么?你可以说是传授知识,也可以说是培养人才……这些都没有错,只是不具可操作性。

我们试着这样思考:人类文明需要存在和进步,而这需要存储并创造新的知识。人类过去创造了大量的知识,并且现在仍然在创造更大量的知识,由于每个人的生命都是有限的,所以这些知识需要被新的人类继承下去,但是比继承更重要的是创造新知识的能力,否则,人类文明就不会继续进步。由此引出两个问题:

  • 储存已有的知识。

  • 创造新的知识。

对于第一个问题,自从文字和纸张出现以后,到现代信息技术的巨大进步,人类已经拥有强大的储存工具,借助于专业化分工以及成熟的教育体系,人类可以在需要的时候充分利用这些知识,从而维持文明的存在。然而,对于第二个问题,人类至今没有找到能够以确定的方向和速度,创造新知识的有效方法——很可能根本不存在这样的方法。

为了避免重新发明轮子这样尴尬的事情,人们通常会认为,创新的前提是继承,也就是说,新一代的研究者必须要全盘继承以往所有的研究成果,在此基础上再去创新。这方面,专业化分工,也就是将知识细分是个有效的方法,既然人类数量增长的约束小于寿命增长的约束,那么就可以将原有的知识分成很多门学科,由一部分人去继承并开拓每门学科,当然,这并不是没有问题,如果物理学天才爱因斯坦如果没有得到数学家的帮助,就不会完成广义相对论。这种将整体分割为部分所导致的损失,在现代文明中不知还潜在多少。

然而,现代文明的高速进步所创造的大量知识,即使对于一个学科的研究者而言,继承所有已有的知识也变得艰难。所以,人类便会寻求高效的继承方法,这些方法自然也包括:抹去知识探索过程中的曲折过程,以结果为导向,通过逻辑演绎的方式直接提取这些知识的核心骨干,从而实现快速继承大量知识的目的。

遗憾的是,这种继承方法丢弃了知识真实的创造过程,以及蕴含其中的知识创造方法。甚至,由于大量的知识需要被继承,演绎机械式的继承方法也抹杀了人性中天生具有的直觉、想象、创造性的思维。结果就是,被教育体制所培养,乃至折磨出来的学生,专业知识扎实,能够运用现有的知识解决现有的问题,但是,创造新知识的水平却没有提高。

所以,我们可以看到,对于新知识的创造,原有的知识继承固然重要,但更重要的是不要因此抹杀人性天生所具有的直觉、想象、创造性的思维,而且要借助于历史等学科文化,让学习者能够亲身接触知识真实的创造过程,认识知识的创造方法,让他们对知识保持好奇心,充满求知欲,让思想自由流淌,让想象随意连接和释放。

如此一来,教育的真正目的根本不是为了告诉学生尽可能多的正确答案,而是放大、影响、呵护学生的好奇心,让学生学会如何探索、并且乐于探索未知的知识。教育的时长也不在于三年五年、还是九年十年,在好奇心的驱使下,学生会终其一生探索未知。这样看来,老师教授的知识对错并不重要,学生会对错误产生质疑,并且迟早找寻到答案;老师教授的知识多少也不重要,知识有如茫茫大海,学生自会学海行舟;甚至,有没有老师教授也不重要,有心学习的人,万事万物都是老师,随时随地都可学习;学到的知识是对是错也不重要,当知识与现实矛盾时,学生自会纠正改进……讽刺的是,我在这里也在用演绎逻辑的方法分析这个问题——这意味着演绎逻辑方法本身并没有错,只是这会让人看不清知识创造本身的真面目。

也许有人会质疑:老师以演绎逻辑的方式教授知识,会提高学生的知识获取效率,避免学生自己走弯路浪费时间。对于老师所教授的知识,诚然如此。但是,老师又如何保证自己所教的知识都是绝对真理呢?而且这种效率也只是针对所教授的知识而言,让学生以牺牲好奇心、求知欲,独立获取知识的方法来换取这种效率其实是得不偿失的。就以走弯路而言,弯路走的多了,经验也多了,学习的路上迟早要独自前行,与其被人通过康庄大道带到乡间小路再撒手,不如自己在乡间小路土生土长。另一方面,对于学生而言,已有的知识继承比例达到多少最有利于新知识的创造,这同样是未知之数。所以,对于学习而言,最重要的不是学到了什么,而是“如何”以及“为何”学习?