Skip to content

某天刷微信朋友圈时看到一篇关于“无效社交”的文章,我没有点击,只是按照对标题的直观理解回复道:“社交也要有冗余才好”。按照我对“无效社交”的理解:无法为你带来利益的社交关系,就属于无效社交——功利性如此露骨的社交行为难免让人反感。相对而言,我所谓的“社交冗余”则是从人性好恶的角度而言。当我今天再看这篇文章时,发现作者所谓的“无效社交”应该是指:与自己的能力和价值不匹配的社交关系。于是,我草率的本性就这样再次暴露无遗。

一地鸡毛之后,我盯着“社交冗余”四个字——这个词到底是怎么出现的?显然,这是我的神经系统将“社交”和“冗余”联系在一起的结果,顺着“冗余”的轨迹,我想到了DNA序列的编码冗余,然后是通信系统的冗余……我翻找书架,找出了那本《信息简史》,这本书有两个令人印象深刻的“冗余”实例。

  • 早期破译DNA的编码时,科学家们认为每三个核苷酸对应一个氨基酸,这种对应关系是井井有条的,然而,“到了20世纪60年代初,遗传编码最终被破解时,人们才发现这种编码充满了冗余。核苷酸三联体与氨基酸之间的映射关系大多不是一一对应,不像伽莫夫先前所设想的那般井井有条。有些氨基酸只对应于一个密码子,而有些对应着两个、四个甚至六个密码子……有些密码子是冗余的,有些则用作起始或终止信号。正如信息理论家所预想的,冗余提供了容错能力。生物学中的讯息同样会受到噪声影响,DNA中的错误(误植)就是所谓的突变。”

  • 非洲的部落使用鼓语进行沟通,“鼓语中有许多定型的长尾巴,它们引入的冗余克服了歧义。、……引入冗余,不言而喻,效率肯定会打折扣,但它是避免混淆的一剂良药,它提供了第二次机会。事实上,每一种自然语言都内在地包含冗余,这也是为什么人们可以读懂错别字连篇的文章,可以在嘈杂的房间里听懂交谈内容的原因……大多数时候,语言中的冗余是为了提供背景信息。”工程师哈特利用数学公式量化了一种简单现象:“可用的符号越少,为表示出给定信息量所需的符号数就得越多。对于非洲的鼓手来说,需要传递的符号数是对应口语的八倍之多。”

可见,在信息技术领域,冗余虽然降低了通信的效率,却提高了容错的能力。如果将其与“社交”联系起来,则会在降低社交效率的同时,提高社交容错能力(形成更加稳固可靠的社交关系)。同样,自然系统中的“冗余”也会有相似的作用,例如:部分受损的动植物都有一定的恢复能力,这也正是表现为对自然环境的适应能力。甚至,如果我们能将每种系统的冗余度(多余的成分占总成分的比例)计算出来,会不会发现某些共同的规律?

再进一步,社会变得怎么了?我们也可以从“冗余”的角度解释。如果我们将休息的过程看作生命系统持续运转的“冗余”,在现代社会快节奏的生活背景下,勤劳的人们变得更加勤劳,休息时间被各种工作和学习项目所挤占,“冗余”被剔除的同时,生活系统也会变得脆弱,轻微的变化就会引起人们生活和情绪的巨大波动,如果我们能够计算出人类从事某项活动的最佳“冗余度”,活动效率和生命系统就可以得到符合客观规律的最佳平衡。

最后,“冗余”到底是什么?百度百科中认为是“成分多余”,维基百科中则没有涉及。我起初认为是:“任何状态无法持续”,现在看来并不恰当。如果结合信息技术领域中通信效率与容错能力的特征,我觉得可以是:“一种或多种能够降低系统效率,同时提升系统可靠性的成分。”从这一点上讲,系统效率和系统可靠性必然是相互矛盾的,任何现实系统都无法达到理想化的最高效率,同样,最高可靠性的系统也是完全没有效率的,现实中也无法存在。

一部耗时七年,涉及数学、物理学、逻辑学、文字科学、机械工程科学、生命科学、信息科学等多学科的知识,各章节大量的援引文字效仿科学论文标明出处……我很荣幸在2014年的春节阅读这样一部著作——《信息简史》。如同书名所示:全书以科技发展史为背景,围绕人类对“信息”的认知和利用历程,从非洲会说话的鼓到文字、字典,再到巴贝奇的机械“分析机”、远距离传讯系统、电报、电话,最终,20世纪杰出的科学家克劳德·香农提出的“信息论”彻底明确了“信息”的本质——“信息是熵”(第7章:“信息论”,215页),并由此带来了对物理学、生命科学等领域一系列的变革。

有关“熵”的概念,我首先想到的不是物理学课本,而是凯文·凯利的那本《科技想要什么》,在第四章:“外熵的扩展”中(68页),凯利给出了这样一幅图:横轴是自宇宙大爆炸以来到如今的时间轴,纵轴是处于宇宙主导地位的量,从图中可以看出,从古到今,电磁辐射(能量)、物质(质量)、信息分别随着时间的推移走向主导地位。由此可以预见,信息的主导地位会越来越明显(也许有朝一日,“信息”终会取代如今“物质”所处的主导地位)。联想到香农“信息论”对物理学、生物学等领域的巨大推动作用,我似乎看到了某种必然性。

一.对于“熵”的理解:

到底什么是“熵”?借用热力学领域的描述:“它被用来度量系统的无序程度”(第7章:“信息论”,215页)。我想不起当年学习热力学时的情形,只是觉得书中第9章:“熵及其妖”中的这几段话有利于对“熵”的理解:

“热力学的先驱们考虑了一种理想情况,即一个密闭容器中的气体。气体由原子构成,它并不像看上去那样简单或平静,而是包含了大量不断扰动的微粒的系统。原子看不见摸不着,在当时还是一种理论假象物。但如克劳修斯、开尔文、麦克斯韦、路德维希·波尔兹曼和威拉德·吉布斯等理论家都接受流体由原子构成的观点,并据此推导出了结论:微粒的运动杂乱无章、膨胀频繁且持续不断。他们意识到,正式微粒的这种运动构成了热。热不是物质,而是流体,也不是燃素,而只是分子的运动。

每一个分子个体都必定遵守牛顿运动定律,因而在理论上,每个动作、每次碰撞都是可度量、可计算的。可是分子的数量实在太多了,无法一一加以度量和计算。但借助概率、新出现的统计力学在微观细节与宏观行为之间架起了桥梁。假设这个密闭容器被一块隔板隔成两半,A和B,并且A的气体比B的热,也就是说,A的分子运动得较快,能量较高。但只要一去掉隔板,分子就开始混合。较快的分子碰撞较慢的分子,同时进行能量交换。最终一段时间后,气体的温度会变得均匀一致。但令人费解的是,为什么这个过程不可逆呢?在牛顿运动方程中,时间可以取正值,也可以取负值。从数学上说,两个方向都能成立,但在现实中,过去和未来可不会这么轻易就对调。

……

而密闭容器内的气体从混合变得区分开来,这在物理定律上并非不可能,只是概率及其小罢了。因此,热力学第二定律只是在概率意义上成立:在统计上,万事万物都将趋于熵的最大化。

……

最终物理学家开始用微观状态和宏观状态来讨论熵。一个宏观状态可以是,所有气体集中在密闭容器的上半部,而与之对应的微观状态则是全部粒子的位置和速度的所有可能组合。这样一来,熵就成了概率在物理学上的等价物:某一给定宏观状态的熵,就是它所对应的微观状态数目的对数。因此,热力学第二定律揭示的是,宇宙从可能性较小的(有序的)宏观状态演化为可能性较大的(无序的)宏观状态的趋势。

不过,将如此重要的物理现象归结为仅仅是由于概率,这不免让人困惑。说物理学完全允许混合气体自发地分成冷热两边,而这之所以不会出现只是由于几率和统计学,这种说法真的正确吗?对于这个难题,麦克斯韦提出了一个思想实验加以说明。设想“一个有限的存在物”,它控制着分隔密闭容器的隔板上的一个微孔。它能够看清飞来的分子,能够判断它们运动的快慢,并能够选择是否让它们通过。这么一来,它改变了原来的几率。通过筛选较快的分子和较慢的分子,它可以使得A更热而B更冷……这个存在物不遵从普通概率。通常的情况是,不同事物会彼此混合。但要将它们筛选出来,就需要信息。

汤姆森很喜欢这个设想,并把这个想像出来的存在物称为妖(demon):“麦克斯韦的智能妖、“麦克斯韦的筛选妖”、以及随后简单的,“麦克斯韦妖”。”——(第9章:熵及其妖,268页,269页,270页)

先说热力学第二定律:宇宙的熵恒增(第9章:熵及其妖,267页)。借助密闭容器被分为A和B的假设实验,宇宙偏向于变得无序,假设可以将宇宙分为很多和不同温度的密闭容器,然后抽掉它们的隔板,足够长的时间后,这些容器的温度都变得一致,也就变成了威廉·汤姆森(开尔文男爵)所描述的“这种最终整个宇宙会归于一个静止和死寂的状态。”(第9章:熵及其妖,267页)

由于“信息是熵”,当宇宙达到“一个静止和死寂的状态”时,熵最大,信息也最大,回到本文开头——凯利的那幅随时间变化的宇宙主导图,我们可以推断:当“信息”主导的端倪崭露头脚时,宇宙离变成“一个静止和死寂的状态”也就更近了。

有意思的是,假想的“麦克斯韦妖”可以阻止“熵恒增”这种令人绝望的状态,而且正是借助于信息(熵)。进一步,在研究“麦克斯韦妖”所产生的悖论时,卡尔埃卡特总结道:“思考产生熵”(第9章:熵及其妖,267页)。更令人惊讶的是:“我们繁衍生息,我们扰乱了趋向热平衡的趋势——这里的我们不仅仅是人类,也包括所有生物在内……有时看来,我们存在于这个宇宙似乎就是为了一个知其不可而为之的目的——控制熵。”埃尔温·薛定谔指出,“生物体以负熵为食……新陈代谢的本质是,生物体成功地使自己摆脱在其存活期内所必然产生的所有熵。”(第9章:熵及其妖,267页)。

二.为什么“信息是熵”?

那么,为什么“信息是熵”——为什么对信息的量度就是对不确定性的量度?我在原书浩瀚的文字中找到这样几段:

““信息与不确定性密切相关”。反过来,不确定性可以通过统计可能讯息的数量加以度量。如果仅有一条可能讯息,那么这其中就不存在不确定性,因而也就不包含信息了。

有一些讯息出现的可能性比其他讯息要大,而信息意味着出人意料。出人意料其实讲的是概率。比如在英语中,如果紧跟在字母t之后的是字母h,那么这其中的信息量就不大,因为字母h在此出现的概率相对较高。

……

如果一个字母能根据先前的内容猜出来,那么它就是冗余的;既然它是冗余的,那么它就没有提供新的信息。”——(第7章:“信息论”,216页,224页)

可见,讯息出人意料的程度越大,所提供的信息就越大,如果讯息接收者能够通过推理、经验等方式获取内容,那么,讯息发送者的发送行为就是多余的,没有向接收者提供任何有价值的讯息——即“信息”。

但是,“冗余”并不是一无是处,就像第1章:“会说话的鼓”在22页所描述的那样:“引入冗余,不言而喻,效率肯定会打折扣,但它是避免混淆的一剂良药,它提供了第二次机会。事实上,每一种自然语言都内在地包含冗余,这也是为什么人们可以读懂错别字连篇的文章,可以在嘈杂的房间里听懂交谈内容的原因。

··············································

以上,仅仅是我阅读《信息简史》的肤浅收获,有关将信息论引入生命科学领域导致对基因编码的发现,以及将思考的复制子类比为模因、对随机性、量子信息等领域的探讨,有待详读此书、逐步吸收。当务之急是,我发现我要尽快学习一些有关逻辑学的知识。