《系统科学导引》序——方福康

以下是方老师给《系统科学导引》写的序。非常值得看看,想想,有除了本书序之外的价值。提前拿出来跟大家分享。

《系统科学导引》序

方福康

看到吴金闪教授这本“系统科学导引”,明显地感觉到与众不同的地方:书名不叫导论,也没有用引言这一类标题,而是用了“导引”这样一种开放性的提法。这个提法明白地告诉读者,本书要通过学习引导你考虑一些系统科学的基本问题,告诉你在哪些科学知识的基础上去思考,如何去思考。从本书的内容和结构来看,很明显的存在着三条主线,即系统科学的发展进程以及其主要内容和成就,然后就是用去本书大量的篇幅论述作为一门科学其发展的理论基础,特别是数学和物理在建立一个理论体系中的作用,再者就是对如何进一步发展系统科学的思考。其实,这一部分发展系统科学的思想是贯穿全书的,因为“导引”的目的就是要引发读者的思考,特别是面对系统科学这一新兴学科所涉及的未知世界。

在一本篇幅有限的教材里,要完成这三项任务是困难的。这里显出吴金闪教授与众不同的地方,他志存高远,宣称要用最少的语言、用最核心的概念来阐明问题。这是一项挑战,考验的是吴金闪教授对系统科学这一学科产生和发展理解的深度,考验的是对于系统科学赖以发展的科学基本理论掌握的程度和高度概括的能力。当我们阅读其力学和量子力学的二章,可以明显地感到吴教授为实现他的诺言所做的努力。至于系统科学的展开和后续发展的内容,则由于这门学科发展的迅速,内容十分广泛,不同学者会有他本人的取向和偏爱,只要把系统科学的特点予以说明就可以了,尽管会具有浓厚的个人色彩。所以,对于吴金闪教授这本“导引”教材,如果仔细体会,无论对于系统科学发展的历程,发展这门学科所需要的理论储备以及如何去发展这门学科,都会受益匪浅,而对于初涉系统科学的青年学子来说,更是能启迪他们的思维,更快更好地进入到系统科学这一广阔的领域。

作为一篇序言,也是对应吴金闪教授“导引”二字的提法,下面,沿着序言中所提出的三个问题,提出一些看法,作为一种意见参与讨论,也可以算作序言的一个延伸部分。

(一)

在 2015 年北京大学的毕业典礼上,有一个著名的演讲,当时身为生命科学学院院长的饶毅教授,代表学校教师向毕业生致词。总共 1500 多字的讲话,获得了多次热烈的掌声。对于我这个读者来说,看重是演讲中的二句话,“从物理学来说,无机的原子逆热力学第二定律出现生物是奇迹”,“从生物学来说,按进化规律产生遗传信息指导组装人类是奇迹”。

一位生物学家,能够对科学的前沿作如此的概括,确实能使人感受到他的功力。实际上,所谈到的第一个奇迹涉及到的是现代系统科学实质性的开始。这里的要点是逆热力学第二定律的提法,当学者们认识到在逆热力学第二定律的后面,还存在着一幅崭新的画卷,此时一个新的科学世界的历程就开始了。在这里有二个学者是需要提到的,一位是 N. Wiener,他最早对逆热力学第二定律的世界有清晰的理念。他指出“我们所做的是在奔向无序的巨流中努力逆流而上,否则它将一切最终陷于热力学第二定律所描绘的平衡和同质的热寂之中……我们的主要使命就是建立起一块块具有秩序和体系的独立领地……我们只有全力奔跑,才能留在原地”[1] 。另一位要提到的学者是 I. Prigogine,他给出了逆热力学第二定律的物理内容和数学形式。这就是耗散结构理论。这个理论冲破了热力学第二定律的限制,指出对于开放系统,在远离平衡的条件下,能够形成一种相对稳定的结构,称之为耗散结构。Prigogine 先是用实验确切地在流体、化学反应二个系统中让世人看到了这个相对稳定的耗散结构。再者,他证明了在热平衡的线性区是不可能出现这种结构的,一定在远离平衡的非线性区,才会有相对稳定的,称之为耗散结构的出现。然后,在论证和讨论了耗散结构的各种性质特点之后,Prigogine 和他的 Brussels 学派,发展了一套数学理论,来定量地描述耗散结构形成的过程、性质和特点,并将其应用到各具体系统和领域,特别是出现了被称为奇迹的生物。耗散结构的出现,包括实验和他的理论体系,使得突破热力学第二定律的想法从议论变为科学。

在此之后到现在的 40 年间,无论从研究的领域,和理论计算的方法都有很大的发展。研究的领域,从最初 80 年代由 Science 提到的 7 个方向,发展到 21世纪初,由 Hoker 的归纳,有了 12 大门类,28 个学科领域,涵盖了生命、神经、人类学、社会、经济、军事、管理等一切方面。研究的方法,也从原初的数理方程,展开到应用计算机、网络、大数据等现代信息工具。面对着系统科学这样一个庞大的体系,包括这门学科的兴起、发展的历程、多种数学工具的运用、涵盖内容众多的学科体系、以及这门学科仍在迅猛发展的势头,要在一本篇幅有限的著作里,要诠释这样一件科学事件是不容易的。但在,吴金闪教授这部著作中,可以看到,他以自己独特的风格完成了一个很有特色的答案。

然而系统科学或复杂性研究目前的进展并不令人满意。虽然有众多研究领域的展开,在研究工具上,网络和计算机发挥了强大的威力,应用于各种具体系统也取得令人欣喜的结果,但是对复杂系统基本规律的探索并没有取得实质性的进展,各个研究领域,各种研究结果,还是停留在己有的理论基础上,只是在外延上获得发展和展开。像饶毅教授提出的生物学奇迹的探索,涉及到进化规律、遗传信息、组装人类这样一些实际上是复杂性研究核心理论问题的研究,并没有获得理论上的突破,还有待于系统科学的未来。

(二)

吴金闪教授这本“导引”著作的另一个显著特点是认认真真的讨论了系统科学所涉及的科学基础。系统科学作为 21 世纪的前沿学科,讨论的完全是一堆全新的复杂系统对象,从数理学科的角度来观察,是从未系统地处理过的。而从耗散结构理论开始,复杂系统的研究显然已经进入到了一个新的阶段,即用数理科学的工具和方法,来获得科学的定量化的结果。这样的研究,与早期的系统科学研究如一般系统论那样定性的讨论是完全不同,在这里需要的是实实在在的科学理论概念和处理实际问题的数理方法。因此在教学内容的选择上,既要照顾到在科学历史上那些行之有效,有成功经验的数理科学方法,又要适当地介绍,随着复杂性研究工作的进展,在近些年来新发展起来的工具和方法。这二方面都有丰富的内容,而要在一个篇幅有限的教材中完成这二项硬任务是考验吴教授的理论基础和学术功力。吴金闪教授没有迴避这个矛盾,他宣称要用最少的文字语言来介绍这些最经典的理论,而实际上他是很出色地完成了这个任务。在理论物理学的经典科学库存中,吴教授选择了力学、量子力学、和统计物理三门课程。其中量子力学是最能体现业务实力的,我们可以从吴金闪教授用最少语言的描述中,看看他是如何处理量子力学这门学科的。

量子力学作为微观世界的奠基之作,与相对论一起,被称为 20 世纪巅峰的成就,独领风骚达半个多世纪。但是量子力学的核心内容只不过是少数几条基本原理(常见的提法是 5 条基本原理)。正是在量子力学基本原理的基础上,搭起了处理各类微观客体运动规律的理论框架。不仅如此,在精妙的数学描述下,量子力学的基本内容获得了十分抽象而又十分精确的数学表述。由量子力学的物理内容所揭示的微观粒子的描述,不过是 Hilbert 空间中的一个矢量,或者说是在这个空间中所描述的一个状态,算子作用于矢量,引起状态的变化,而形成运动方程。Hilbert 空间中矢量的变换或描述状态的方式变换,构成了表象理论。用物理语言颇为费力的一些内容,在精巧的数学语言下变得简单、精确。这种深刻的物理思想和精巧的数字语言的结合,正是揭示物质运动基本规律最有力的工具。在吴金闪教授所写的有关量子力学的章节,可以看到他用最少的语言而做的最大的努力,竭力将量子力学的物理抽象和涉及的数学语言传递给读者。类似的,在力学这一部分,在极有限的篇幅中,不仅介绍了牛顿力学,而且要讲到分析力学。综观全书,吴金闪教授始终强调物理观念和数学思想的重要性。这样的强调不仅是为了继承,更是为了发展,为的是建立一个复杂系统所需要的理论,作好必要的理论储备。

(三)

创新,是一门学科成长、壮大、发展的根本之道。系统科学的发展需要创新,而且是不断创新。目前对系统科学最需要的,是对于复杂系统这个未知世界基本规律的掌握,并由此进一步建立起各种运算体系并解决具体课题。吴金闪教授的著作将创新的理念贯彻全书并指出了必须注意的要点,一是要具体化,另一项是联系、联系、再联系。对于具体系统的关注,各家会有所不同,但是总体上的目标是探索和发掘复杂系统这个未知世界的基本规律。

首先会想到的问题,是世间事物的运动形式和发展规律,不应该只停留在物理世界的物质和能量的理论框架内,特别是涉及生命、神经、人类、社会这样一群复杂系统或更确切的说是复杂适应系统。信息在系统演化和发展过程中的作用己十分明显和重要。所以在理论框架上,应该建立起一个物质、能量、信息的三元素世界,在这个更宽的框架内描述他们的状态,发掘其运动规律。但是在我们的科学宝库中,并没有现成的含有物质、能量、信息三元素世界的理论框架,物理学是 20 世纪影响较大的一门学科,涉及了微观领域的各个部门和高速运行的客体等。但是,在物理学中只讨论物质和能量,不涉及信息。另外一门专门讨论信息的学问——信息论,则是专门研究信息传递过程的,从信息源、信道,到信宿,讨论的是信息如何准确传递,如何解决抗干扰。在信息论中,也没有涉及物质和能量的相互关系。所以在现有的科学库存中,信息与物质没有现成的交集,更谈不到信息与物质相互作用的方式与内容。在这个领域内,无论是理论概念,或是计算方法,目前还没有形成被大家所公认的并可被大家接受的理论成果。

尽管信息与物质的相互作用其规律还没有被充分揭示,但已经有很多学者和实际工作者关注和讨论了信息的重要作用,并做出了许多有意义的启示,为进一步解决这个问题提供了准备。早期有生物学家汤佩松,后来钱学森、徐光宪也有过论述,周光召还提出了信息与物质的相互作用,在社会系统中会起主要的作用。之后,随着对信息的研究展开,徐光宪先生提出了人工信息量的概念,并进行了量值的初步的估算。不同于依靠生物自然进化而形成的自然信息量,人工信息量是指人类由于有了语言以后所生成的信息。徐先生的估算人类自然信息量的总量为10的35次方 bit 量级,而全球人工信息总量估算是 10的20 次方 bit 量级,且每年约以30%的速度增长[2]。徐先生的人工信息量的概念实际上是为人类建立了一套完全不同于生物自然进化而形成的信息系统,不妨称之为第二信息系统。这套建立在语言发展基礎上的人类所特有的第二信息系统,在人类的发展壮大和人类社会的形成和进步起到了决定性的作用。首先,由于语言的产生和第二信息系统的形成使人类与动物界彻底分离开来,逐步成为自然界的主宰[3,4]。然后,由于第二信息系统的不断发展与完善,并与物质生产、社会体制相互结合逐步完善,使得人类从一些弱小的种群,发展壮大成为强大的族群,直到形成社会和国家,成为在地球上目前最为强大的生命体。

信息与物质相互作用的重要性是清楚的,但是迄今为至还没有一个信息与物质相互作用关系的数学表述形式,需要作一些试探。遵循着达尔文所指出的语言对人类发展的关键作用,最近我们讨论了语言作为信息对人脑这类物质的发展过程。在实验数据的支持下,我们得到了这一类包含信息物质运动的数学表达形式,可以用一个非自治的动力方程来描述,其中信息与物质的相互作用是方程中含时间$t$的驱动项。这样的一个计算结果仅是一个单例。它虽然给出了信息与物质相互作用在这个具体问题中的表达式,但并不一定显示出是一种普适的形式,因为信息与物质相互作用是复杂的,存在多种表现形式,现在我们还未能窥测他的全貌。但无论如何,在这里我们找到了一种具体的信息与物质相互作用的数学表述形式及其所反映的科学内容,希望能成为一个好的开始,在探索复杂系统的基本规律上获得进步。

方福康
2018年4月

参考文献
[1] Norbert Wiener, I Am a Mathematician: The Later Life of a Prodigy, 1964, p.324.
[2] 徐光宪,化学分子信息量的计算和可见宇宙信息量的估,中国科学 B 辑:化学,2007年,第 37 卷, 第 4 期:313-31.
[3] 达尔文,《人类的由来》,第三章,1887.
[4] Martin A. Nowak,Evolutionary Dynamics,Harvard University Press,2006.

《系统科学导引》图书和MOOC课程上线了

经常听到“这是一个系统工程”,什么什么“是一个系统性问题”这样的说法,来形容某件事情或者某个东西比较复杂,有的时候也意味着这个事情或者这个东西应该用某种适合“系统性问题”的方式来解决。如果这个说法有意义,其实就要求我们就必须先有一些这样的解决方法。我们有吗?甚至,我们有什么样的问题是系统性问题的一个比较科学完整的说法或者定义吗?如果这些都没有,那么,当我们说什么什么是“系统工程”是“系统性问题”的时候,也就是“我们无能为力、问题太过复杂”的代名词。

作为科学家,我们显然不能满足于这样的代名词:系统科学就是实在太复杂的我们没有办法的研究对象的代名词。因此,《系统科学导引》MOOC课程和书的最主要的目的就是讨论什么是系统科学,系统科学有哪一些比较有自己学科特点的思维方式和分析方法,有哪一些有特点的研究实例。我们也稍微会回答一下,需要哪些数学物理的知识、思维方式和分析方法的基础。

本MOOC课程和书的基础是我在北京师范大学系统科学学院开设的“系统科学概论”和“系统科学数理基础”两门课。为了能够让学生体会到什么是系统科学,并且从欣赏研究实例和做练习中学会一些系统科学的思维方式和研究方法,我必须自己先有一个反映什么是系统科学的概念体系以及相应的研究实例的体系。这各课程和书就是这样一个不断地挑战我自己对系统科学的认知,不断地整理体系的所得到的一个结果,不能算是这个学科的一个完整的整理。经过前人的多年积累以及我自己七年的课程建设,本课程和书就是我抛出来一块“什么是系统科学”的砖,来引出来玉或者更多的砖。

系统科学就是具有系统特点的科学。那么,什么是科学,系统特点又指的是什么?这些就是本课程和书要通过具体研究工作的例子来回答的问题。除了对交叉科学和复杂性研究感兴趣的研究者、教师、学生,以及把物理数学学活的学习者,本课程和书还强烈推荐给对科学感兴趣的一般读者。相信我,你可以看懂的,前半部分“系统科学概论”,完全可以当做科学普及来看。

课程和书的特点:

  1. 从科学而不是哲学和数学的角度来讨论系统科学
    • 批判性思维、系联性思考、可重复性V.S.可证伪性的讨论
    • 科学(物理学、系统科学)和数学的关系
    • 赏析大量的具体科学研究工作来体现什么是系统科学
  2. 系统科学的思维方式和分析方法的提炼总结
    • 系联:从孤立到有联系,从直接到间接,从个体到整体
    • 分析与综合或者说还原论和整体论的结合
    • 交叉性:从具体问题中来,到具体问题中去,留下可能的一般性理论

资源列表:

感谢北京师范大学研究生院、北京师范大学系统科学学院对课程建设和图书出版的支持。感谢课程和图书的编辑们的付出。

从编程序看分析和综合,以及用于写作和做报告

最近,不得不来指导一下学生编程序。除了

  1. 给程序加执行参数(例如linux命令cp后面的文件名就是用来满足适于用任何文件的要求,例如ls后面的-a就是用来显示隐藏文件等等)来增加程序的功能而不是完成非常特定的功能,然后每次不得不去修改程序本身
  2. 运行参数包含测试功能的开关,这样测试起来简单
  3. 程序尽量要做到命令行下可执行,不要依赖于集成环境IDE,可以用makefile
  4. 变量名要有意义
  5. 程序要加上说明,看的出来每一行在做什么
  6. 合适的时候,做一下优化,例如用矩阵代替循环之类的
  7. 一般的编程,以及每一种语言,基本上都会有一些风格习惯,要稍微了解和遵循

这些基本的要求之外,最重要的是Divide and conquer的思想,也就是分解和综合的思想:把每一个程序分解成合适的步骤,每一步完成特定的功能。甚至在主程序这样的高等级程序里面,完全不应该有具体的计算,只能有每一段应该完成什么的流程;甚至在比较高级的功能性模块里面,也只能由每一段应该完成什么的流程;仅仅在最底层的程序里面才应该有具体计算,核心计算。也就是程序应该长成这样:

main{
   get some run-time parameters #meaning of every parameter
   to do task1 #what is this task, why it is needed here
   to do task2 #what is this task, why it is needed here
   to do task3 #what is this task, why it is needed here
   testcode #activated when the designated run-time parameter is called
   print results #to serve what purpose
}


task1(parameters){
   to do task11 #what is this task, why it is needed here
   to do task12 #what is this task, why it is needed here
   testcode #activated when the designated run-time parameter is called
   return something back to the calling program
}


task11(parameters){
   Realcode, core code #how this task is done
   testcode #activated when the designated run-time parameter is called
   return something back to the calling program
}

这样的程序,尽管初看起来,会云里雾里,发现,每个子程序都没有在干活啊,就是在调用下一级子程序,好像只有搞懂最底层的子程序,才能看懂这个上一级程序。但是,只要稍微习惯一下,改变一下思考问题的方式,就会发现,这样的程序比把核心程序和流程程序放在一起的,要好懂的多好懂的多。关键的思考问题的方式就是分析和综合,或者叫做Divide and conquer,或者WHWM分析方法(What,How,Why,Meaningful)。具体来说,就是,在看上一级程序例如主程序的时候,每一个子程序只要明白在完成什么功能,这个功能和当前程序的目的是什么关系,就行了。不需要取搞清楚子程序是怎么做的。也就是说,What(完成什么功能)是最主要的,然后是Meaningful(起到什么作用),How(怎么做的)和Why(为什么这样做,为什么做这个)是次要的。只有当真的需要的时候才进入下一级子程序,而且就算进入下一级子程序,还是一样,先搞清楚这个子程序下面的流程,也就是每个子子程序的功能以及它们和这个子程序的功能的关系,而不去管这些子子程序是怎么实现的,有没有更好的实现。当然,这样的阅读依赖于程序员的注释,因此,每一个功能模块,都要做好注释,完成什么功能。

记住:很多细节我们都可以不懂,只要我们懂得这个东西做了什么,在整体中起到什么作用。当然,如果我们真的想搞懂整个问题,那么,自然,底下的How和Why也是重要的。

这样来做还有什么好处呢?方便测试,方便协作。测试的时候,可以单独来针对特定的子程序,而且可以设定一个针对这个子程序具有精确解的情况来测试。协作的时候,每一个贡献者可以只管当前任务的细节,而不去管这个任务之上的子程序和之下的整合,当然,在把任务分解准确以后。

只要做好分解,不断地分解——每一次都只有流程直到不得不写下来核心程序,做好注释,做好测试,无论编程水平(例如语言包的熟悉程度、算法的创造性运用)本身多烂,都能够编出来好程序。

同样,写作和阅读的时候,也是如此:首先是整篇文章想说什么主要信息,为什么说这个;接着把整篇文章分解成一个一个的部分,每一部分说了什么主要信息和整篇文章的关系是什么;再接着,还可以把每一个部分再次分成一个一个的部分,每一步分说什么主要信息和它的上一层关系是什么。也就是在每一个层次上,问What和Meaningful的问题,然后依靠在下一层问What和Meaningful的问题来回答上一个层次的How和Why。

同样,做学术报告的时候,更加要如此:首先是整个报告想说什么,为什么说这个;接着,用什么例子或者结论来展开论证和表达这个主要信息,以及反过来,在介绍这些例子和结论的技术细节的之前一定要让你的听众明白,你为什么将这些例子和结论,它们和主要信息的关系是什么;然后,对每一个例子和结论,做同样的事情,先搞清楚需要用哪些进一步的细节来展开这些例子和结论,在具体进入这些进一步的细节的具体技术细节之前,能不能交代清楚这些细节和这些例子和结论的主要信息是什么关系。不断地重复这个分解的过程、明白起到对上一级的内容什么样的支撑作用、然后才是细节的展开。为什么要这样做?因为你的听众基本上不会一下就明白最底层的细节,每一次的封装都能够降低你的听众的记忆和信息处理负担。

当然,有的时候,这个层次会有交叉。这也是为什么要依靠概念地图——整体是层次结构,但是跨越层次的联系是最重要和核心的联系。这也是系统科学,物理学,或者说科学的核心思想之一——分析和综合。除了学习物理学、系统科学,你还可以通过练习编程来体会这个分析和综合,只要完成一个需要300行以上的程序,你就不得不体会到。任何语言都可以,但是,不要直接就是图形界面的例如VB之类的,试试C、Python、Java等,尤其是Java(接口,而不是具体程序)。

光电效应为什么能够证明光的粒子性

光电效应是一个非常著名和有历史意义的实验:在能够真实地用单光子做实验之前,这个实验就逼迫物理学家们用单粒子的视角来看光(当然,后来的进一步研究证明其实把光看成波也能够解释光电效应实验,只需要把电子的部分采用量子力学,可以Wikipedia “光电效应”)。那么,为什么是这样的呢?

这是光电效应的实验装置示意图。两片连着电源的金属板构成一个腔,光照到其中一片金属板上。当光的频率比较合适的时候,就可以测量到电流——意味着有电子从左边的金属板跑到了右边的金属板上。那么,这个电子是从哪里来的呢?这个电流的强度和电压的大小和方向、光的频率和强度有什么关系呢?这样的关系怎么理解呢?
实验发现,对于给定的金属,只有光的频率大于某个值的时候,才会有电流,不管用多强的光来照,也不管什么样的电压。也就是说,单纯改变光的强度或者电压的大小和方向,不会把没有电流的情形变成有电流的情形。如果我们按照经典波来理解光,则光的强度可以看作是介质上振动的幅度的大小。大的强度就意味着大幅度的振动,于是,就会使得电子更容易被从金属中打(激发)出来。为什么改变强度会不起作用呢?

接着,实验还发现,对于能够产生电流的光,如果我们改变电压的大小和方向,则存在着饱和电流和截止电压。饱和电流的意思就是无论我们从正面——也就是帮助电子从一个金属板跑到另一个金属板的情况——怎么加强电压,只要电压大到一定程度,则电流不再增加。在那之前,电流会一直增加。截止电压的意思是,如果我们反过来加电压,也就是阻碍电子从一个金属板跑到另一个,则当电压到达一定大小之后,电流消失。在那之前,电流会逐渐减小。也就是下图的效果。a,b,c对应着不同的光强度。我们先不管。我们仅仅盯住其中一条线来看,例如a。x轴最左边就是截止电压。y轴最上方就是饱和电流。

为什么会出现饱和电流和截止电压呢?饱和电流意味着从金属里面跑出来的电子已经完全都到达对面的金属上面去了,没有浪费。截止电压意味着从金属里面跑出来的电子一个都没有达到对边的金属上面,全都被电压(电场)阻碍了。也就是说,外加电压的改变,不会对跑出来的电子的数量有影响,仅仅改变的是电子是否容易到达对面。

这个时候,我们问,这个截止电压和什么东西有关系呢?给定金属的条件下,截止电压仅仅和光的频率有关系,和光照强度没有关系。实际上,改变光照强度的话,在给定金属和光的频率的条件下,仅仅会改变饱和电流,不能影响截止电压。于是,这个就更加说明了把光的强度看作是振动幅度的大小——这样就会更加容易把电子激发出来,是错的。

当然,正面的解释为什么需要把光子看作是一个个小球才能够理解这个现象是比较难的。不过,顺着这个光的小球的模型来解释这个现象倒是比较容易:光是一个个的小球,其本身的能量状态由其频率所决定,光的不同的强度对于给定频率的光来说表现为单位时间里面通过一个截面的这样的光小球的数量不一样;电子需要依靠从光子那里吸收的能量来从金属里面跑出来。于是,当单个光小球的能量不够让电子跑出来的时候,就没有电流产生。另外,就算小球的能量够,但是,如果加上反响的电压,则电子的能量在运动过程中会逐渐降低,因此,只要反向电压足够大,则其能量在到达另一片金属之前就消耗完毕,则不产生电流。这个足够大的反向电压就是截止电压。相应地,饱和电流的产生,则是因为给定光强度和光频率,单位时间能够产生的电子的总数就是定的,于是,增加正向电压的作用仅仅使得这些电子全都能够跑到另一片金属上,而不能增加跑出来的电子。当然,如果光的强度大,则单位时间内这样的光子多,于是跑出来的电子也会多,于是电流强度大。

这样,通过把光看作是一群小球,每个小球带着一份能量,就解释了光电效应现象,并且还发现,把光看做是介质的振动于是光的强度就是振动的幅度,不能解释光电现象(再一次强调,其实,可以的,只要把电子的运动部分量子话,也就是说,光子量子化电子经典、光经典电子量子化、光和电子都量子化,这三种方式,都可以解释光电效应,但是,光经典电子也经典,这样的模型不能解释光电效应)。

在构造前面的解释的过程中,我们用到了一点电压、电场、电流的知识,但是,更多的是实验和测量(尤其是考察其他因素都不变仅仅变化其中一个因素的时候的实验现象,作对比)、联系和对比、用数学和逻辑来构建想得通的想的明白的模型。很多时候,对科学现象的理解确实依赖于科学知识,但是,最根本的,我们需要的是去问一问为什么,去想一想是不是想得通。

光是粒子又如何,光是波又如何?

之前我们讨论了能够在很大程度上说明光是粒子的实验:光电效应为什么能够证明光的粒子性。那当然,也有大量的实验佐证光是波——把光看作是介质上的振动,然后依赖介质上的Newton力学来理解光的行为。那么,为什么光不能就是这样的东西:在解释不同的实验的时候用不同的模型呢?这样有什么不可以呢?

首先,有其他实验可以很大程度上证明光的传播不需要介质。例如Michelson-Morley实验(请自行Wikipedia之)证明如果有介质并且这个介质的运动速度通过伽利略变换进入光的传播速度的话,那么,实验结果和理论结果不符合。再例如,有实验证明光是可以在真空中传播的:你想确认一下这个事实的话,只要看一下天空,看到太阳月亮星星就是这个证明——你想中间有多少什么都没有的路光要走啊。当然,你仍然可以怀疑说,这个看起来测量起来什么粒子都没有的“真空”其实不是真空,还是有某种介质的。于是,你就可以设计一个情景来让这个“介质”有自身的速度,这时候,再来测量光的行为,就回到了Michelson-Morley实验。因此,Michelson-Morley实验很大程度上说明:光的传播不需要介质,如果有介质则这个介质很神奇——其自身运动的速度不怎么影响光的传播。

既然没有介质,那么,把光看作介质上的振动,并且这个振动的传播符合Newton定律就不太行了,那怎么来建立光的心智模型?

接着,我们回顾一下那些启发了光的经典介质波的模型的实验。例如,光的折射和反射。声波、水波都会出现折射和反射,也就是一个振动传过来遇到了界面,界面上的介质会被这个传过来的振动激发,由于是不同的介质,这个受激发的振动可能会被传播到其他方向上去。如果是同一种介质,其实也会发生这个受激发振动的事情,只不过,那个时候,跑向各个方向的受激发振动刚好相互抵消。而当存在不同介质的界面的时候,某些方向上的振动会被加强而不是相互抵消。这个把介质上的多个粒子受激发振动看作新的波源然后做叠加的做法叫做惠更斯-菲涅耳原理(其本质还是波的Newton力学),或者去看看Feynman的《QED:光和物质的奇妙理论》。当然,其实,光的折射和反射也可以用直线传播的小球和半透膜的模型来解释:把光看作小球,每次遇到半透膜(开了很多小孔的筛子?)就有可能被弹回,也有可能透过。这个称作光的随机性粒子模型(有的时候也被称作几率波粒子模型)。

那我们再来看光的干涉和衍射。衍射现象是指,在光的传播路径上,有障碍物,可是,你仍然在障碍物的后续路径上观察到了光。如果光是直线传播的小球,就不太可能有这个现象了。而波的惠更斯-菲涅耳原理就可以解释这个现象,在此略过这个解释。光的干涉现象是指来自于两个振动源的光在同时能够达到的区域会出现暗条纹和明条纹。暗条纹的意思是,对于打开任何一个光源就能够照亮的区域,当同时打开两个光源的时候,反而不变暗。当然,这个时候,对光源有一定的要求。但是,这件事情用光的粒子模型是很不可理解的:你在玩植物大战僵尸的豌豆射手或者用机枪打仗,发现,有一个地方用一个豌豆射手或者一个机枪手都可以打到,但是,当你放上两个豌豆射手或者两个机枪手的时候,就打不到了。这是不可能的事情。如果是这样,就没有火力覆盖了。

那么,把光看作是介质上的振动是怎么来理解光的干涉的呢?说一个光源传过来的振动和另一个光源传过来的振动可能在振幅上不匹配,例如一个是振动最低点也就是波谷的时候,另一个正好传过来一个振动最高点也就是波峰,正好这两个振动的矢量叠加相互抵消,于是,没有照亮。这个解释非常漂亮。

那问题来了,到底我们应该把光看作是粒子还是满足Newton定律的介质上的振动波呢?我们能不能在讨论某些实验例如折射反射光电效应的时候,把光看做粒子(当然,这时候,我们也要问这个粒子是不是满足粒子的Newton定律。问题留在这里,以后再说),而在讨论折射反射衍射干涉的时候,把光看作是满足Newton定律的介质上的振动波呢?万一遇到新的现象怎么办,用什么方式来描述?或者每次都先试试用两个理论之一的结果和实验比较一下,对上了,对这个现象就用这个理论?

第一、科学的目标是希望对于给定的现象,我们的理论模型能够给出来一个结果的预期,然后和实验相比较。因此,每次来凑一凑试一试显然是不行的。如果能够对现象做一个完善的分类,遇到现象就知道用哪一个模型,倒是也可以接受。不过,这个分类,在光这个现象上,我没有见过。

第二,科学的原则有一条,希望用更少的并且相互不冲突的更具有一致性的理论来解释更多的现象。因此,用两条看起来相互冲突的理论来解释同一种东西的不同的现象是不够的,就算上面提到的完善的分类存在的话。而且,将来,我们会看到,有一个光的新的理论,它能够同时解释上面所有的现象。

顺便,我们怎么知道是同一种东西呢?只要我们做实验的时候产生光的机制是一样的,然后用来做以上两类实验就可以。另外,在这里,我特意扔掉了光的波的模型,而用更加复杂的“满足Newton定律的介质上的振动波”的模型。将来我们会知道新的模型还是一个光的波的模型,只不过不符合Newton定律,而且是振幅波,而不是几率波。后面为了语言的简单,我把这个“满足Newton定律的介质上的振动波”的模型简称为经典波模型。

那么,到底怎么办?什么样的模型可以即具有粒子性,也就是确实是一颗一颗打过来的,不会再一次把能量分离成为某个最小单位以下的,强度增加就意味着增加粒子数量的,这样的粒子,还具有波性,也就是可以发生干涉和衍射的这样的波?

再一次提醒注意这个干涉的不可思议性:如果我们用一颗一颗粒子来解释的话,就意味着有一个地方打开两个粒子源中的任意一个粒子源的时候粒子能够到达,但是同时打开粒子却不能达到。

更进一步,这个实验还可以这样做:保证在整个实验中每次仅有一个粒子,也就是一份能量,在整个实验环境中。具体的做法大概来说是这样,制备一个单光子光源,在这个光子的光路上放上分光的仪器使得这个光子可能走两条路中的一条——例如放置一个双缝或者一个偏振分束器。

这样来做,这个实验结果就更加不可思议了:空间中每次只有一个粒子,如果说不能到达某个一条路就能到达的点,也就是说,好像这两条路上的光子影响了彼此,可是,真的仅仅有一个光子啊,自己和自己是怎么影响怎么抵消的呢?回到波的模型,可以把波看作是振动分成几个部分传播到不同的路径上,将来再一次合起来,自然就可以相互抵消。可是,光子不能再一次分成更小的能量单位啊!

注意,把光看作几率波的模型也不能解释这个单光子干涉现象:要么走路径1,能够到达;要么走路径2,还是能够到达,则合起来就是能够到达,绝对不会出现不能到达的情况,除非路径1和路径2的“几率”是一个矢量,能够想振动幅度一样被加起来。

这里最大的矛盾,或者说将来的出路,就在于:一方面,光子不能分成更小的单位,不能同时走很多条路径,因此不能把不同路径上的“振动幅度”像经典波一样叠加起来;另一方面,在数学上,经典波的把来自于不同路径上的同时传播过来的波相互叠加起来,确实能够描述实验现象。

怎么办?难道我们需要一个在数学上满足“波的叠加”的但是在物理上是一个个不可再分的小球的模型来理解光子的行为?一个个的小球怎么会具有波呢?除了看作概率,就像前面的半透膜,可是概率解释不了干涉,还可以看作波,怎么可能呢?

实际上,光的心智模型正是这样的满足“波的叠加”的小球。有更多的实验会提出来挑战很大程度上说明,只有这样的模型,才能够解释这些实验现象。例如,这几个实验:
能看到光是多么神奇的事情啊
光过玻璃是一件多么神奇的事情啊
光过三个偏振片和男人女人过三道门的对比

Feynman说过,只要你能够明白双缝干涉,那么,你就明白了量子力学,并且如果你没有被量子力学苦恼过,那么,你就是不明白量子力学,更有你只要宣称明白了量子力学,那么,你就没有明白。

学习量子力学主要就是为了搞清楚为什么这个理论是这个样子的,理解上的主要困难在哪里,而不是仅仅学会怎么算。就像Feynman在《QED:光和物质的奇妙理论》,《Feynman物理学第三卷》以及吴金闪的《二态系统的量子力学》里面所强调的一样。怎么算,不好意思,你需要至少学习一个理论物理专业的硕士,甚至博士。

具体现象的知识固然有意义,但是,本文最大的目的是跟你一起从具体的科学现象的思考中体会什么是科学,体会量子力学的神奇和困难之处。