科学普及 – 吴金闪的工作和思考

哲学、数学、科学和系统科学之间的联系和区别

之前，经过我补充的罗素的话是这样说的：

科学是讲道理和经过（或者快要能够）实验验证的，哲学是讲道理的可实验验证的但是还远远没有能够实验验证的，宗教是不讲道理也不需要验证的；以及我补充的——数学是讲道理的但是不求实验验证的。

现在，我来进一步补充一下：

数学是研究关系(形成的数学结构)的学科，不屑于接受现实的检验。
系统科学也是研究关系的学科，要接受现实的检验。
科学（例如物理学）是研究某一类特定关系（例如，物理相互作用）的学科，要接受现实的检验。

尽管数学不屑于接受现实的检验，但是，其提供的数学结构往往会成为思维的语言，进而成为用思维来描述世界的语言。例如，在上面的几句话里面，你可以发现，关系远远比对象重要。那，为什么关系比对象重要？数学集合和映射的语言、范畴论的语言，都告诉你，给对象一个什么样的名字是次要的，重要的是这个对象和其他对象之间的关系。当然，如果对象的名称和关系刚好适配，则这个名字就更具有启发性，可以用来望文生义。

系统科学是数学和科学之间的学科。在特定类型的关系被研究得比较成熟形成自己的学科以后，就会脱离系统科学进入专门学科。当然，历史上是先有专门学科的，因此，可以看作是系统科学是把分散在各个专门学科之内的研究关系的那部分具有共性的东西总结提炼出来而形成的。尽管系统科学仍然非常不成熟，在发展过程中，至少，现在已有了一个大概的精神：从孤立到有联系，从直接联系到间接联系，从个体看到整体，从整体来看个体，以及在这个精神下的一些针对具体研究问题的分析方法，并且正在形成具有一定普适性的超越具体系统的分析方法。

看起来，似乎，宗教、哲学、数学、系统科学、科学之间的联系和区别基本上搞清楚了。请大家批判。

什么是研究工作，什么是一个博士生的研究工作

学习的根本目的是为了创造知识、创造性地运用知识、欣赏知识和知识的创造过程。当然，顺便，为了实现这些目的，最重要的是理解知识，也就是看到概念之间的联系、看到概念和它诞生的时候的问题的联系、看到概念和学科大图景（一个学科的典型研究对象、典型研究问题、典型思维方式、典型分析方法、和世界还与其他学科的关系）之间的联系。只有在学习的时候得到了深刻的理解、用了研究性学习（创造体验式学习，把一个概念的典型场景从原始论文或者其他地方提炼出来，设计好一个问题，让学生通过解决这个场景问题来自己提出概念），才能帮助我们做好的研究。不过，这个理解知识不是我们今天要说的重点。我们今天来说说，既然研究是学习的根本目的之一，甚至也是学习的重要方法之一，那什么才是研究，尤其对于一个博士生来说。

首先，研究是大概来说这样的一个过程：提出问题之前的准备（包括学科知识和大图景的研究性学习、论文阅读，论文阅读要看到论文之间的联系，形成概念地图，得到所研究问题的来龙去脉和现状的整体认知）、提出问题、把问题形式化（例如变成一个数学问题、变成一个实验）、求解问题、检验答案（先假设形式化准确，用其他方法或者极端情况来对比一下一般的答案，设置对比实验组；如果过了这一关，回到形式化这一步，看一看假设是否可以接受，如果修改其中某些假设会怎样；最后，可能还要做实验和实践的检验），以及之后的撰写和投稿论文（这里也有很多技能要学习，例如结构化写作）。一个希望做研究工作的人，毫无疑问，要通过一两个工作来对这个研究过程形成一定的认识。尤其是提出问题这一步，就算在导师已经提好问题的情况下，也要回到场景去体会一下，问

为什么会提出这个问题？
如何提出的这个问题？

当然，熟悉过程，学会一些技能，理解好学科，这些都是训练。基本上是硕士阶段应该完成的事情。当然，随着研究工作的开展，你对学科可能会有更好的理解。如果是博士，则还有更高的要求：你得是某个方面的专家，以及有一两把善于使用的刀子，以及对某个领域的兴趣和对磨刀子甚至发明刀子的兴趣。

其次，研究不仅仅是上面的那个过程而已，研究是通过找到和解决一个学科当前还不能解决的问题（可能是形式化之前的偏实际场景的问题或者形式化之后的偏理论体系的问题）来补充甚至重构这个学科当前的知识体系和大图景。对于后者，有的研究工作会给这个学科提供新的思维方式分析方法，因此，不仅仅是解决了某个问题而已。因此，对于任何一个研究工作，都要问类似这样的问题（对于欣赏他人的研究工作，也要问类似的问题）：

在我自己要做的这个研究之前，
1. 这个问题确实还没有解决吗，没有人研究过或者说没有人用这种方法研究过吗？
2. 这个问题可能的答案是什么，如果我们得到了某个答案，对于整个学科甚至整个科学和技术来说，意味着什么？
3. 这个问题的解决大概需要什么知识和技能的基础，尤其要识别出来其中最关键的那一步，我从中能够学会什么？
在我解决这个问题之后，
1. 这个工作提出了新问题，发展了新方法、得到了新结论、提供了新案例新应用场景？
2. 这个问题以及现在的解决方式和答案，还有什么需要继续改进的，还可以怎样进一步发展和迁移？
3. 我从中学会了什么，学会的东西可以如何帮助我成为一个研究者？可以从学科大图景的角度来思考，从知识和技能的角度来思考。

经过这些思考，你除了了解了研究的流程，还对某个学科分支的研究现状——已经解决的没有解决的问题、问题的理论和实践价值、典型思维方式和分析方法，以及这个现状的来龙去脉——有了比较好的认知，还有一两把善于使用的刀子（思维方式、分析方法、提出问题、问题的形式化等等，任何一步任何一个方向比较强，都行）。这时候就差不多可以成为博士了：在你所研究的问题的方面，你已经和这个领域的最前沿的研究者在思考和面对类似的问题了（尽管你可能没有人家快、深入、可靠等等），你已经超过你的导师了，如果这个导师不是也正好做这个问题的直接研究的话。

拿论文追热点的工作当例子

我们来问和回答上面的问题。

为什么会提出这个问题？如何提出的这个问题？
论文的创新性的度量是一个很重要的问题，论文的评价、推荐、甚至将来是否选择把这个论文加入学科核心知识结构，都需要依靠这个创新性。但是，人类是通过阅读论文，把这个论文的核心内容提炼出来，在其他研究工作的背景上，来做这个创新性的评价的。也就是说，如果算法要能做的话，要先解决本论文的核心内容提取、其他研究论文的核心内容提取、作对比的技术，这些问题。在那之前呢？我们是不是可以通过引用行为来衡量追热点程度，也就是一定程度上创新性的反面呢？例如有的人引用一篇论文，真的是因为看到很多其他人也在引用这篇论文。

这个问题确实还没有解决吗，没有人研究过或者说没有人用这种方法研究过吗？
创新性的问题有人研究但是进展有限（这句话背后是大量的论文），领域层面的平均追热点程度有人研究，论文个体层面没有。更进一步，暂时没有发现用追热点程度传递的方式来衡量论文追热点程度。

这个问题可能的答案是什么，如果我们得到了某个答案，对于整个学科甚至整个科学和技术来说，意味着什么？
有可能可以找到一个能够描述论文追热点程度，也就是创新性的反面，的指标。不过，这个需要检验，而且这样的检验不是很容易。如果做出来了，第一确实就可以帮助做论文的评价和推荐等任务，多了一个维度；第二，可能可以在科学学领域进一步推广影响力扩散（从直接到间接）这个思维方式和分析方法。

这个问题的解决大概需要什么知识和技能的基础，尤其要识别出来其中最关键的那一步，我从中能够学会什么？
从中可以学会影响力扩散的思维方式和分析方法，也能够进一步了解科学学这个领域。

这个工作提出了新问题，发展了新方法、得到了新结论、提供了新案例新应用场景？
新方法，可以用于论文评价等场景。

这个问题以及现在的解决方式和答案，还有什么需要继续改进的，还可以怎样进一步发展和迁移？
还没有实现真正的论文创新性度量，这个论文追热点指标本身也还需要进一步的验证。

我从中学会了什么，学会的东西可以如何帮助我成为一个研究者？可以从学科大图景的角度来思考，从知识和技能的角度来思考。
这个留给建林回答。以下是建林的回答。

类似用户画像，对一篇论文我们也可以从多个角度或维度来描述，比如论文的学科交叉性、创新性、影响力、作者特征、期刊特征等等。在本研究中我们主要试图通过刻画一篇论文追踪热点的程度来间接刻画一篇论文的创新性。通过这个研究，我不仅加深了对论文间“引用”关系的认识，主要还学会了更深入地思考问题，用系统思维或是“联系”的视角去看待和解决问题。“论文追热点”是个很有意思的研究主题，在开展研究的过程中我有一系列的思考和疑问，比如：论文是否存在追热点这种现象？如果存在，我们如何来度量论文追热点的程度？当我们提出了量化指标，又该如何验证？这种指标的设计思想是否可拓展？根据指标得分来判断追热点程度高或低的论文有什么特征（在发表时间上、学科分布上、国家分布上）？哪些因素又会影响这些特征？对于这些疑问，我需要通过查文献、实证研究、反复调整算法指标来解决，也需要多思考这些问题之间的逻辑，不至于使自己偏离研究主线。通过这项工作培养了我自己独立思考的习惯以及严谨的科研态度，有助于日后书写项目申请书时理清研究思路以及学会独立开展一项研究工作。在本研究中，除了学会思考问题，还需要补充很多相关的背景知识，而这些知识主要是从相关文献中获得，学会如何整理这些相关文献也是必备的一项技能，主要是理清这些文献与当前研究的联系。

拿综述文献识别的工作当例子

为什么会提出这个问题？如何提出的这个问题？
实际工作中，我们需要把总数文献识别出来，单独做处理，不管是评价还是用来构建学科概念地图的基础帮助学生进入一个领域（总数文献在这方面无与伦比）。

这个问题确实还没有解决吗，没有人研究过或者说没有人用这种方法研究过吗？
前人提出了多个经验指标，例如参考文献的数量、看期刊。但是，还没有真正解决识别的问题，尽管已经可用。我们打算构建一个机器学习分类器来做这件事情。

这个问题可能的答案是什么，如果我们得到了某个答案，对于整个学科甚至整个科学和技术来说，意味着什么？
对于这个问题，有一个综述文献分类器的作用就是可以区分综述文献了。

这个问题的解决大概需要什么知识和技能的基础，尤其要识别出来其中最关键的那一步，我从中能够学会什么？
需要学会机器学习，尤其是其中的自然语言处理和分类器。由于实际标注数据中有噪声，因此，这个工作除了实现一下分类器之外，还需要考虑噪声的解决。后者是一个科学问题，前者基本上就是工程问题。从中，我还能学会如何区分工程和科学问题，以及从研究工作中提出和解决科学问题。

这个工作提出了新问题，发展了新方法、得到了新结论、提供了新案例新应用场景？
新工具（分类器）、新方法（噪声问题，不过后来发现这个方法的精神已经有前人的工作，尽管细节不同）。

这个问题以及现在的解决方式和答案，还有什么需要继续改进的，还可以怎样进一步发展和迁移？
分类结果还需要进一步的验证。可以把噪声处理的方式作进一步的研究和应用。

我从中学会了什么，学会的东西可以如何帮助我成为一个研究者？可以从学科大图景的角度来思考，从知识和技能的角度来思考。
这个留给骆慧颖回答。以下是骆慧颖的回答。

首先是在整个工作过程中将数据处理、构建模型、训练模型等技术运用于实践的过程中掌握了这项技术，编程能力也得到了提升。这对于我来说是一种知识和技能的积累，也是研究nlp的基础。其次是学会了如何去区分问题和工程问题，也学会了面对科学和工程问题怎么去思考。如老师所说的，构建分类器是一个工程问题，而处理噪声数据就是一个科学问题了。科学问题就像是“咦？这条路看上去好诱人，感觉前方风景很好呢！走！去看看！”我们不知道这条路通向哪里，更多的是好奇心驱使的在过程中发现问题和解决问题，它从问题出发，如我们的工作中，对于分类器的训练，标注的数据中有错误的怎么办？这些都是驱使我们进行噪音数据处理的问题导向。而工程问题则是“我知道我要去哪，但是眼前这么多条路，我该选择哪一条？又或者自己开条路?”是由实际需求和应用出发的，从选择道路到沿着路走在最终到达目的地，就像我们工作中我们想要从众多文献中将综述文献识别出来我们应该怎么做？这些都在今后的研究中给我提供了提出问题和解决问题的思路。也接触到了ensamble learning和active learning这两种学习方式，同时在进行资料学习的也同时学习到了监督学习、半监督学习、无监督学习等学习方式，是对机器学习知识的一种补充。

拿科学家的半生命的工作当例子

这是邓老师的回答：

为什么会提出这个问题？
研究科学家的科研规律可以更好的来指导科学家的工作，不管是把科研当工作(痛苦不堪)，还是把科研当人生(痛并快乐)，搞科研的科学家，他应该会想知道，在进入学术领域N年之后，平均来说，还有多少年，他就可以退出学术领域了(开心，终于解脱)，或者说，还有多少年，他就要离开学术领域了(遗憾，还没玩够)。具体来说，我们可以从发表文章，被引文章的角度，来定义科学家的学术生命和半生命。
如何提出的这个问题？
在前人的基础之上提出问题，前人有研究期刊，知识，同龄人等的半生命，我们关注科学家个人的学术半生命。
这个问题确实还没有解决吗，没有人研究过或者说没有人用这种方法研究过吗？
科学家个人学术半生命(发文和被引角度)的问题暂时没有人研究，不过前人用类似的方法研究过人的生物学生命问题。
这个问题可能的答案是什么，如果我们得到了某个答案，对于整个学科甚至整个科学和技术来说，意味着什么？
我们可以计算出科学家当前年龄的淘汰率和预期剩余寿命，对于科学家个人而言，他可以大概知道，还有多长时间，他的学术生命就要结束了。
这个问题的解决大概需要什么知识和技能的基础，尤其要识别出来其中最关键的那一步，我从中能够学会什么？
主要是利用统计学的知识进行数据的处理和结果的可视化，在某一个数据集上，统计个人的退出年龄，根据人口动力学方程计算出平均的预期寿命和淘汰率。
这个工作提出了新问题，发展了新方法、得到了新结论、提供了新案例新应用场景？
一种新的从发文和被引的角度来定义个人的学术生命的方法，同时给出了个人平均预期学术生命和淘汰率的参考曲线。
这个问题以及现在的解决方式和答案，还有什么需要继续改进的，还可以怎样进一步发展和迁移？
数据集的体量较小，需要更大规模的数据集，来计算得到更加普遍的结果。
我从中学会了什么，学会的东西可以如何帮助我成为一个研究者？
- 了解了科研工作大概是一个什么样的过程，是提出一个可以计算和验证的模型(数学语言来描述)，在数据上计算并验证模型，如果模型能够较好的符合现有的数据，则可以进行模型的迁移，当然，模型很有可能在其他数据上被推翻。
- 以前做的工作都是各种工程类的项目，分析需求，寻找技术，完成功能，联调测试，进行维护，不断的循环，虽然也是在不断学习新的技术，但是，实际上，这些项目肯定是能完成的，只是时间投入的问题。并且，项目的结果好坏是有既定的评价标准，比如通过联调测试，用户反馈等。
- 而科研的工作，是为了去回答一个前人没有回答过问题，不管是问题的提出，问题的解决方法，结果的评价方法，都有可能是全新的，此时，去寻找解决问题的方法，去寻找问题的答案已经比较困难，有可能找不到问题的答案，而在得到一个答案之后，怎么去评价它有时候可能会更难，这些都是和工程项目不一样的地方。
- 在了解了以上的区别之后，我觉得最大的收获是，工程项目让人躺在舒适区里，而科研项目让人怀疑人生，痛并快乐。自己给自己打一针预防针，进入新的科研工作就没那么恐怖了。

拿替代力指数的工作当例子

这是邓老师的回答：

为什么会提出这个问题？
因为引用某篇文献的后代会引用这篇文献的祖先，也许祖先对后代的贡献更大呢，因此，仅仅从被引数量来衡量文献的创新性，有失偏颇。一篇文献在引文网络中的作用是什么，它是否是不可替代的？如果仅从被引数量来衡量，那进入引文网络的文献都不可替代。但实际上，很多文献的后代，不仅仅引用了父亲，还引用了各个层级的祖先。如果扣除了祖先对后代的影响，文献对后代的实际影响是怎么样的，在引文网络中它的不可替代性会有怎样的变化？
如何提出的这个问题？
在前人的基础上提出该问题，前人研究了文献扣除父亲对后代的影响后的情况，我们更进一步，把所有祖先对后代的影响全部扣除。
这个问题确实还没有解决吗，没有人研究过或者说没有人用这种方法研究过吗？
考虑所有祖先对文献后代的影响暂时没有人研究过。
这个问题可能的答案是什么，如果我们得到了某个答案，对于整个学科甚至整个科学和技术来说，意味着什么？
最可能的答案，扣除掉所有祖先的对后代的影响，文献的不可替代性会下降，某些文献甚至可能会出现反转，比如某些高被引文献的实际不可替代性很低，并且这些高被引文献实际上是灌水之作，如果真的是这样的话，那对文献特别是高被引文献的创新性的评估就需要采用和以前不一样的方法，也就是不能仅仅采用被引数量，还要考虑扣除祖先对后代的影响。也许可以发展出一种方法来识别真正有创新性的文章和灌水的文章。
这个问题的解决大概需要什么知识和技能的基础，尤其要识别出来其中最关键的那一步，我从中能够学会什么？
主要是在数据集上对大型稀疏矩阵进行求逆操作，还有后续的数据分析可视化。大型稀疏矩阵的求逆操作通常转化成求解方程组问题，采用迭代法来完成。评价方面，可以选择公认的好文章和灌水文章来检验我们定义的替代力指数，好文章可以用诺奖和里程碑，而灌水文章也许可以把追热点的文章拿来试一下。
这个工作提出了新问题，发展了新方法、得到了新结论、提供了新案例新应用场景？
是一种新的评估文章创新性的方法。
这个问题以及现在的解决方式和答案，还有什么需要继续改进的，还可以怎样进一步发展和迁移？
- 如果在诺奖，里程碑文章上与实际符合较好，那在另一端，灌水文章上是否也符合较好，怎么识别灌水文章呢，需要其它的证据。
- 可否迁移到其它知识网络，比如github的引用网络，来检验代码的创新性。（非常值得做，尤其是，可以考虑一个大项目，例如Linux操作系统，中各个程序的相对地位的问题）
我从中学会了什么，学会的东西可以如何帮助我成为一个研究者？
- 不能迷失在技术的深渊里，当某些技术无法解决问题时，需要考虑其它更合适的技术，比如求解线性方程组的scipy，petsc。
- 在整个研究的过程中，一定要挂一盏灯在头上，就是，我要解决的问题是什么，我做的事情和我要解决的问题有关联吗？

拿概率条件下决策影响因素的工作当例子

天笑回答。以下是天笑的回答。

Q1：为什么会提出这个问题？如何提出的这个问题？

A1：在研究决策影响因素时，考虑个人风险态度可能是因素之一，因此需要引发个人风险态度的方法。通过文献阅读发现常用的引发风险偏好的“十项决定”已经成为很成熟的引发技术了，于是直接拿来使用。在使用的过程中发现，该量表提供的两项风险资产对比，既有均值的变化，又有方差的变化。效用函数框架下，风险资产的效用函数可以分解为各阶矩的函数（各阶矩被称为数字特征的原因）。那么从数学上，我们形式上就可以用包含均值（一阶矩）、方差（二阶矩）、偏度（三阶矩）、峰度（四阶矩）以及更高阶矩的函数来描述一项风险资产，作为风险资产的效用函数。显然，均值和方差一定在效用函数之中。那么，我们需要知道实际上人们的效用函数是否包含更高阶矩，即人们是否可以感知到各阶风险的变化呢？更高阶矩是否在决策过程中其作用呢？

如果人们不能识别高阶风险，那么效用函数就完全由均值和方差来刻画。
如果人们能够识别更高阶的风险，即对待更高阶的风险有不同的态度，反映在实验上，就是有不同的风险资产选择倾向，那么在测量人们的风险态度时，就要考量高阶风险的影响。
更进一步，我们需要考察有哪些高阶风险被包含在效用函数之中，以便进一步完善效用函数构建。举例来说，比如人们对于5阶以上的风险不识别，那么效用函数就只需要包含前四阶矩；再如人们只识别奇数的高阶风险，不识别偶数的高阶风险，那么效用函数就应该包含均值、方差以及之后所有奇数阶矩。即我们需要知道实际上哪些高阶矩进入效用函数之中。

技术上，我们可以保持其他阶数不变，只有被考察阶数不同的情况来构建实验需要的风险资产，通过风险资产之间的对比考察的该阶风险是否被识别。

总的来说，是因为我们需要引发被试的风险偏好，使用作为引发风险偏好的标准量表——“十项决定”量表时，逐渐深入了解发现，其并不能满足更精确的描述人们的风险偏好的要求，所以我们将研究的目光从前述工作转向了风险态度，尤其是高阶风险态度的测量。

Q2：这个问题确实还没有解决吗，没有人研究过或者说没有人用这种方法研究过吗？

A2：通过文献调研发现，对于高阶风险态度的研究主要集中在金融和实验经济学领域，金融领域中对三阶风险——偏度的研究比较早，在效用函数框架下，经济学家和金融学家天然的需要研究效用函数各阶导数的现实意义。他们将三阶风险厌恶称为“下行风险厌恶”，用效用函数三阶导数的凹凸性来解释了人们在预防性储蓄时的经济行为。在金融领域的资产定价和资产组合中起到了重要的作用。2006年，Eeckhoudt 和 Schlesinger脱离了期望效用框架，将高阶风险态度和特定的“彩票对”的选择偏好联系在一起，使得高阶风险态度的直接测量成为可能。一些实验经济学家通过设定两个只有某一阶数不同，其他阶数都相同的两张彩票的对比实验，来引发人们的高阶风险偏好。这种方法正是本工作使用的方法。其理论依据是将高阶风险拆解成低阶风险的组合。

通过阅读文献我们发现，大多数研究者使用的“彩票对”，存在两个问题：
每个彩票的或有收益对应的概率不同，并且随着需要考察阶数的升高，或有收益的概率之间的差异越来越大。通过其理论基础——期望效用理论发展而来的前景理论我们知道，人们不仅会将或有收益看作主观收益，还会将其对应的概率看作主观概率（一个事实是，人们会夸大小概率事件的结果，举例：颤抖的手），那么我们考虑能不能将考察时的彩票的或有收益设置成等概率的，以便排除主观概率的影响。
另一个问题是，以三阶偏度为例，研究者选取的彩票对的偏度值都偏大，这样有助于使用小样本产生更明显的结果，但明显没有均匀的覆盖全部偏度值的取值范围，我们能不能通过彩票设定，使三阶偏度值在其取值范围内全都考察到？
针对以上两个问题，仍以三阶偏度为例，我们构建的彩票对需要三个等概率的或有收益，并且保证均值、方差都相同、偏度值正好是设定的相反值，比如±0.1，±0.2等。三个未知数（三项或有收益），三个约束条件构成方程（均值、方差、偏度），理论上存在非零解，因此我们可以解出需要的彩票的或有收益。

上述工作我们通过文献调研，并没有发现有研究者做过。高阶风险的经济学实验部分仍处在刚起步的阶段。

Q3：这个问题可能的答案是什么，如果我们得到了某个答案，对于整个学科甚至整个科学和技术来说，意味着什么？

A3：首先，我们需要在实验上证明我们对实验的改变是否影响被试的选择。如果仅仅是将或有收益的概率变为等概率的，就会改变实验结果，那么说明通过彩票对这种方法引发高阶风险根本没有稳定性可言。使用类似技术的高阶风险结论都将存疑。
如果我们将概率变为等概率，不影响主流结论，那么就说明我们带来的改变是无害的，我们的结果是可以和其他研究者进行对比的。
此时我们再将目光关注在其他研究者不曾关注的小偏度值之上，考察三阶偏度在小偏度值的时候，结果是否和大偏度值的一样。

总而言之，我们的结论将取决于我们对该实验带来的改变是否影响实验结果。通过只改变其中一个点来层层递进，如果直至最后，我们的结果和主流结果仍相同，那么至少我们完全研究了该阶风险的情况，证明了结果的稳定性。

Q4：这个问题的解决大概需要什么知识和技能的基础，尤其要识别出来其中最关键的那一步，我从中能够学会什么？

A4：需要的知识储备主要包括，理解效用函数框架所需的基础——期望效用理论及其发展，理解主观收益、主观概率，进而理解我们为什么要在构建彩票对时控制或有收益的概率都是相同的；经济学中效用函数函数的各阶导数，对应的数学上的各阶矩，明白为什么数字特征可以描述一个随机变量，从而理解我们可以使用包含各阶矩在内的效用函数描述人们的选择行为；高阶风险彩票对的构建，将高阶风险看作两个低阶风险的组合；解方程的技术——用来计算我们需要考察的彩票对；关键之处在于，通过控制变量，一步步将彩票对的设计演化为我们需要的格式，而其中一旦结论发生变化，那么彩票对引发高阶风险这一手段的稳定性就将存疑。

Q5：这个工作提出了新问题，发展了新方法、得到了新结论、提供了新案例新应用场景？

A5：最终这个工作完善了原有结论，证明了结果的稳定性。这部分工作主要研究三阶风险偏度，证明了被试倾向于选择“谨慎”的风险资产。

Q6：这个问题以及现在的解决方式和答案，还有什么需要继续改进的，还可以怎样进一步发展和迁移？

A6：关于引发风险偏好，乃至于引发高阶风险偏好，“彩票对”的方式提供了两个不同的风险资产进行对比，通过被试的选择行为考察高阶风险的作用。其实还有其他方式考察人们对不同风险资产的定价，比如发现确定性等价。在本工作中，我们并没有采用发现确定性等价的方法让被试给我们设计的每一个彩票“定价”，这可以来进行交叉验证实验结果，我们没采用确定性等价这个方法的原因是，没有彩票直接对比直观明显，需要被试有良好的计算能力。

目前我们只完成了三阶风险偏度的实验，在整个工作框架下，可以继续向更高阶风险推进，直至人们对于某一阶风险及其之后的更高阶风险不再识别，那么我们所构建的用于描述人们风险偏好选择行为的效用函数，就包含那些我们发现有用的那些阶数的风险。另外还可以使用其他方法，如确定性等价来和本结果交叉验证，证明高阶风险在不同引发方法下仍起作用。

Q7：我从中学会了什么，学会的东西可以如何帮助我成为一个研究者？可以从学科大图景的角度来思考，从知识和技能的角度来思考。

A7：这项工作在发现问题上，使我亲身体会到了在应用别人的成果时，并不能完全满足我们的需求，为此我们提出问题，从别人的工作中进一步发展。在实验设计上，主要是需要层层推进，一步步将我们的设定和改变加在原始设定之上。同样，这项工作我陷入技术细节陷入的更深，既想干这个，又想干那个，最终我是通过紧紧围绕核心问题，一步步消减冗余来走出泥潭的，比如完全舍弃了预实验与彩票直接对比同时使用的确定性等价这个方法。“抬头看路，低头向前”还是做的不好，知道和运用是有距离的，话说的好听，但学到的唯一教训就是人们不会从历史吸取任何教训。

拿最后通牒和概率理解的关系的工作当例子

下面是天笑的回答。

Q1：为什么会提出这个问题？如何提出的这个问题？

A1：从大的方面来说，可以帮助我们回答为什么要提出这个问题。

研究人们是如何做出决策的，始终是经济学、心理学等社会科学的核心问题。科学家们研究的目的有二：解释和预测。对于已经发生的行为，通过构建模型来解释人们在相应条件下为什么做出这样的决策，并外在表现为观察到的行为；更进一步，构建的描述人们决策的模型需要在相同条件或是不同条件下，预测人们会做出什么样的决策，产生什么样的行为。

决策问题是一个很庞大的问题，我们的关注点需要集中，这可以帮助我们回答如何提出这个问题。

在从我们关注的经济决策方面来说，博弈论为我们提供了很多研究框架，比如囚徒困境、公共品博弈、最后通牒博弈等博弈形式。本工作中，在这些前人的基础上，我们关注最后通牒博弈，试图找出最后通牒博弈框架下影响人们决策的因素。通过文献我们了解到，前人提出了各种影响决策的因素，包含公平、利他、信誉、文化、语境、性别、年龄、情绪、生理指标等等因素皆能影响最后通牒框架下人们的决策。在文献整理中，我们不乏看到通过实验设计来排除其他因素的影响，专注研究某一因素的思路经常出现在各文章中。因此，我们可以通过集中关注最后通牒博弈框架下人们的经济决策来缩小研究范围，通过构造实验排除其他因素影响，专注于我们需要考察的因素之上。

Q2：这个问题确实还没有解决吗，没有人研究过或者说没有人用这种方法研究过吗？

A2：考察这个问题是否被解决了，就需要考察构建出来的人类决策模型是不是能解释现有实验结果，并预测一定条件下人们的决策行为。

在最后通牒博弈中，即使我们排除了目前研究的影响因素，仍距离理论结果有着显著的差异。这代表着一定还有其他因素在人们决策过程中起作用，并进一步通过行为表现出来。

本工作的研究方法并不新颖，主要目的是试图继续深挖最后通牒博弈理论与实验之间的显著差异，试图在前人的探索上更进一步。

Q3：这个问题可能的答案是什么，如果我们得到了某个答案，对于整个学科甚至整个科学和技术来说，意味着什么？

A3：我们主要考察的是对概率的理解和被试的风险偏好是否是最后通牒博弈中的影响因素，更进一步，将已经发现的影响因素包含在一起，是否能使理论预测与实验结果相一致。

如果上面两点都达成了，那么我们就能够构建包含所有影响决策因素在内的模型，来描述人们的经济行为就更进一步了（至少在最后通牒博弈框架下）。

如果我们提出的印象因素确实在决策中起作用，但最终还是和理论值有显著差距，那么就说明除了前人提出的因素和我们提出的因素之外，人们的决策模型还包含其他我们目前未知的影响因素。此时我们至少距离完全描述决策行为更近了一步。

一旦我们提出的新影响因素被证实在决策过程中起作用，尤其是概率理解，这意味着其他框架下也需要考察这个因素是否影响人们决策，这个因素是否普遍适应各种决策框架。

如果我们提出的因素在决策过程中不起作用，在确定我们设计的实验没有问题的情况下，在各种努力尝试都改变不了结果的情况下，至少我们排除了两个影响决策因素的错误答案。至少个人风险偏好不影响最后通牒博弈框架某种条件下的个人决策，也是挺反直觉的一个结果。我们接受这个事实，总结经验教训，科研是未知答案的，甚至很多时候是未知问题的。

Q4：这个问题的解决大概需要什么知识和技能的基础，尤其要识别出来其中最关键的那一步，我从中能够学会什么？

A4：这个问题解决需要一些博弈论相关的知识，理解最后通牒博弈实验的结果和理论预测不一致冲击了经济学基本假设——理性人假设；另一方面需要博弈实验相关的知识，理解为了回答问题而设计实验，而不是反过来。需要的技能主要是依据目的设计实验的能力。在本工作中，最关键的一步是将被试的决策过程进一步分解，看作是先估计行为，再做出反应，而其中对概率的理解影响了人们做出反应这一部分。我们设计实验时，通过约束估计行为来考察我们提出的影响因素。

通过本工作，我学到了实验是为了某种目的设计的。在平时的课堂中，我们都是先接触囚徒困境、最后通牒博弈、公共品博弈、独裁者博弈等各种实验格式，更有甚者，比如最后通牒博弈，已然工具化成了引发公平的实验工具，广泛应用在各种经济学、心理学、社会科学场景中。而如果我们仔细阅读提出他们的原始文章，就能看出他们是出于何种目的构建出来的这个实验格式。更重要的是构建他们的思想，而非这些实验格式本身。

Q5：这个工作提出了新问题，发展了新方法、得到了新结论、提供了新案例新应用场景？

A5：这个工作得到了新结论，概率理解确实是最后通牒博弈框架下决策影响因素之一（同时风险偏好也是），但加入新的因素，仍不能完全抹平理论预测与实验结果的差异。
这提示我们两点：1、继续深挖。我们在解释决策问题上前进了一步，但仍存在其他我们未知的因素影响着决策过程；2、横向考察。在其他框架下，可能应该考虑概率理解因素是否起作用。

Q6：这个问题以及现在的解决方式和答案，还有什么需要继续改进的，还可以怎样进一步发展和迁移？

A6：这个问题现在的解决方式是“剥洋葱”式的，将对手替换成机器解决对手是人对提议者的影响，比如利他公平等，将机器的响应模式和概率直接展示给提议者解决提议者估计响应者行为这一学习过程。通过一步步去除其他因素，改变实验设计适应新的需求，控制变量得到答案的。我们还需要将我们找到的影响因素还原到最初的最后通牒博弈中，比如设计实验，在进行真实最后通牒博弈之前，先测试概率理解，看看那些未通过概率匹配测试的提议者，是不是真的分给响应者更多。除了最后通牒博弈框架，我们将眼光放远，概率理解在其他博弈框架是不是也是影响因素之一？

Q7：我从中学会了什么，学会的东西可以如何帮助我成为一个研究者？可以从学科大图景的角度来思考，从知识和技能的角度来思考。

A7：从帮助我成为一个研究者角度，除了为了回答问题设计实验之外，在具体工作中一定要保持“抬头看路，低头向前”。推进工作时，考虑太多会扰乱你的思路，尤其是经济学实验方面，你没办法完全预测被试的行为，所以不必要求自己一下子拿出完美的实验设计，通过预实验及其结果不断调整完善实验设计，会使整个研究过程更平滑。另外在研究过程中，当纠结于实验程序，陷入技术细节的时候，不妨抬头看看整个框架，保持核心问题，舍弃细枝末节，会帮助你走得更远。

拿量子输运的工作当例子

吴金闪回答

批判四大发明就被停课，来我来举报我自己

今天看到有电子科技大学的老师，由于在学生群里面批判四大发明（没有真的形成生产力，也不见得领先），被学校停课，按照师德问题（唯一算得上师德问题的也就是把学生踢出群限制其提出反对意见这一条了。批判四大发明，而且有自己批判的理由，怎么成了师德问题？）处理。

现在，我来举报我自己。不仅对于四大发明我有疑问，对于中国为什么没有科学，我有更加深刻的批判。来吧，来停我的课吧。希望全中国有良知、独立思考能力、懂科学客观讲道理的老师，都来举报一下自己，都被停课吧。

首先，回到具体的四大发明的问题。造纸还比较可靠。直接用植物或者动物的一部分来当做书写的材料，例如羊皮、竹子、木头、石头、金属容器、树叶、压实的草杆，早就有。蔡伦纸不同的地方在于其把原材料中的纤维提取出来，然后重新帮助其凝聚成纸。这是一个很大的进步。不过，如果没有思想和知识来写在纸上，从而提高这个社会的生产力（科学）、思想性（思想解放、自由）、组织方式（社会制度），则纸基本上也就是用来擦屁股的。而非常神奇的是，后面这些在中国基本上都没有配合跟上。于是，我们的造纸术也没有使得我们的科学发展得比别人早。不过，无论如何，我们可以宣称，中国首先发明了纤维先打碎后凝聚这样的方式的造纸术（不一定是蔡伦第一个发明的，不过，算成中国人大概没错）。

火药看起来也还算相对可靠，是我们先从炼丹中偶然得之的。不过，后来我们就用它做了烟花。我不知道后来是不是也是中国人最早改进一下火药然后用来炸山洞（采石头、修桥铺路），但是，真正运用火药的枪炮肯定不是中国人先发明的。中国人也没有从火药发展出来化学纯的配方，以至于元素为基础的化学，更加没有从元素化学走向回答为什么这样的元素和化合物具有这样的性质的物理学。因此，无论从科学、技术、社会生活的角度，中国人对于火药，基本上只能宣称一个最先偶然发现，或者最多偶然发明。

至于活字印刷和指南针，就确实比较有问题了，尤其是指南针。活字印刷这个想法应该不难。有人就认为是受刻印章的启发。难度在于维持所有的活字在一个平面才能印刷，在于保证每一个活字比较牢固耐用。因此，如果想把活字印刷推广开来，其实是一个技术标准的问题（真正让活字印刷打败雕版的是很多年以后的Gutenberg）。也正是由于这个原因，实际上，从这个活字印刷的想法被提出来和初步实现之后很多年，我们中国流行的印刷方式仍然是雕版印刷。因此，我们仅仅能够宣称中国发明了活字印刷的这个想法，做了初步的实验实现。但是，鉴于这个想法相当普通，我们也就能够真的宣称，只不过首先实现了“活字印刷”的实验室原型。当然，这个已经是不错的成就了。指南针一方面没有在中国流行起来，发挥作用，另一方面，甚至实物证据也没有。其可靠性可能都比不上沈括说的那个细线悬挂一个小磁针。我们现在看到的司南的图片从哪里来的呢？有一个叫做王振铎的近代学者按照历史上只言片语的记载复原出来的。后来，现代科学重新再一次来企图复现的时候，发现，对于大多数自然磁性材料，地球磁场的作用都不足克服以勺子底部的摩擦力，所以不准。改用人工磁化材料是可以的。因此，对于司南，大概，我们只能宣称，中国人发现了磁性材料。

小结一下，我们发现，造纸确实可以看做中国人发明的，不过没怎么推动中国的文明的发展；火药也可以认为是我们偶然发现的，不过无论技术和社会的的角度，对中国的发展的贡献都非常有限；活字印刷我们基本上就是一个实验室原型机，没有推广开来的条件和技术；司南基本上是意淫，不过可以大概宣称我们先发现了磁性材料。这就是我们一直在自嗨的四大发明的大概的情况。

这四样东西当然对于人类文明的发展非常重要，各个国家也肯定在其发展的过程中做出了不同程度的贡献，但是，你要宣称都是中国人首先发明的，呵呵。其实，第一次提出来这个说法的不过就是一个搞科学史研究的李约瑟。当时，抗战时期确实需要民族自豪感，要不然，都快亡国了。钱穆的中国通史基本上收集和中国历史上的伟人和伟业，而特意忽略很多开倒车的人，也是这个目的和历史背景。可是，在今天，仍然要把我们的民族自豪感建立在这样的东西之上，就是悲哀，就是自欺自人。

当然，我不反对一定程度上，这四大发明进入教材：当做讨论和争论的对象，而不是当做圣经。

另外，你以为只有四大发明是这样吗？勾股定理、地动仪以及很多其他的被认为是中国人第一次提出来的也是如此。中国的数学的典型论著方式是：“勾三股四弦五”，也就是告诉你，如果一条边是3，一条边是4，则直角三角形的斜边是5。不要问我怎么来的，也不要问我万一不是3和4的时候，斜边是多少。当然，以案例为基本论述方式也有其自身的好处（可以看看吴文俊在这方面的论述）。但是，数学是有体系的科学：从一些最基本的假设和定义开始，构建整个数学的概念大厦，构建的主要方式是逻辑论证和计算（其本身也可以看做是逻辑论证）。至于地动仪这东西，现在，我们在地球表面设立了大量的震动记录站都做不到，更何况当时的科技水平（有人说，可能地球上之前有文明，那有相关证据的时候再说，目前，我们假设一代代的研究者是在正面推动科学的发展，而不是藏起来和阻碍）。你想想，国家和民族的自豪感，能够以这样的东西为基础？

当然，我也一定程度上同意把勾股定理的故事放入教材，但是，是供讨论的材料。一方面，确实我们发现了例子，另一方面，证明和系统化确实是另一个问题。

接着，回到我要举报我自己的地方：不仅仅在这些技术发明上，我用批判性思维和我的科学知识来做批判性的思考和认知，甚至对于更加基本的中国人在科学认知上的国民性的问题，我持有更加批判性的意见。来呀，来北京师范大学停我（吴金闪）的课啊。

真正的值得思考的问题或者说悲哀，在于，为什么，在中国历史上，一直没有发展出来数学、科学（支离破碎的一个个的技术不算，有系统的技术、追问为什么并且有模型世界的才算）和哲学（哲理不算、政治伦理经验总结不算，有系统的哲理和有系统的政治伦理才算）。

这个问题很深刻，但是我认为其答案一点也不复杂：由于中国人一直太穷苦了，导致我们的大众和绝大多数精英从来不关心吃饱饭之外的问题，也就是没有抽象思维；同样由于中国人一直太穷苦，中国文化把农业（保证有饭吃）和官僚（原则上，是为了帮助其他人更有饭吃，或者说自己吃更好的饭）当做了最高地位的东西，从而鄙视奇技淫巧，也就抑制了技术和科学的发展；同时，中国文化没有实证性思维，一个模模糊糊说得过去甚至逻辑上同时包含了命题和否命题的阴阳五行学说就统治了中国的世界观和科学。

回到现在科学的发展。

首先，古希腊的传统使得对没有实际意义和作用的问题的追问保留了下来。例如，物质到底不断地分下去会是什么，宇宙到底从哪里来，我能够在辩论上战胜你到底是因为我聪明嘴皮子厉害还是逻辑和事实，你如果要学习一个东西到底我是应该灌输给你还是帮你自己认识到，等等等等。这些问题（关于世界本源、批判性思维、逻辑）没有一个是帮助解决吃饭问题的。可是你看，泰勒斯、德谟克利特、苏格拉底、帕拉图、亚里士多德，等等，都是在追问这样的问题。其中，亚里士多德值得单独提一下：其第一次把物理学（自然科学）从哲学（那时候不分家，任何思考都算哲学）分出来，成为关注世界怎么回事的一个学科。顺便，这个批判性思维的传统到了后来的笛卡尔的手上，就被明确地提出来，并且在实际数学研究中运用了。

其次，欧几里得在人类文明史上有特殊的地位，其建立起来的从很少的定义和公理出发，通过逻辑论证，来构建整个几何学（甚至整个科学和数学）的方式，我这里称之为系统性思维，是迄今为止，人类构建科学理论思维典范。

接着，伽利略使得这些科学从这些思辨的层面，走向了实验、实验和思辨对比的层面。说，你想看看是不是不推就不走了，那么，咱们就把你放到冰面以及其他光滑程度不同的面上试试，并且做好时间和距离的测量。在这里，实验主要起到检验的作用。

最后，终于差不多到了第谷、开普勒、牛顿出来转一圈的时候了。在第谷的大量的准确的天体观测数据的基础上，开普勒用数学发现了运动规律，而牛顿呢把天体运动和地面上的运动联系起来从而建立了运动定律（把物体的运动用位置和时间来描述，并且联系着一个叫做力的东西，是一个心智模型）和万有引力定律（把天体看做是靠引力相互联系在一起的，是一个心智模型），并且为了这个目的发展了数学（微积分）。之后，很快基于这些模型得到的进一步结论得到了验证。这才形成了现代科学的体系。在这里，实验数据除了检验模型还起到了启发模型的作用。同时，数学和模型（往往表现为数学结构和物理概念）、数学计算和论证开始成为科学的基本语言。

因此，对于现代科学的发展来说，关注抽象的不解决吃饭问题的问题、依靠数学的证明和计算来思考、运用数学来建立世界如何运转的的模型并且依靠实验数据来启发和检验模型、批判性思维、系统化思维，这是非常重要的。

现在，再一次回到中国的科学、技术、思想，除了当官和为人处世的经验总结，优美的诗词歌赋，少量没有系统性的支离破碎的数学结论、不太少的技术，我们有什么？有对基本问题的追问吗？有批判性思维吗？有系统性的数学吗？有从技术变成模型，变成系统性的模型吗？有用实验来检验一下这些模型的想法吗？

如果不能直面我们的问题，把头埋在沙堆里，我们如何取得真正的进步？

这个帖子在微信公众号“为了理解而教和学”被举报了，说，这是在挖祖坟、灭自己威风（民族自豪感），只要是祖坟和国家民族的自豪感，就不应该挖。这是什么逻辑？只有直面自己的问题，才能取得更大的进步。如果我的祖坟里面藏着汪精卫和汪精卫的精神、吸血鬼或者某种将来可能阻碍社会发展的病毒，请大家帮我一起挖掉它！另外，前半部分关于四大发明的是在目前能够找到的材料上的总结，没有任何东西是我自己的。没有补充参考文献，就多多迁就了。没写成任何论文的打算。我本身是搞科学的，不是科技史，也不是哲学。但是，从对比中，看到为什么中国没有科学，挖一挖自己的祖坟，还是能够完成的。

关于为了维持民族和国家自豪感就不应该挖自己祖坟的评论，我在回复里面举了一个例子，也分享在这里。有一个家出了一个特别能够赚钱的女儿。并且由此全家人在村里的地位和声誉都特别高，甚至这个村也由于这个家在所在的地区地位和声誉特别高。现在，这个家的自己人和其他人都（有证据地）发现，其实是因为这个女儿出卖色相得来的。现在，这个家的其他人和这个村的其他人，都说为了维持家和村的自豪感，不能把这个真想公布出来。你看看，这是什么逻辑？这样能够培养出来真正值得这个家和这个村自豪的人出来吗？中国的国家自豪感如果建立在这样的东西之上，还真的可悲。顺便，我不鄙视靠色相赚钱啊，这里只用来举例。可以改成贩毒、黑社会等等其他没有这个隐藏性这么好的例子。

回到这个帖子的主要结论：在四大发明上，中国人起到了启发性的作用，应该是还算客观的，尤其是火药和造纸。但是，说这启发性作用就表示这四大发明属于中国，或者说，在中国取到了很大的作用，就非常勉强了。既然在已经很早就启发了的地方（发源地）都没有在技术上发扬光大，在科学上促进现代科学的发展，我们如何好意思说，四大发明在世界的发扬光大，也是我们促进的呢？不过，再一次强调，这个结论本身是否认同不是最重要的，最重要的事情是，是否允许质疑和讨论这个结论，质疑可讨论这个结论为什么就成了师德问题！

顺便，这个帖子的关于四大发明的前半部分，基本上是我整理的前人的话，基本没有我自己发明的说法或者提供的证据。至于参考文献，我也不是这个专业的，也没想过写成论文，就暂时允许我不列出来了。要回头去找起来还挺麻烦的。我自己要说的话在关于现代科学的第二部分，没有批判性思维、没有系统性思维、没有实验和测量的启发和检验、没有用数学来计算和建立抽象模型，就没有科学；而且这些东西在中国古代固然没有，现代中国也不见得很多人就有。

你看，我对中国人的批判可不仅仅在古代中国，也不仅仅在四大发明，甚至涉及了现代中国，以及中国对整个人类的科学、数学、哲学的贡献这个层面。我举报我自己，要不要来停我的课啊！

光是粒子又如何，光是波又如何？

之前我们讨论了能够在很大程度上说明光是粒子的实验：光电效应为什么能够证明光的粒子性。那当然，也有大量的实验佐证光是波——把光看作是介质上的振动，然后依赖介质上的Newton力学来理解光的行为。那么，为什么光不能就是这样的东西：在解释不同的实验的时候用不同的模型呢？这样有什么不可以呢？

首先，有其他实验可以很大程度上证明光的传播不需要介质。例如Michelson-Morley实验（请自行Wikipedia之）证明如果有介质并且这个介质的运动速度通过伽利略变换进入光的传播速度的话，那么，实验结果和理论结果不符合。再例如，有实验证明光是可以在真空中传播的：你想确认一下这个事实的话，只要看一下天空，看到太阳月亮星星就是这个证明——你想中间有多少什么都没有的路光要走啊。当然，你仍然可以怀疑说，这个看起来测量起来什么粒子都没有的“真空”其实不是真空，还是有某种介质的。于是，你就可以设计一个情景来让这个“介质”有自身的速度，这时候，再来测量光的行为，就回到了Michelson-Morley实验。因此，Michelson-Morley实验很大程度上说明：光的传播不需要介质，如果有介质则这个介质很神奇——其自身运动的速度不怎么影响光的传播。

既然没有介质，那么，把光看作介质上的振动，并且这个振动的传播符合Newton定律就不太行了，那怎么来建立光的心智模型？

接着，我们回顾一下那些启发了光的经典介质波的模型的实验。例如，光的折射和反射。声波、水波都会出现折射和反射，也就是一个振动传过来遇到了界面，界面上的介质会被这个传过来的振动激发，由于是不同的介质，这个受激发的振动可能会被传播到其他方向上去。如果是同一种介质，其实也会发生这个受激发振动的事情，只不过，那个时候，跑向各个方向的受激发振动刚好相互抵消。而当存在不同介质的界面的时候，某些方向上的振动会被加强而不是相互抵消。这个把介质上的多个粒子受激发振动看作新的波源然后做叠加的做法叫做惠更斯－菲涅耳原理（其本质还是波的Newton力学），或者去看看Feynman的《QED：光和物质的奇妙理论》。当然，其实，光的折射和反射也可以用直线传播的小球和半透膜的模型来解释：把光看作小球，每次遇到半透膜（开了很多小孔的筛子？）就有可能被弹回，也有可能透过。这个称作光的随机性粒子模型（有的时候也被称作几率波粒子模型）。

那我们再来看光的干涉和衍射。衍射现象是指，在光的传播路径上，有障碍物，可是，你仍然在障碍物的后续路径上观察到了光。如果光是直线传播的小球，就不太可能有这个现象了。而波的惠更斯－菲涅耳原理就可以解释这个现象，在此略过这个解释。光的干涉现象是指来自于两个振动源的光在同时能够达到的区域会出现暗条纹和明条纹。暗条纹的意思是，对于打开任何一个光源就能够照亮的区域，当同时打开两个光源的时候，反而不变暗。当然，这个时候，对光源有一定的要求。但是，这件事情用光的粒子模型是很不可理解的：你在玩植物大战僵尸的豌豆射手或者用机枪打仗，发现，有一个地方用一个豌豆射手或者一个机枪手都可以打到，但是，当你放上两个豌豆射手或者两个机枪手的时候，就打不到了。这是不可能的事情。如果是这样，就没有火力覆盖了。

那么，把光看作是介质上的振动是怎么来理解光的干涉的呢？说一个光源传过来的振动和另一个光源传过来的振动可能在振幅上不匹配，例如一个是振动最低点也就是波谷的时候，另一个正好传过来一个振动最高点也就是波峰，正好这两个振动的矢量叠加相互抵消，于是，没有照亮。这个解释非常漂亮。

那问题来了，到底我们应该把光看作是粒子还是满足Newton定律的介质上的振动波呢？我们能不能在讨论某些实验例如折射反射光电效应的时候，把光看做粒子（当然，这时候，我们也要问这个粒子是不是满足粒子的Newton定律。问题留在这里，以后再说），而在讨论折射反射衍射干涉的时候，把光看作是满足Newton定律的介质上的振动波呢？万一遇到新的现象怎么办，用什么方式来描述？或者每次都先试试用两个理论之一的结果和实验比较一下，对上了，对这个现象就用这个理论？

第一、科学的目标是希望对于给定的现象，我们的理论模型能够给出来一个结果的预期，然后和实验相比较。因此，每次来凑一凑试一试显然是不行的。如果能够对现象做一个完善的分类，遇到现象就知道用哪一个模型，倒是也可以接受。不过，这个分类，在光这个现象上，我没有见过。

第二，科学的原则有一条，希望用更少的并且相互不冲突的更具有一致性的理论来解释更多的现象。因此，用两条看起来相互冲突的理论来解释同一种东西的不同的现象是不够的，就算上面提到的完善的分类存在的话。而且，将来，我们会看到，有一个光的新的理论，它能够同时解释上面所有的现象。

顺便，我们怎么知道是同一种东西呢？只要我们做实验的时候产生光的机制是一样的，然后用来做以上两类实验就可以。另外，在这里，我特意扔掉了光的波的模型，而用更加复杂的“满足Newton定律的介质上的振动波”的模型。将来我们会知道新的模型还是一个光的波的模型，只不过不符合Newton定律，而且是振幅波，而不是几率波。后面为了语言的简单，我把这个“满足Newton定律的介质上的振动波”的模型简称为经典波模型。

那么，到底怎么办？什么样的模型可以即具有粒子性，也就是确实是一颗一颗打过来的，不会再一次把能量分离成为某个最小单位以下的，强度增加就意味着增加粒子数量的，这样的粒子，还具有波性，也就是可以发生干涉和衍射的这样的波？

再一次提醒注意这个干涉的不可思议性：如果我们用一颗一颗粒子来解释的话，就意味着有一个地方打开两个粒子源中的任意一个粒子源的时候粒子能够到达，但是同时打开粒子却不能达到。

更进一步，这个实验还可以这样做：保证在整个实验中每次仅有一个粒子，也就是一份能量，在整个实验环境中。具体的做法大概来说是这样，制备一个单光子光源，在这个光子的光路上放上分光的仪器使得这个光子可能走两条路中的一条——例如放置一个双缝或者一个偏振分束器。

这样来做，这个实验结果就更加不可思议了：空间中每次只有一个粒子，如果说不能到达某个一条路就能到达的点，也就是说，好像这两条路上的光子影响了彼此，可是，真的仅仅有一个光子啊，自己和自己是怎么影响怎么抵消的呢？回到波的模型，可以把波看作是振动分成几个部分传播到不同的路径上，将来再一次合起来，自然就可以相互抵消。可是，光子不能再一次分成更小的能量单位啊！

注意，把光看作几率波的模型也不能解释这个单光子干涉现象：要么走路径1，能够到达；要么走路径2，还是能够到达，则合起来就是能够到达，绝对不会出现不能到达的情况，除非路径1和路径2的“几率”是一个矢量，能够想振动幅度一样被加起来。

这里最大的矛盾，或者说将来的出路，就在于：一方面，光子不能分成更小的单位，不能同时走很多条路径，因此不能把不同路径上的“振动幅度”像经典波一样叠加起来；另一方面，在数学上，经典波的把来自于不同路径上的同时传播过来的波相互叠加起来，确实能够描述实验现象。

怎么办？难道我们需要一个在数学上满足“波的叠加”的但是在物理上是一个个不可再分的小球的模型来理解光子的行为？一个个的小球怎么会具有波呢？除了看作概率，就像前面的半透膜，可是概率解释不了干涉，还可以看作波，怎么可能呢？

实际上，光的心智模型正是这样的满足“波的叠加”的小球。有更多的实验会提出来挑战很大程度上说明，只有这样的模型，才能够解释这些实验现象。例如，这几个实验：
能看到光是多么神奇的事情啊
 光过玻璃是一件多么神奇的事情啊
 光过三个偏振片和男人女人过三道门的对比

Feynman说过，只要你能够明白双缝干涉，那么，你就明白了量子力学，并且如果你没有被量子力学苦恼过，那么，你就是不明白量子力学，更有你只要宣称明白了量子力学，那么，你就没有明白。

学习量子力学主要就是为了搞清楚为什么这个理论是这个样子的，理解上的主要困难在哪里，而不是仅仅学会怎么算。就像Feynman在《QED：光和物质的奇妙理论》，《Feynman物理学第三卷》以及吴金闪的《二态系统的量子力学》里面所强调的一样。怎么算，不好意思，你需要至少学习一个理论物理专业的硕士，甚至博士。

具体现象的知识固然有意义，但是，本文最大的目的是跟你一起从具体的科学现象的思考中体会什么是科学，体会量子力学的神奇和困难之处。