关于数学和科学理论与现实的关系以及学习方法的对话

从讨论对某些网络上的几何量的定义开始,我和一个学生做了下面的对话。这个对话不是完全忠实的记录,但是主要的意思没有变。

问了学生这样一个问题:给定一个人的身高数据,并且从中能计算出平均值和均方差,你能告诉我什么?

学生答:我给出一份报告上面写着均值和方差,如果有必要可以给出更高阶矩的值。

问:如果你的老板非常聪明,但是没学过统计学,不了解拿到均值和均方差的含义怎么办?例如你的老板在考虑设计一个梯子,需要最短最长的数据,为了够着一个长度为3m的东西。

答:不知道,还是给均值、方差,以及各阶矩,然后说明一下:均值表示平均身高,方差表示离散程度等等。

问:这是不足以用来做决策的,怎么提升报告和所面对的任务的直接相关性?

答:不知道。

问:举个例子,一把弹簧秤,一块豆腐,经过一套程序(把豆腐挂钩上,然后读数),可以得到一个叫做豆腐重量的东西。如果现在有人来买豆腐,你怎么办?

答:取一块豆腐,称重量,乘以单位重量的价格,然后收相应的钱。

问:为什么以上定义的重量可以这样用?如果我想知道这块豆腐的热量和各种营养成份,怎么办?

答:不知道为什么可以这样用。但是热量和营养成份的计算也是重量乘以相应的单位重量的热量和单位重量营养成分含量百分比。

问:实际上,这里能够用来计算应付款、热量、营养成份,都是因为重量反映了这块豆腐里面物质的量的多少。也就是说,准确理解了定义,以及对这个定义将来有什么用,也就是用在什么样的具体问题中有一个认识,是能能够把“重量”用在以上三个不同地方的原因。并不是因为有人告诉你可以这样用,才用的。具体的应用还有好多其他地方,例如还可以放到“月球”上去压宇宙飞船(这个更深刻,需要理解质量和重量之间的关系,以及造成这个关系的原因)。现在回到身高均值和方差的例子,给老板一个怎样的报告?

答:没有很好地理解重量实际上反映了物质的量,是不能灵活和迁移运用的原因。那么,也就是说,没有很好地理解均值和方差的概念。

问:不仅仅如此,还有不理解整个这两个统计量背后的假设的原因。这个统计者先假设人群的身高符合高斯分布。接着,如果能够从样本均值和样本方差估计真实群体的均值和方差,那么随便遇到一个人,其身高介于均值和左右一个标准差之间的概率是68%,左右三个标准差之间的概率是99%,这时候如何写报告?

答:从样本均值和样本方差计算出群体的真实均值、真实方差,并给出计算结果的置信度,然后报告,99%的人身高介于均值 ± 三个标准差之间,68%的人身高介于均值 ± 一个标准差之间。

问:前后两份报告,差别在哪里?

答:前者仅仅知道均值、方差的定义;后者明白这个统计的基本假以及熟悉高斯分布。这个时候聪明的老板拿到这个报告,就知道,如果需要覆盖大约,例如99%,的人的需求,则梯子的设计长度是多少。

问:什么原因造成这个差别?

答:前者为了学习定义而学习定义,后者思考运算和定义的假设和动机,并思考将来可能的应用。

问:这种差别又时如何造成的?

答:前者为了学习数学而学习数学,为了学习理论而学习理论。后者在深刻理解概念的同时,关心概念提出的动机以及可能的与现实的联系。

总结:也就是说,后者一直企图把理论和定义与现实联系起来(或者间接地通过其他概念与现实相联系),而前者就是简单地记住定义。本质上,后者是科学家——理解定义,思考其与现实的可能联系与检验;前者是被动接受定义,最多了解一下其他人如何使用这个定义。本质差别是:
是否明白科学就是企图找到现实的数学结构;
是否明白科学理论的最终检验标准是现实(实验与实践);
学习的时候是主动地寻找知识之间的联系,知识与现实之间的联系,还是被动接受知识。

对最后一条的补充说明:在上面的例子里面,对均值和方差与高斯分布的联系的理解是深刻认识的基础,从而也是应用与现实的基础;对物质的量的深刻的理解是应用于现实的基础。另外,思考如何与现实相结合的问题,也促进我们对概念本身的理解。因此,我们看到,对知识本身的理解和对把知识联系到现实,这个两个方面是相互促进的。

吴金闪团队各方向研究生培养目标和要求

本研究小组包含非平衡量子统计、博弈论、科学计量学、汉字学习以及更一般的学习和网络科学几个方向。其中科学计量学、汉字学习等实际上是网络科学的思想和方法(主要是网络思想,尽管不限于)在具体问题上的应用。

各个研究方向看起来差别较大,实际上都是在讨论,一个包含多个相互作用个体的整体,如何研究以及这样的系统的共性和特性的典型行为。

无论在哪个方向上,硕士研究生的基本目标是给学生一个机会来尝试科学研究——思考科学问题,面对问题,提出解决方案并实现。在这个过程中学会思考和学习,并且在可能的情况下发展自己的兴趣,找到自己的人生目标。博士研究生的基本目标是深入了解一个领域,在这个领域內提出问题,思考问题,并解决。会学思考、学习和创新——想他人没想过的问题、解决他人没有解决的问题。同时,对其他领域也有一定的了解,或者具有了解的能力(学习能力)和欲望(求知欲)。

硕士和博士的区别仅仅在于:硕士可能在老师的指导下工作,博士需要你来独立工作,并且有的时候指导你的老师。

以下是具体方向的要求和目标。各个课程的学习材料可以在系统科学人网站上看到。等有时间,给每个学习任务加上一个有关学习材料的注。不过,推荐的不一定就合适,适合你自己的才是最合适的。

  • 非平衡量子统计
    1. 学业基础(前置要求):微积分、线性代数、力学、理论力学、一门编程语言(最好C或者Python)、数值计算(最好有)、外语阅读和写作(最好有)、量子力学(最好有)、统计力学(最好有)。
    2. 学业要求:数值线性代数、数值微分方程、Monte Carlo方法、高等量子力学和高等统计物理(实际上高等和初级之间没有思想上概念上的区别,区别仅仅在具体内容而已,如果初等的没有学过,那就一起学)、并行计算。
    3. 目标:了解量子统计领域科学研究的大图景,形成自己的品味,有能力自己去选择甚至提出问题,并运用解析推导或者数值计算来尝试解决。
  • 网络科学(包含科学计量学、汉字结构与学习、学习理论、网络奇异值理论等)
    1. 学业基础(前置要求):微积分、线性代数、一门编程语言(最好C或者Python)、外语阅读和写作(最好有)、数学模型(最好有)、一个专业领域(例如科学学、语言学、社会学、神经科学等等,最好有)。
    2. 学业要求:数值线性代数、Monte Carlo方法、网络科学的思想和基本概念及其计算(自己编程尝试一下计算,加上运用igraph等网络分析软件——有那么一天你可能要自己来开发一个计算模块的)。
    3. 专业方向要求:在科学计量学、汉字学习、学习理论等领域做有指导的大量阅读,了解研究大图景,把问题科学化、数学化。
    4. 目标:深刻体会网络思想——同时考虑直接连接和间接连接的效应,了解网络科学研究的概貌,熟练自发地运用一些网络分析的工具,在某个领域内运用网络思想提出并解决新问题,同时有可能的时候在具体领域研究的基础上发展网络分析的概念和工具。
  • 博弈论
    1. 学业基础(前置要求):经济学原理(最好有)、博弈论(最好有)、普通物理学(最好有)、一门编程语言(最好C或者Python)、外语阅读和写作(最好有)、数学模型(最好有)。
    2. 学业要求:Monte Carlo方法、igraph网络分析平台、Otree博弈实验平台、在博弈实验研究方向上做有指导的深入的广泛的阅读,了解整个领域研究的大图景,对心理学和神经科学的相关研究具有一定的了解。
    3. 目标:博弈研究的最终目标是探索和构建一个理论来解释人类在面对利益相冲突的多人的情况下的选择行为。学生需要在这个大方向上挑选合适的小问题、小情境来研究。同时这样的小问题又能够回馈到大图景之中。社会科学的研究比自然科学的(科学化的而不是仅仅理念或者甚至感慨)研究要更加困难。

注意:吴金闪非常sharp(尖锐,聪明,快?),有的时候不能很好地体会想的比较慢的人的思想和心情,会着急。这个时候你不要怕,坚持你自己的想法,想办法让他明白你不是没想没有做,就是有点慢。Bohr是一个非常慢的人,他的学生都比他快,但是Bohr不仅自己是一个伟大的物理学家,他的很多学生都是。Landau是一个很快的人,只有他自己是杰出的物理学家。因此,快慢,是否sharp不是问题,理解的准确性和深刻程度、创新性,还有执着,才是成就一个大科学家的特质。一个充数的研究者不需要这些,只需要学会依样画葫芦就够了。我们不培养这样的。

哪里系统科学了?

第一、我们研究的系统,由于相互作用的存在,个体行为和整体性为之间没有直接的对应,会出现整体运动模式这种涌现现象。不同底层结构的系统可能会涌现类似运动模式,不同层次的现象有不同层次的规律,这些问题,都是系统科学关心的典型问题。

第二、在我所要让你体验的,然后希望你自己学会的,而不是我教会的,问题描述和问题解决,以及学习方法上,我都非常强调概念地图这个工具。把一个问题的核心概念提炼出来,然后找出其中的相互联系,画成一张关系图,这是深刻认识任何系统的第一步。当然,概念地图如果要真正成为系统科学的一部分,我们还要研究得到这样一张图之后,有什么分析方法能够帮助我们解决问题,而不仅仅是利用这张图来描述问题。这个问题,有待于进一步研究。

从这个角度来说,网络就是简化了的概念地图——关系的特质消失了只留下了关系是否存在这个信息,或者有的时候有关系的强度,而没有概念地图中丰富多样的关系。但是,惟其简化了关系,我们才能有更好的可计算性。能不能发展概念地图上的可计算性呢?有没有合适的(比网络结构丰富又是比较简单的概念地图)问题来作为发展这个可计算性的基础呢?其实在思考这个问题的人,不仅仅是吴金闪(JOHN BOARDMAN and BRIAN SAUSER, SYSTEMIC THINKING:Building Maps for Worlds of Systems,DAVID N. HYERLE and LARRY ALPER; STUDENT SUCCESSES With THINKING MAPS:School-Based Research, Results, and Models for Achievement Using Visual Tools;Dov Dori, Object-Process Methodology)。

为什么一定要让你自己学?

我相信“做中学”,相信理解了的内化了的知识才是自己的,是自己的才能用来解决新问题,才能帮助你提出新问题。老师可以提供帮助,例如给你一个起点,一个大图景的介绍,一些供你学习的资料,回答你的一些问题(而不是所有)。