关于数学和科学理论与现实的关系以及学习方法的对话

从讨论对某些网络上的几何量的定义开始,我和一个学生做了下面的对话。这个对话不是完全忠实的记录,但是主要的意思没有变。

问了学生这样一个问题:给定一个人的身高数据,并且从中能计算出平均值和均方差,你能告诉我什么?

学生答:我给出一份报告上面写着均值和方差,如果有必要可以给出更高阶矩的值。

问:如果你的老板非常聪明,但是没学过统计学,不了解拿到均值和均方差的含义怎么办?例如你的老板在考虑设计一个梯子,需要最短最长的数据,为了够着一个长度为3m的东西。

答:不知道,还是给均值、方差,以及各阶矩,然后说明一下:均值表示平均身高,方差表示离散程度等等。

问:这是不足以用来做决策的,怎么提升报告和所面对的任务的直接相关性?

答:不知道。

问:举个例子,一把弹簧秤,一块豆腐,经过一套程序(把豆腐挂钩上,然后读数),可以得到一个叫做豆腐重量的东西。如果现在有人来买豆腐,你怎么办?

答:取一块豆腐,称重量,乘以单位重量的价格,然后收相应的钱。

问:为什么以上定义的重量可以这样用?如果我想知道这块豆腐的热量和各种营养成份,怎么办?

答:不知道为什么可以这样用。但是热量和营养成份的计算也是重量乘以相应的单位重量的热量和单位重量营养成分含量百分比。

问:实际上,这里能够用来计算应付款、热量、营养成份,都是因为重量反映了这块豆腐里面物质的量的多少。也就是说,准确理解了定义,以及对这个定义将来有什么用,也就是用在什么样的具体问题中有一个认识,是能能够把“重量”用在以上三个不同地方的原因。并不是因为有人告诉你可以这样用,才用的。具体的应用还有好多其他地方,例如还可以放到“月球”上去压宇宙飞船(这个更深刻,需要理解质量和重量之间的关系,以及造成这个关系的原因)。现在回到身高均值和方差的例子,给老板一个怎样的报告?

答:没有很好地理解重量实际上反映了物质的量,是不能灵活和迁移运用的原因。那么,也就是说,没有很好地理解均值和方差的概念。

问:不仅仅如此,还有不理解整个这两个统计量背后的假设的原因。这个统计者先假设人群的身高符合高斯分布。接着,如果能够从样本均值和样本方差估计真实群体的均值和方差,那么随便遇到一个人,其身高介于均值和左右一个标准差之间的概率是68%,左右三个标准差之间的概率是99%,这时候如何写报告?

答:从样本均值和样本方差计算出群体的真实均值、真实方差,并给出计算结果的置信度,然后报告,99%的人身高介于均值 ± 三个标准差之间,68%的人身高介于均值 ± 一个标准差之间。

问:前后两份报告,差别在哪里?

答:前者仅仅知道均值、方差的定义;后者明白这个统计的基本假以及熟悉高斯分布。这个时候聪明的老板拿到这个报告,就知道,如果需要覆盖大约,例如99%,的人的需求,则梯子的设计长度是多少。

问:什么原因造成这个差别?

答:前者为了学习定义而学习定义,后者思考运算和定义的假设和动机,并思考将来可能的应用。

问:这种差别又时如何造成的?

答:前者为了学习数学而学习数学,为了学习理论而学习理论。后者在深刻理解概念的同时,关心概念提出的动机以及可能的与现实的联系。

总结:也就是说,后者一直企图把理论和定义与现实联系起来(或者间接地通过其他概念与现实相联系),而前者就是简单地记住定义。本质上,后者是科学家——理解定义,思考其与现实的可能联系与检验;前者是被动接受定义,最多了解一下其他人如何使用这个定义。本质差别是:
是否明白科学就是企图找到现实的数学结构;
是否明白科学理论的最终检验标准是现实(实验与实践);
学习的时候是主动地寻找知识之间的联系,知识与现实之间的联系,还是被动接受知识。

对最后一条的补充说明:在上面的例子里面,对均值和方差与高斯分布的联系的理解是深刻认识的基础,从而也是应用与现实的基础;对物质的量的深刻的理解是应用于现实的基础。另外,思考如何与现实相结合的问题,也促进我们对概念本身的理解。因此,我们看到,对知识本身的理解和对把知识联系到现实,这个两个方面是相互促进的。

发表评论

电子邮件地址不会被公开。 必填项已用*标注