经济学家和物理学家的不同思路之一

在随便翻翻Bender的《An introduction to mathematical modeling》(中译本《数学模型引论》,神书)的时候读到其中有一段讲懂得现实和模型的数学家(也就是物理学家)看待产量和利润之间的关系:产量,在其他外部条件不发生太大变化的条件下,影响了价格,于是影响了利润,不一定越大越好,需要求导数。非常简单。然后,讲到,经济学家怎么看呢?经济学家着眼于解释为什么厂家决定这样的产量,于是,利润成了自变量,产量成了最终模型或者分析输出的量,也就是因变量。

具体从利润决定产量的思路还是跟上面的一样,求导数。但是,自变量和因变量的地位换过来了。

不知道这个作者本来就这样认为呢(从后文看起来,不是),还是仅仅是说经济学家会这样看。不过,这里体现了物理学家和经济学家(一部分数学家)的思路上的不同。在物理学的角度看来,因果律是有前后的(前因后果),也就是说,函数和逆函数,是两件含义上完全不同的事情。通过对比不同的产量下的利润来决定最优产量这件事情,不会改变产量决定利润这个因果本身。

看到这里,忽然意识到,经济学家把很多因果关系颠来复去地用不同的角度来说,原因就在这里。仅当两个变量存在一一对应的关系的时候,才能把函数和逆函数完全认同。而且,就算这样,有可能这两个变量和外界的联系导致其中一个从更大的逻辑上更合适看作自变量。于是,自变量和因变量在实际问题中,不能纯粹地像在数学公式里面一样变换。

另外,本书,写得非常之好,非常值得一看,尤其是和《Mathematics: a very short introduction》合起来看看。

顺便,这是我本科组织“读书会”下面的一个科学小组的时候的选的第一本书,也是我和狄老师第一次结缘的书。还记得看到一个对数学模型有这么深刻认识,并且喜欢同一本书的人的时候的心情。

那时候一起玩这个的还有葛虎堂,蔡中华、贺建辉、曾定方。

数学模型绝对不是模型的收集,绝对不是告诉你这样这样的系统可以通过微分方程来建模,那样那样的系统可以通过随机过程来建模,而是告诉你,当数学用于描述和解释这个世界的时候,用于提高你对世界的理解的时候,大概可以怎么想,怎么做。从这个意义上,整个自然科学(一部分的社会科学也是),都是数学模型。

读两个微信的帖子:《统计学发展方向的选择》与《人民大学师徒大战有感》

今天看到Zike转发的统计学发展方向的选择,作者提出统计学的将来不在于和计算机的结合,不在于数学上的深入,而是在于研究者深入到具体研究对象所在的学科里面去,了解具体学科,而不仅仅是统计学方法。

非常有道理。其实,所有的方法性学科,包括一部分的数学、一部分的物理学、系统科学,都和统计学一样,生命力来自于具体的研究问题。

当然,另一方面,考虑超过一般中心极限定理的统计学,也是有意义的。所以,数学上和方法本身的创新应该也有发展的空间。不过,根本上,这个更一般的中心极限定理(Levy分布,长尾之类的东西),还是来自于具体的研究问题中的表现。

因此,所有的学习这些方法性专业的学生,以及研究者,都需要从实际问题中获得进一步发展的方向感和启发。

上周读到郭师兄转发的悼念狂人——人民大学师徒大战有感,说得很好:中国没有狂人(学术见解上,不是一般的生活中,有自己的看法,并且努力发展自己的看法)存在的土壤,因此学术上真正的创新就很难有。

我会拼死捍卫你说话的权力(当然你要想办法说出自己的理由,自成体系,而不是“我就是这样,就是要这样,就是觉得这样”),尽管不一定赞同你的观点(这时候,我也会给出我的理由——记住记住在没搞清楚之前,千万千万别信我)。

学术观点会得罪大佬的事情,好像在科学界会好一点, 不像社会科学界,或者人文。

所以,学生们,你们尽量去有自己的观点吧,觉得谁错了都没关系,只要去找出理由。在认同之前,请自然地勇敢地怀疑一切。

研究工作反映对这个世界的认识和思考

一个无脑发文章的研究者,和一个深入思考的科学家的区别在于,是否其研究工作反映了一种对世界的认识、思考甚至思想。

怀特海《教育的目的》最后一章,大学的作用,里面提出来,大学的根本目的就是有一群有想象力创造力的科学家把自己探索世界的体会用具有非凡想象力非凡创造性的方式和下一代分享,从而使得他们也成为具有想象力和创造力的科学家。达不到这个目的的大学都是不管用的。同时,他还指出,大学存在着一个非常大的危险:吸引、集中和培养了一大堆高效率的发文章机器。顺便,不得不佩服一下,尽管现在看起来不是那么的非凡,怀特海80多年以前的思考。

看了这一部分以后,我就开始思考,尽管成就尚小,我自认为是一个用研究工作提升对世界的理解,用对这个世界的思考指导研究工作的科学家,那么我的工作到底和无脑研究者有什么不一样呢?如果不能回答这个不一样,那就是对自己的看法有偏差,尽管自己骗自己也不一定是坏事。再扩大一点,我所了解的那些我认为的真正的科学家和无脑研究者有什么不一样呢?

今天早上,还没醒来,忽然之间,想通了几个自己的工作让自己觉得不是无脑研究者的地方。先整理在这里。以后慢慢把更多其他人的工作也整理出来。这个,会很有意义。

我汉字的工作的基本思想是:汉字之间从结构、读音和含义上相互联系,这样的联系可以用来促进汉字的学习。因此,汉字在个体的层次需要相互联系着来学习,还需要讨论整体的学习顺序的问题,还需要讨论一个好的不是一个一个随机抽样而是通过检测一个字了解很多字是否认识的识字检测系统。

从这个工作开始,我尝试把所有的我教授的课程都采用这样的关注相互联系的方式来授课:这本课程主要概念和其间的关系怎样(画成图——也就是概念地图),这本课程所在的学科的基本问题、典型思考方式是什么,教授这门课程的目的是什么,然后在这个图和上面那个学科大图景的基础上,来选择所要教授的内容和顺序,以及启发甚至强制要求学生来做基于关系的学习。实际上从这里开始,我们可以改造所有的课程的教学甚至课程设置,乃至专业设置,乃至整个的“大学是什么”。

我的科学领域之间相互关系的工作的基本思想:科学领域之间的引用关系可以当作其间思想、概念和技术的流动的一种代表,在这样做的时候,需要考虑直接和间接关系(例如A大量引用B,B大量引用C,但是A没有大量引用C,从直接统计来看A没有受C多大的影响,但是间接来看,肯定不是这样的)。于是,我们尝试和推广改造了投入产出分析和PageRank两种综合考虑直接和间接影响力的方式,来讨论这个问题。顺便提一句:网络的基本思想,出了简化问题,关注联系,也包含综合考虑直接和间接联系。

我的量子博弈的工作:经典客体的状态由密度分布函数描述,因此,改变其状态的算符构成操作这个密度分布函数的群。这个群没有加法,只有群乘;量子客体的状态由密度矩阵描述,因此,改变其状态的算符构成李群,李群同时有加法和乘法。当我们来考虑这个操作,也就是博弈的策略,的分布的时候,这样的非李群和李群(有没有加法,乘法总是有的)之间的区别,会对数学理论提出非常大的不同的要求。其中,有加法的需要用“密度矩阵”,没有加法的用“密度分布函数”。

我的量子力学基础的工作:受上面的工作的启发,还有裴老师的启发,我开始思考是否在量子力学的层次,有加法的集合就一定需要密度矩阵来描述。这个问题,也就是,是否能够避开密度矩阵避开态矢量的语言,而直接通过密度分布函数,来描述量子力学的问题,也就是量子力学的经典描述的问题,也就是隐变量理论的可能性的问题。于是,我尝试构造一个能够描述量子力学的所有公认的实验事实的密度分布函数的理论,并且说明可以但是代价非常大,更加难以理解。

我的量子输运的工作:平衡态是受外界热浴驱动导致的,那么输运问题所对应的非平衡定态也应该是一个受外界热浴(不过是两个或多个)驱动导致的。于是,我发展了多热浴的有效运动方程(后来发现别人也提了)并且提出一系列新的求解方法(Green函数展开和相干态表象的方法)。

当年的一些网络方面的小工作:关注间接关系的表达式到底是什么(例如无权网络的路径的问题通常是AC = AB + BC),关注权重到底造成什么差别(例如加权以后我们要注意,相似关系可能就不能用AC = AB + BC,不能间接联系导致更相似),关注是否存在网络的整体结构参数,例如动力学维数(在大量的临界现象中,维数起到了决定性的作用,是否可以提出几种网络的维数的一般的定义,然后在具体的模型和现象的分析中得到体现呢?)

一方面,深入地思考的快乐,被一个想不通的地方,或者解决不了的技术问题痛苦的快乐,是真正的深层次的快乐。另外一方面,能够给别人启发,促进问题解决的工作,体现一种思考的工作,是令人兴奋的工作。

快写玩这个小文的时候,想起来樊瑛说的关于我的研究和教学工作的一句话,“你把每一个工作当作一个事业来做”。有安慰我的成分。同时,不得不佩服一下,樊瑛认识的深刻,总结的到位。其实,确实是这样:每一个研究工作或者教学的方法和课程,都要体现我对这个世界的思考,还要做到尽量让读者或者学生,能体会到我的这些思考,受到可能的启发,甚至可能解决这个世界的一些问题。

待续,提醒自己读到好文章的时候整理一下其中的核心思想,作者的思考。

读《教育的目的》的体会

最近两天读了怀特海的《教育的目的》两三遍,用概念地图做了此书内容和思路的整理,并且在概念地图上把自己的体会也结合了上去(红色标注)。

如果看不清,也可以点击下面的链接从我们的概念地图服务器上看。

其基本的观点就是教什么东西需要好好来选择,而且不能多,选择出来教的东西就好好好教,让学生理解的透彻——教给学生没有被他们理解的思想和概念是有害的。其次,选择一定要有一个原则——教学的目标决定了选择的内容,因此,首先要有一个目标。

一方面,这些思想都不是新的,也不是很难得的。例如我们的“Teach Less, Learn More”的设计原则就是类似的。

另外一方面,这些思想是革命性的,相对于现在的教学实践。大多数老师在做无脑教学——不思考应该教什么,拿过一本书,看完了就去教,稍微好一点的老师,看两本书再去教,也不知道所教的课程在整体学科中的地位,有没有自己的理解和体会。因此,一个在做思考和选择内容来教,还要问为什么要选择这些内容来教,还需要在教的时候做到学生能够理解知识之间的联系,确实是非常不一样的革命性的老师了。

但是,本书主要就讨论了这些理念,然后,依赖于老师对学科和课程的概念网络的理解,典型思考方式的理解,来选择合适的教学内容和方式(本书非常强调概念的利用,因此推崇设计一些项目来促进教学,也就是以项目为基础的学习)。

那么,这些红色的部分,就是我们在实行“以概念地图为基础的理解型学习”教学实践中的体会,正好补充了这本书欠缺的技术部分,也就是如何来搞清楚一个学科中每一个概念的地位,如何让学生关注建立知识之间的联系,如何学会更高效地思考和学习。

以后可以推荐《教育的目的》和我的《概念地图学习和教学方法》一起看了。

语文在字的层面的理解型学习

汉字可以一个一个来记忆和学习,也可以在课文中通过理解其用法来学习。这个就是通常学生学习汉字的方法。在实际学习过程中,这种学习方法要付出大量的记忆性的努力,还有通过大量的重复练习来巩固。

对于中国人,这个不是大问题,因为,汉语是已经会的,能够认字和写字也就解决了大部分的问题了。

对于不会汉语的人来说,由于同时要学会汉字和汉语,两者的联系又不是很紧密(看到一个汉字不能很好地提示其含义和读音,还有用法)。以语言和词汇为主的学习方式导致汉字成了一个语言的简单的记忆单位。例如“单位”这个词,有可能英语背景的学习者直接就整体认知成为”unit”,而不能明白其实“单”是”single”的意思“位”是”unit”或者“position”的意思,更加不能明白为什么“单位”两个字合起来就能表示”unit”的意思。于是,也就不能迁移(例如理解“单身”——如果也能够拆分成“single body”的意思就很好学会了)。同样的情况可以发生在“汉语”这个词上。只有理解了“汉语”的内在结构才能明白“汉语、汉字、汉族、汉学”等等之间的内在联系。这个说的是在词汇的层次要注意构成词汇的汉字之间的联系,也就是词汇的联系。

汉语其实还有更加深刻的内部结构:汉字本身也是有内部基本单位的,这些单位也是通过某种联系有机地结合在一起的。例如“位”这个字,为什么是”position”的意思呢?其实,这是两个不同的部分“人”和“立”,合起来表示“人站着的位置”的意思。这个是汉字的非常重要的特征。一个好的学习者,或者好的学习方案就要利用好这个特征。

例如,“黑”这个字来源于把“器皿”放在“火”上烤。如果你干过这样的事情,例如小时候玩蜡烛,就知道什么是黑了。接着这个黑字,如果我们把这个积累在器皿上的黑东西扣下来,揉成一团,象“土”一样,就得到了“墨”。再例如,跋山涉水的“涉”,原来的写法(现在还能够稍微看出来一点点),是两个脚趾头的“止”放在“水”的两边,于是就是徒步过小河的意思。顺便出道题,“往”为什么不念“主”的音,而是念“王”的音啊?通过这些例子,我相信读者就可以体会到,一旦把字的结构如何拆分、为什么这样的拆分合起来可以表达这个字的读音含义,那么,这个字就容易学了,甚至学会了也更容易用了。也就是,学活了,效率高成本低了。

于是,这就有了两个问题:第一,这样的汉字内部结构的拆分和解释的基础数据我们有吗?第二,有了这个基础数据,我们能够如何帮助汉字学习呢?

第一个问题,其实是汉字研究内部的问题。不过,如果没有考虑到第二个问题的话,其拆分,当然也很有用,不一定能够满足后面的需求。幸好,在汉字的历史上这样的拆分是有的,例如《说文解字》,尽管还不够。

汉字结构网络与理解型学习系统可以看到我们的拆分数据,以及分析计算的结果。这是一个大大的图:fullmap

第二个问题,分两个层次。在个体的层次,有了这个基础的拆分,就能够促进汉字学习者做理解型学习,也就是明白汉字的结构以及从这个结构引申到含义和读音,从而减少记忆负担。在整体的层次,我们可以问类似这样的问题:我们应该先学习哪些汉字,后学习哪一些呢?我们如何快速低成本地检测一个学习者认识哪一些不认识哪一些汉字呢?两个问题还可以合起来,了解了这个学习者所认识的字和不认识的字以后,如何利用这个信息来促进汉字的学习呢?例如,很容易想到,学习那些跨度不太远的与已经认识的字有内在联系的字可能会更容易一些。

我们的研究实际上,主要关注这个整体性的问题,也就是学习顺序、高效检测方法、个性化学习顺序这几个问题。当然,与汉字研究专家合作,建设汉字结构基础数据库也是正在开展的一个工作。

长期来看,我们还需要把汉字和汉语结合起来,开发学习材料,利用篇章的学习来带动汉字的学习,而且这个汉字的学习还需要一定程度上照顾我们的理想中的学习顺序。学习材料的开发和实验应该是一个循环上升的过程。推广或者产品化也是需要考虑的问题,不过那是其他人的事情了。很多的周边产品也可以考虑,例如,在汉字结构数据的基础上,开发一个图片或者动画形式的识字产品。例如,把整个学习顺序和检测顺序,以及学习材料做成一个汉字学习系统(软件)。

在这个工作里面,系统科学的思想,体现在从个体层次的问题到整体层次的问题的思考问题的角度上。另外,在技术上,我们需要设计好的数学模型来解决学习顺序的计算,高效检测算法的制定。同时,系统科学还体现在把一个领域的问题研究的比较深入以后,可以迁移出来,或者把别的领域的方法迁移过来。也就是系统科学所关注的类似的系统存在的一般性。

例如,实际上,你会发现,汉字的这样的利用汉字内部结构和联系(同时也是汉字之间的联系)的方式来促进学习(学习顺序和检测的问题),同样可以用来学习数学、物理学等逻辑关系比较清楚的科学。甚至,如果能够把条理不清楚的学科整理出条理来,学习效果的提升程度,应该比条理清楚的更好。

实际上,这个工作里面提出和发展的思想就是我们提出的“教的更少,学得更多”的理解型学习教学的核心。

参考文献:
1、Xiaoyong yan, Ying Fan, Zengru Di, Shlomo Havlin, Jinshan Wu, Efficient learning strategy of chinese characters based on network approach, PloS ONE, 8, e69745 (2013).
2、科普作家Philip Ball在www.bbc.com/future上对这个工作的述评