会思考得自我

最近看了美剧《unabomber》。剧中有一个用邮件炸弹来袭击大学航空公司的恐怖分子。其原型是Ted Kaczynski,一个“不能仅仅用聪明来形容”(引自Wikipedia)的美国数学家,毕业于Harvard以及Michigan,曾经任职于UC Berkeley。对于他的恐怖行为,他写了一个名为《Industrial Society and Its Future》(工业社会和它的未来)的观点和动机说明。当然,剧中和现实中真正让FBI抓到他的线索就来自于这个说明文档的语言风格和信仰内容。

在说明中,Ted Kaczynski提出来了下面的问题:你在多大程度上在自己做主?例如,你有一个问题,你可能从别人那里,或者计算机上获得答案,因此这个问题的思考不一定代表你自己的思考,这个答案不一定代表你自己的意思。例如,你的工作有可能是按一系列的按钮,而这一切都是其他人安排好的流程。例如,你可能觉得我今天要穿什么衣服系什么领带是我自己决定的,但是有可能是你需要参加的婚礼或者工作场合决定了你的穿戴,或者由于昨天遇到一群人穿红色的或者某人有意的暗示,于是你特意了选择相同或者相反的颜色。更进一步,你觉得可能特意相反和相同,这个总是你自己的选择了吧?但是,其实,没准你的生活经验很大程度上决定了你是那种特意相同或者特意相反的类型。尽管在天体力学开始,很早就有宇宙运动的Laplace决定论,但是,Ted Kaczynski认为工业社会使得这个决定论的程度更大了,基本上所有的人都失去了或者很大程度上失去了自由意志,其看起来自主的思考其实也是假的,不是自主的。于是,Ted Kaczynski就决定用炸掉工业社会的方式来表达这个思想和寻找出路。当然,剧中更加有意思的事情,除了运用语言分析的方式来破案之外,主要破案人(主角)被这个视角震撼和说服,在破案之后,过起来了远离工业社会的生活。其中的一个镜头很有意思,在深夜的大马路上,没有任何的车,主角驾驶着他的车,停在红灯处等待红灯变绿:这个等待,不是他的自由选择的结果。

随着人工智能的发展,上面的问题会更加的严重。那么,出路在哪里?

例如,没有红灯的时候,我开得多快,加油、刹车、道路的选择,这些总该是我的自己的思考的结果吧,自己的决策吧?真的是吗?很快,或者说现在已经可以,我们就可以把驾车的任务交给人工智能了。于是,尽管现在看起来还需要驾驶者的决策,但是,实际上,驾驶者的决策只不过是人工智能的替代品,也就是说,所执行决策并不是真正意义上的决策,就是某个已经完全确定的思维过程思维模式甚至思维结果的实现和执行而已。例如,我们可以从菜谱里面学会和照着做某个好吃的菜,并且得到家人的欣赏。也许今天选择做什么菜是自主思考的结果,但是,至少做这个菜的步骤都是规定好的,不是自主思考的结果。原则上,将来可以发明一个机器也能够做这些。那么,选择做什么菜,以及编制出来这个菜单,是不是自主思考的结果呢?前者,请回到选择衣服和领带的例子。后者,如果是一个从来都没有其他人做过的组合,那么,看具体的情况,有可能是属于自主思考的结果,也有可能是“简单而重复地遍历所有的组合”这个体力活的结果。

也就是说,到底是不是自主思考,取决于,你所问的问题的是否已经有其他人思考过并且解决了,还取决于你思考的方式和渠道。如果完全没有人思考过这个问题(完全的意思是,不仅问题本身和答案是新的,而且连比较接近的问题和答案——可以通过这些接近的问题和答案来简单组合得到答案——都没有),或者有人思考过,但是你在提出和回答这个问题的过程中,确实不知道这个问题和答案,那么,这个是自主思考。这是你自己,这是自我。

于是,你会发现,只有创新性的思考,才是自我。

随着社会的进步,我们越来越多的事情,甚至有一些看起来需要做一些思考和决策的事情,会被机器所替代。如果我们思考的层次太低——活着为了吃饭,那么,必然我们会失去自我,变成某个机器上的螺丝钉,某个按钮的操作员,无论这个机器或者按钮看起来有多么的复杂。当然,并不是说这个螺丝钉和操作员的生活就是不好的——有的时候不用自己去思考的生活也挺好,尤其是当我有其他的值得和需要我来做创新性思考的问题的时候。我不会期待着我遇到的任何问题都是全新的问题。

因此,回答Ted Kaczynski,如何才能有自我,如何才能自己做主:做创新性的思考,思考完全其他人没有想过或者至少没有找到答案的问题。当然,如果你需要思考那些已经有答案的问题,你可以简单地通过人工智能通过搜索引擎或者其他人来获得答案,只要你心里还思考这那些创新性的问题,无伤大雅,你还是你自己。

如果你接着思考,这样的话,是不是大多数人都成了“失去”自我的人,仅仅少数真正的思考着才得大自在?是的,如果这些大多数人的思考没有真正的创新性的话;不是的,如果大多数人都来寻找新的问题来思考的话。你想,如果不这样做,就算在人工智能和工业化之前的时代,真的大多数人就有自我了吗?其日常行为不还是由吃的喝的以及管理者的皮鞭来决定的吗?

因此,不管过去、现在还是将来,会(真正创新的)思考者得自我。因此,我们的教育就更加应该关注学会思考学会问问题,而不是学会具体的知识。当然,具体知识还是需要的,需要把具体知识当例子来学会思考和问问题。

下次开课的时候,我把这个放在广告词里面,“《学会学习和思考》得自我”,以及“学会《量子力学》得自我”。

刚才看到有人发了一个最强大脑里面的片段:一个智力上和身体上有缺陷的人能够非常迅速而准确地计算高次开方。这属于典型的没有自我。第一、这件事情不是很难完成的,华罗庚有一个短文《天才和锻炼》做了揭秘并且做了锻炼实验(顺便,不仅理论上告诉你怎么回事,还实践锻炼一下,这个太了不起了)。普通人只要锻炼一下,是能够做到的。第二、这个高次开方的事情能够做到,意味着什么?只不过还是一个计算器的替代物,而且肯定没有计算器稳定可靠速度快。按照本文的说法,这是层次很低的思考,甚至不是思考,不会让你找到自我——不是你独特的东西,不是来源于你的自由意志的产物,不过就是照着菜谱做饭,不过就是学会了茴香豆的茴的第五种写法。这真的是非常悲哀的事情:就算你能够做非常好的四则计算,你能是什么,不过就是一个计算器!就算你能够做很好的微积分和矩阵的计算,你能是什么,不过就是一个Matlab!数学的核心是把一个看起来不是明显的数学问题的问题用数学的方式来表达,并且表达之后尝试寻找新的方法求解或者用别人已经提出来的求解方法来求解。当然,为了学会做这个抽象化,你可能需要掌握一些已经有的数学结构和已经有的求解方法。但是,终究,求解方法不是数学本身,远远比不上抽象化的体验和能力,甚至远远比不上具体的数学结构(例如集合、映射、群、域、矢量空间、流形)。第三,利用智力和身体有缺陷的人来做这个“魔术”,这更加就是不道德的事情了。第一,增加了表演者的学习负担——表演者自己喜欢的情况下除外;第二,利用同情心和强烈对比感,欺骗了观众。

甚至,你看看,整个最强大脑、汉字英雄、汉字大会、成语大会什么的节目在展示什么?除了细致观察能力可能有那么一点点促进你提出创新性问题的作用之外,其他的算术题、某个读音的字写上20个、某个诗词能够背出来,这些东西你给我一台电脑,我绝对可以做的比你好很多很多。实际上,美国也有类似的节目,不过在那里,终于有人有了类似的想法并且付诸实践——把IBM Waston拿出来去参加这样的节目。如果我们的社会到现在仍然在赞扬、欣赏、羡慕和培养这种层次的能力,那么,就是集体丧失自我。当然,大多数人丧失自我也不是一件多么神奇而不可预料的事情。那么,我们教育者和科学家的责任就是尽量使得那些还有希望找到自我的人找到自我。

小学科学教育教什么怎么教

昨天看到小学科学教育主编郁波关于小学科学教育的思想的一个说法:

为什么要开设科学课?科学到底学什么?
科学…并不仅仅是要孩子们掌握碎片化的知识,例如植物的组成部分、动物的身体结构等等。

这些知识固然重要,但更重要的是更宏观、更接近自然的图景下,让孩子们了解自然科学的概念和理论,以及人们认识自然的方法和过程。

…需要学习像科学家那样时间和思考。

这个说法很好,至少是思考了科学是什么,应该教什么以后的一个说法。至少比中学物理编写组那个“凡是难点都去掉或者变选学”的说法和指导思想好很多。至少比语文教材编写组的“语文主要是培养情操,文以载道”高很多很多倍。后两者都没有从一个学科是什么的角度来思考教什么。如果某些难点的学习对于理解这个学科是什么,这个学科的研究者是如何思考的,那么这个难点就很应该称为学习的内容。如果一个难点的学习可以把很多知识融会贯通,(现在或者将来)起到了桥梁的作用,那么这个难点就必须成为学习的内容。比如说,力学的动量守恒。同样,语文学习最关键的地方在于帮助学习者更好地听说读写,以及愿意来听说读写,也就是能和喜欢交流,尤其是思想的交流。因此,分析性听说读写才是最重要的教学内容,也就是我说的WHWM(说什么,怎么说,为什么说这些这么说,对读者意味着什么)分析。当然,对于外语学习者,字词本身可能会稍微重要一些。这就是我一直说的以学科大图景为目标的理解型学习。首先,我们要问这个学科的大图景——基本对象、基本问题、典型思维方式、典型分析方法、和世界以及其他学科的关系——是什么,然后再决定用哪些例子、概念和概念之间的联系来体现这个大图景,从而帮助学生建立一个这个学科的大图景以及其中的核心概念的一个组织。有了这个大图景和大骨架,将来,学生可以自己来学习和探索新的东西,并且,这个新的学习和探索是通过把这些新的东西联系到这个骨架上的方式来进行的。

说完了这个说法好的地方,我们来说一个不够的地方。然后,我们来做一个补充,并且从这个补充我们来看科学教育,尤其是小学科学教育,教什么怎么教。这个说法的主要缺点是不够明确:像科学家那样思考值得是“怎样”,具体什么是那个更宏观的图景,什么是人们认识自然的方法?对于教材的主编来说,这个几个问题灭有明确的回答,是不够的。当然,也有可能是没有写出来,实际上郁波主编有答案。

具体的碎片化的科学知识,例如,“植物的组成部分、动物的身体结构”,甚至,“物质有分子原子构成”,这个被Feynman认为科学里面最最重要和值得传播(Feynman设想如果有一天人类即将毁灭,这个时候有机会留给下一个可能的文明的一句话,这样的场景)的一个知识,都是没有太大意义的。科学只不过就是技术的进步使得我们能够做测量,以及在尊重测量结果的前提下,我们展开批判性思维的结果。也就是说,科学的基石不过就是测量和批判性思维。举两个例子。我们的日常生活经验可能会告诉我们,重的物体下落更快,力是维持物体运动的原因(当我们把推一个桌子的力撤掉的时候,桌子也就不动了,因此,运动需要力来维持)。历史上,这两个说法确实在很长的时间内都被认为是正确的。直到,Galileo做了(或者说据传说做了)斜塔实验和滑块实验。前者中,两个不同重量的铁球同时从斜塔上落下,发现差不多同时达到。后者中,一个物块从一个斜面滑下来到达一个平面上,发现随着平面的光滑程度的提高,物块可以走的很远。这部分是测量和实验。想起来用测量和实验来检验一个命题,则是批判性思维:任何一个进入我的思考的事实、概念和命题,必须经过理性的拷问和实验的检验,而不是因为它是任何人说的。对于物块的滑动距离这个事情,我们来接着运用批判性的逻辑思维。如果说进入平面以后,物块已经不受力的作用,那么,它就应该马上停下来,这个和平面的光滑程度无关。因此,也就是说,要么前提“力是维持运动的原因”错了,要么在进入平面以后,物块继续受着力的作用。这个实验还可以做一个外推,假设平面做得非常非常光滑,按照越光滑物块走得越远推测,有可能物块可以继续运动下去。于是,问题来了,这个时候,维持运动的力是什么?经过批判性思维和实验测量的结合,我们就发现,之前的两个命题都是错的。

有了这个最最核心和基本的科学是什么之后,我们就要设计好的例子,找到具体的知识以及具体知识的发现过程,找到具体知识和其他知识以及现实生活经验的联系和区别,来体现这个核心的科学是什么。除了实验测量和批判性思维,当然,我们还有一些其他的核心理念。例如,还原论,也就是把事物不断地分解,就是一个科学的典型思维方式。跟还原论相配套的还有一个叫做还原以后的整体论,也就是叫做综合的典型分析方法。这里我们仅仅举例讨论分解。设想,你家电脑坏了。如果你是土豪,那跳过别看了。否则,你可能希望找出来哪里坏了然后去换那个坏的部分。其中一个方法就是找一个型号完全一样或者非常接近的好的电脑,然后采用替换元件的方法来找到坏的那个部分。例如你发现,替换了主机以后就好了。这个时候你把电脑看做了主机和显示器(电源线、网线暂时忽略)两个部分。接着,如果你还是想省点钱,也有时间,则继续把主机拆分成主板、硬盘、内存、电源、机箱等部分,继续用好的那个来替换。也许你就会发现,主板坏了。这时候,你就差不多可以去买主板了。但是,假设你跟我当年一样好奇,你就会把主板继续拆分和替换。没准能够发现是一个电容坏了,于是花五毛钱换个电容就好了。你看,这就是层层分解的思路。这是解决问题的很自然的思路,很科学的思路。当然,这个方法不解决所有的问题,在有的系统里面,完全都运行良好的各个部分放到一起会出现整体功能上的问题。这个时候,需要把各个部分分解之后在运用综合的分析方法。例如两个非常优秀的人放到一起就是没有产生更高的产出率。如果真的要解决这个问题,不是拆开就行,还需要对每一个人做某种分解,找出来真正的原因为止。因此,就算是综合分析法,其基础也是分解。只是,确实,分解有的时候不解决所有的问题。

顺便,在这个“体会还原论和还原之后的整体论”的意义上,Feynman所选的“物质有分子原子构成”具有了纯粹知识之外的价值。

除了实验测量、批判性思维、分解和综合,科学理论的表现形式往往是数学模型。因此,准备一些核心的数学概念来当做武器库,以及了解如何用数学概念来解决实际问题,也是科学非常重要的内容。具体到每一门具体的科学学科,还会有更多(其实也不是这么多)的典型思维方式和典型分析方法。关于数学和数学怎么用,以及其他具体学科的内容,在这里就不再展开具体的例子了。

有了实验测量、批判性思维、分解和综合,数学作为科学的语言,这几个核心的什么是科学的特质以后,我们就可以围绕这些来选择具体的例子、概念和概念之间的联系来做科学的教学了。

当然,第一总结出来这些核心特质,尤其要考虑到每一个具体学科,不是容易的事情。第二,就算脑子里面有了这些核心特质,如何用它们为指导来选择和组织具体科学知识,也是不容易的。第三,选择和组织好了具体科学知识,能够在教学中做好实现,也是不容易的。因此,如果要做好科学教育,尤其是小学的科学教育,我们首先要找到能够做到以上三点的人。

具体来说,前面两点,只要有一个真的能够搞懂的人就行了。其他的老师可以帮助这个老师。那么,我想一个还过得去的小学,找到一个这样的科学老师,还是有可能的。或者说,在师资的培养上,我们也只需要培养这样的人就够了。第三点,在这样的老师的带领下,有很多其他的老师是做得到的。

研究和研究工作

研究就是对某一个问题开展思考、找到解决思路和解决方法、收集材料、做理论上或者实践上的验证。如果要成为一个研究工作,则还需要这个问题是要么从实践中来(立地),或者从理论体系中来(顶天)。有的时候,这个问题本身是一个新问题,可能可以用现有的概念和模型来描述现有的方法来解决,也有可能会促进新的概念、模型或者方法的提出。于是,如果要成为研究工作,就必须搞清楚,这个创新是在前面提到的什么层次的:作为现有理论的一个案例,还是新概念、模型、分析方法甚至分析思想的提出。为了做到这一点,我们需要把自己的思考和研究放到整个学科的大背景里面去,看看跟其他人的相似工作相比,我们的创新在什么地方。

那问题和问题的解决方法从哪里来?有的时候,可以从对现有文献的整理里面提出来;有的时候,可以从自己对问题的实践理解和思考中来;有的时候,可以是两者的结合。但是,一般而言,需要在看其他人的工作和自己的思考和实践中取得一个平衡,并不是看越多的文献越好,也不能这个领域的大图景都搞不清楚就开展研究工作。

下午有老师们提交了亚太地区概念地图会议的论文。其中很多大一部分是基于自身实践和思考的案例研究。这是非常珍贵的,但是可惜离研究工作还比较远。按照前面的这个理念,我尝试写一个要求。

一般来说,首先需要做到问题、主题和思想明确,技术管用,同时有一定的关于为什么管用的思考。这样的层次的作品可以成为会议的“经验分享”,表示,我遇到了这个问题,我思考和实践过了,还管用,可以供大家参考。

如果还能够做系列研究证明这个问题的解决方法管用,那就更高层次了,属于研究工作了。这个时候,管用最好还有测量指标,而不仅仅是说法。当然,对于学术研究来说,核心已经有了,但是这个还不够。

如果还能再和当前其他人的研究对比起来看,和理论体系对比起来看,搞清楚在这个领域中,这个工作处于什么层次,创新在哪里,就更牛了,到了“研究论文”的层次了。

按照这个要求我来现编一个研究工作以及这个研究工作的论文。实际上,这个项目确实是可以做的,只是手上要做的事情太多了,暂时只好拖一拖了。

***************************************************************
举例1

研究问题:汉字理解型学习是否有更好的学习效果。

希望的研究设计:对比一段时间内以下四种学习方式的汉字学习效果——篇章字用单个汉字学习法、集中识字单个汉字学习法、集中识字汉字联系学习法、篇章汉字联系学习法。

动机:汉字学习,由于汉语不是语音语言,而是字和音分的比较开(其实也很有线索,例如形声字)的语言,字形和字义有的时候倒是比较有联系,不能单纯走口语化的道路。有没有什么方式,能够让学习者,尤其是非母语学习者,能够比较高效率地学习汉语汉字?

直接背景:在我们自己的工作中,我们建立了汉字之间形状、含义、读音联系的数据,并且从这个数据出发,提出了一个学习顺序算法,建立了衡量学习顺序效率的理论上的计算方法,并且得到,我们自己的顺序,理论上,比没有考虑汉字之间的联系的方法以及目前教科书的顺序的效率高很多。

间接背景:有其他人从集中识字、以语带文的不同角度对汉字的学习方式做了一些讨论和实践,但是很少关心汉字之间的联系的事情。个别工作也从字族(一般基于偏旁部首)的角度来尝试汉字学习。这些和这个工作相关,尽管不是直接相关。从这个直接和间接背景,我们看到这个问题还没有其他人研究过,并且非常值得研究。

原始设计的缺陷:各种学习方法的学习材料没有经过前期研究,原则上,对照组(前两个方法)的学习材料应该用现有的做的最好的,而不是随便挑的。如果不是最好的,则人家可以批评不是学习方法的问题而是学习材料的问题。更一般地来说,这个给定学习方法下,什么材料最好的问题本身都是一个需要投入大量研究的问题。因此,可以先避开这个研究。等到将来有了学习材料的研究基础,包含自己的考虑联系的学习材料之后,再来做学习效果的比较研究。

改造后的研究设计:人为造出来一些字,或者用没有接触过汉字的学习者当做被试,对比考虑和不考虑汉字之间的联系的学习效果。例如,编出来几十个汉字,在这个集合中,有一些字之间有结构上的联系,并且这个结构上的联系意味着读音或者含以上的联系。其中,另一些字不存在这样的联系。记为A、B两类。对于这两类做a、b两种学习方式的学习。其中a明确使用这些联系,如果有联系的话;b不明却使用这些联系,就算有联系的话。于是,就出现了Aa、Ab, Bb三组实验设置。对被试做前测(保证人造字的基础上,前测可以不做,因为反正大家都不认识这些假的字),分成三组分别做Aa、Ab、Bb的教学和学习,接着做后测(后测可以当时做,一段时间以后再做,一大段时间以后再做)。对比三组被试的测量结果。其中被试的数量、人造字的数量、检测的方式,都需要做尝试和进一步补充研究。

改造后的研究问题:避开学习材料的影响的前提下(其实也没有完全避开,但是,针对少数几个人造字,做到在各自的情况下比较好的学习材料,是做得到的),单纯地讨论了有结构联系的汉字的学习和没有结构联系的汉字的学习的比较,讨论了有结构的运用结构和有结构的不运用结构的学习效果的比较。

研究的意义:尽管不能直接回答一开始的是不是用了联系就会把实际的汉字学的效率更高的问题,但是,至少能够从原理上验证或者否定,有和运用联系来学习汉字的效果。更一般的概念的学习,也可以做类似的尝试。

结果:那需要看实际结果,并且做统计分析,例如其他条件是否类似,样本量是否足够做统计显著性分析等等。一旦被验证,那么,确实会有对于一般的学习的影响。

***************************************************************
举例2:

问题:在课堂教学中引入“概念地图”是否有助于学习?

背景:可以想象,通过把知识穿起来,肯定可以学的更好,更有效率。但是真的是这样吗?其他人研究过这个问题吗?这时候,意识到,所谓“引入概念地图”不够具体,如何引入,教什么课程?通过文献阅读发现,有的人当做教学手段在课堂中直接使用概念地图,有的人吧概念地图当做课程设计背后的思想和工具。在这里,假设我们感兴趣的是教学手段的层面。通过阅读文献,我们发现,有的研究者提供了概念地图的骨架供学生填空好扩展来使用概念地图,有的在讲课的过程中展示了概念地图,有的除了展示还给学生布置了概念地图制作的作业,有的还对这个作业做仔细的反馈,有的仅仅提供“已阅”的反馈。这个时候,我们要决定怎么做。如果是和文献中的方式一样,则我们期望得到什么新的结论——想挑战已有的结果吗,还是做一个运用的例子?如果是和文献中的方式不一样,那在哪里不一样,课程领域不一样,使用的某些细节不一样?

实验设计:假设我们找到了不一样,例如,仅仅在课程之前做概念地图和理解型学习的专门模块课程,在具体课程中不再明确出现是使用概念地图,但是,需要完成概念地图的作业,作业点评也仅仅采用“已阅”的形式。这样做的好处是,可以安排如下的实验组设置:Aa(做了专门模块的学习,并且具体课程的学习的老师是同一个,可能无意识中在具体课程模块中用了概念地图,布置概念地图作业,作业“已阅”反馈),Ab(做了专门模块的学习,但是具体模块的教学老师是其他没有接触过概念地图的人最好有之前的教学质量统计,两位老师差不多,布置概念地图作业,作业“已阅”反馈),Ba(没有专门模块,具体课程教学的老师和Aa一样,不布置概念地图作业),Bb(没有专门模块,具体课程和Ab一样,不布置概念地图作业)。当然,如果条件允许,也可以增加Ac(做了专门模块的学习,并且具体课程的学习的老师是同一个,可能无意识中在具体课程模块中用了概念地图,布置概念地图作业,作业精细反馈)和Ad(做了专门模块的学习,并且具体课程的学习的老师和Ab是同一个,布置概念地图作业,作业精细反馈)。这个时候,就可以通过这些实验组的结果的对比得到概念地图和理解型学习这个理念的效果。如果条件允许,还可以增加具体课程教学中也明确使用概念地图(设计好怎么用)的Ca和Cb小组。

修改以后的问题:按照某种非常具体明确的前任没有研究过的方式在某个学科的某个课程的教学中使用概念地图的学习效果。

其他实验设计细节:实验被试的大小,前测后测,被试已经有的知识还有学习能力的控制,这些因素都需要仔细考虑。

研究的意义:如果有效果,则提供了一种在特定的情况下有助于提高学习效率的教学方式。如果在这个具体问题中有意义,没准在更多其他场合的学习中也会有意义。

***************************************************************
举例3:

背景:在最近的关于学习过程中的大脑行为的研究文献中发现一个有意思的关于迷思(misconception)的研究:一个有迷思的被试在经过学习以后,能够作对题了,但是大脑活动上,那部分有关抑制迷思的活动区域仍然是活跃的。其中,抑制迷思的活动区域的识别是通过其他的实验得到的。这个结果,如果是真的,对于学习有一定的意义:迷思得不到真正的清楚,仅仅是被抑制,于是就可能需要发展相应的学习方式来促进迷思的抑制,而不是消除。

对于这个研究的结果,我非常非常的怀疑。从个人经验来说,我觉得迷思是可以消除的。但是,这个没有科学根据。怎么办?如何设计相应的实验来研究?这个研究刚刚开始,没有太多相关工作。

问题:通过学习是否可以消除迷思,还是仅仅能抑制?

实验设计:注意到在这个工作中,作者选择了一组明显具有迷思的做错题目的被试,以及一组题目做对了的被试,来做对比。所用的题目是“一个重铁球和一个轻铁球哪一个落得更快”。注意到这个事实之后,我强烈怀疑,实际上,做为的通过测试的被试,其实,仅仅是记住了答案,没有理解背后的物理的被试。因此,我提出来,做三组被试的对比:明确迷思组、答案正确组、专家学生或者专家组。其中,后两组的区别必须通过任课老师的参与来识别——一般情况下老师能够区分真正的懂的学生,还是仅仅能够把题做对的学生。当然,这个增加了实验难度。但是,可以直接回答我的问题——是否真正的理解可以消除而不仅仅是抑制迷思。

更进一步,我打算把问题修改成几率匹配问题——一个10面的色子,其中7面为1,3面为0。每次扔出去以后,需要猜测那一面会出现,猜对了有奖励。当然,用完全相同的问题,重复以下前人的研究也是应该的。

实验设计补充:除了依靠任课老师的意见,我们还可以自己来“制备”被试。例如,都采用打错问题的人,然后第一种制备方法是强行告诉被试,选择某个答案是正确的,不给理由;第二种制备方案是让被试明白为什么那个答案是正确的。最后再来做实验。这个对比更能够体现理解型学习的意义,如果有意义的话。

研究的意义:如果能够得到验证,则更加突出了理解型学习的价值——消除而不是抑制迷思。

更大的背景:实际上,这个问题还可能和快系统和慢系统有关。因此,有可能快系统总是存在,总是希望发挥作用,因此,抑制,就算在理解之后,可能还会发挥作用,不过那个时候就是抑制快系统的功能。能不能作进一步的实验来验证这个?

联系、联系的联系和个性化学习

最近在人工智能用于教育产品的领域,兴起了以学生的学习和做题记录为基础的个性化学习产品的开发。大概来说,其主要想法是看学生做哪些题花的时间比较多哪些做错了,然后按照这些题推荐学习材料。这样的系统需要一个对学习材料和习题的内容标记体系。最简单的推荐方法就是哪个标记的问题错了就推荐同样标记的学习材料。假设这个标记体系做的是科学的,那么这个算法就很容易实现,不过就是匹配就行。

但是,有的时候,一个地方做错了,其原因可能是更基础的知识没有理解好,也可能是某个计算的技巧不牢靠,也可能是没有把问题转化成具体学科的知识。也就是说,不一定直接就是所标记的知识点。因此,我们需要一定的扩散型的算法:从一个或者多个做错的问题开始,综合考虑其相互联系,以及这些问题所对应的标记的相互联系,来定位学生做错的真正原因。

其实,不仅仅在查漏补缺上,在一般的学习上,也需要考虑知识之间的联系。试想,在某个基础性的知识点学会以后,可能再来学习及上层概念,或者反过来从学习这些上层概念开始反过来总结和悟出来其基础性概念也是一个很好的学习方式。也就是说,学习需要考虑到概念之间的联系。甚至,需要考虑到联系的联系,这样的长程结构。更进一步,还需要考虑到这些概念的某种重要性,例如,和学科的典型思维方式、典型分析方法、基本研究问题和对象有关系的概念,应该被优先学习。

实际上,我们提出来的汉字学习顺序和考察方法的问题和解决方式,就是我们上面的思想的来源或者说具体例子。在那里,首先我们需要构建汉字之间的结构联系地图(还要区分联系的种类)。接着,我们要给每一个汉字某种重要性——在这里就是它们的使用频率。最后,我们需要研究一个运用联系地图和这种重要性的学习顺序和检测方案(以及推荐学习材料)的算法。更多关于汉字学习的研究的信息见“语文在字的层面的理解型学习”

后来,结合概念地图,我们把上面的工作的思想和技术拓展成了“以概念地图为基础的理解型学习”,主要关注学科大图景(一个学科的主要研究对象、研究问题、典型思维方式、典型分析方法、和世界以及其他学科的关系),依赖系联性思考、批判性思维,来解决从教什么和怎么教的问题。在整理整体知识高速公路的层面,在设计具体课程的层面,甚至直到具体教学环节和具体帮助学生做个性化学习的层面,这样的教学方式都可以发挥作用。将来,我们甚至可以解决减负的问题,做到“教的更少,学得更多”(Teach Less, Learn More):只有老师们做到深入浅出,关注大图景的教学,学生们才能真的用比较少的时间和知识学到和体会到这个学科的核心。

而我们的算法的核心就是考虑概念之间的联系,以及联系的联系,还有学科大图景。知识之间不是孤立的,学习和研究的时候就需要用好这个联系。珍珠只有通过联系的线,才能形成有主题的展现更高层次的美的作品。同样的,概念只有通过这样的联系才能构成一个学科,展现出来更高层次的大图景,回答更深刻更复杂的问题。

实际上,对于前面提到的产品来说,建立学习内容和问题的标记体系的时候需要考虑知识之间联系,并且在学习顺序、检测方案和推荐方式上,需要考虑直接匹配之外的联系,以及联系的联系,还有学科大图景

什么是一个学科的核心概念和大图景?

对于搞科学的(或者好好地深刻地学过理解过科学的)人来说,一个学科有大图景——基本研究对象、基本研究问题、典型思维方式、典型分析方法、典型应用以及和世界以及其他学科的联系,是一个很容易理解的事情:脑子里面有大量的这样的例子啊。有了大图景,就会发现,有一些概念是直接联系着这些大图景的,或者是在考虑到概念之间的联系的时候就发现有一些概念是其他概念的基础。于是,就会把核心概念识别出来,并且整理出来一个知识之间的联系,更进一步甚至把联系也区别开来——有一些是主干道有一些是盲肠小道。

例如,物理学主要研究物质的组成和运动,因此,力学的世界观——状态如何描述,状态是否发生变化,变化的话原因是什么——就尤其重要。同样,也是因为运动是主要的研究对象,所以,时间和空间就是物理学非常非常核心的概念。物理学,或者说科学,最根本的研究思想是实验和批判性思维,同时对于理论的系统性统一性的追求也是典型思维方式之一。从分析方法上来说,还原论——把事物一层一层分开进而把每一个层次搞清楚,其中每一层可能还要继续分下去——和还原之后的整体论——也就是把分开来的东西重新合起来,这个时候可能会出现下面层次上没有的新现象,把事物之间的联系用力和能量(哈密顿量、拉格朗日量)来描述也是非常重要的分析方法。于是,分子原子基本粒子这些知识作为知识不太重要,但是,作为理解这个还原论和还原之后的整体论,就是特别重要的好例子。于是,哈密顿量和最小作用量原理就是特别能够体现物理学典型分析方法的重要概念。

不过,对于搞人文学科的,或者搞教育的(尽管教育应该被看做自然科学和社会科学,而不是人文学科)来说,理解核心概念和学科大图景,可能有困难了:为什么概念之间的地位会不一样呢?凭什么有一些更重要呢?在“我们”看来,知识就是一个篮子里面的鸡蛋啊,收集起来就好了啊,凭什么有的鸡蛋会更重要呢?更大?怎么度量大?更有可能生出来小鸡,怎么度量这个可能性?或者,甚至,连怎么度量这个问题都不会问。人文学科的才不管怎么度量呢。

当然,一方面,尽管我是泛科学主义者,我也认为没必要所有的学科都采纳科学的规范——例如以实验和系统化的模型为主,思想上以批判性思维和系联性思考为主。因此,人文学科、社会科学和自然科学有很大的区别,是可以有的。但是,另一方面,这个区别应该在尽量科学化——也就是观察和实验、系统化、批判性思维和系联性思考——的基础上,保留自己的学科的特点,而不是连科学化这一条都要废弃或者规避。你看,就算在科学内部,物理学、化学、生物学仍然保留了其自身的特点啊。

那么,怎么才能做到能够科学化的地方科学化呢?需要我们对什么是科学有一个比较深刻的理解。而对于科学的深刻的理解需要建立在具体学科的基础上,也就是要通过学习具体学科来学习,还要从具体学科里面走出来提炼更加一般的什么是科学。这个“走进去走出来”就算对于学习自然科学的学生都是一件不难么容易的事情。而我们当前的教学设计使得文科的学生连这个“走进去走出来”的机会都没有了。这是非常有问题的。这也使得我这套以学科大图景为目标的理解型学习实行起来,对于文科的老师,更加的困哪了。例如,你问问语文老师,语文大图景是什么,什么东西最关键,试试。

你想,如果一个从来都没有思考过学科大图景的学生当了老师,你怎么敢指望这个老师就能够帮助学生理清楚相应的学科的大图景呢?如果这个老师当学生的时候,就把知识看做一篮子鸡蛋,你怎么敢指望这个老师能够帮学生看到鸡蛋之间相连的绳子呢?

其实,不仅仅是自然科学,人文学科,也是能够,并且更加必要整出来一个融会贯通的大图景。例如,历史就可以从集邮票——指收集时间的时间地点以及相关的物理和文献证据,变成对某些根本问题的理解。例如,为什么中国的社会诚信度比较低,为什么中国的百度百科远远远远赶不上Wikipedia,为什么我们更加保守集权和缺乏创新性,这些都应该是和大量的历史事件有关系,例如包围着家园的长城、随时发怒但是又是文明摇篮的黄河、元朝对宋朝在文明和文化上的破坏,清朝(?)的奴化愚化教育和奴化愚化统治。一旦把这样的联系建立起来,就可以把问多问题看的更加清楚。

希望所有的学生都有机会来深入理解和欣赏一下科学。科学不是神奇的生活之外的东西,只不过就是凡是问一个为什么,有了为什么的问题就会诉诸于联系,诉诸于核心概念。