机器人能够取得高考好成绩意味着什么?

日本的人工智能团队对能够通过东京大学入学考试的机器人的开发已经很多年了。最近在Ted Talk上有一个视频,“Noriko Arai: Can a robot pass a university entrance exam?”,说,目前在数学(Top 1%)、作文等方面的表现已经很好,在某些强烈依赖于上下文和生活常识的其他地方,可能尚有欠缺,不过整体成绩来看已经是Top 20%的了。

这个项目一方面,当然,展示了人工智能的进展,机器推理,符号计算、自然语言处理、题库检索等各种方法在求解问题上的进展。但是,这个项目团队一直有一个梦想或者说目标:看一看完全不理解在做什么的机器人是不是能够和人的学习的成果相比。实际上,这个项目就发现,在所有的事实性知识的表现上,机器人远远超过人类,并且考试中考察这样的知识的问题(或者经过简单变化就可以变成事实性知识的问题)很多。

其实,我有另外一个非常类似的问题:拿过一门大学课程的考试题,让没有学过这门课程的学生来做题,可以运用书本和网络,如果成绩和学过的学生差不多,则证明这门课程不值得去学,基本上就是事实性知识,或者已经成为事实性知识的曾经可能需要创造性来解决的问题(后者稍微复杂一点,如果好好用这样的例子,让学生来体会当时的困难和创造性的过程,那么,也是值得学习的一门课)。这个日本机器人高考的项目,其实就相当于用人工智能来代替了我想用的没有学习过但是能够运用教材和网络的学生。

随着技术的进步,没准,以后,这样的而机器人会能够进入总成绩的Top 1%。如果是这样,我们是应该庆祝人工智能技术的进步呢,还是应该为人类学习悲伤呢?我认为,不应该庆祝,而应该悲伤,为人了学习的目标只不过是一个AI机器人而悲伤。看看视频最后主讲人和主持人的说法,

Todai1Todai2

Todai3Todai4

Todai5

那么,到底哪些东西是事实性的知识,考试中多大的比例是事实性知识?关于这个问题还可以见我关于“钢琴一个八度之内有几个黑键”的讨论。这样的统计分析是有意义的。甚至,我们还可以分析一下一本教科书中这样的比例有多少。

对比中国的所谓Aidam的操作:主要强调可以很快(比学生快很多)的完成高考试卷,强调分数还不错,来展示自己的AI技术很牛,就可以发现,这完全就不是一个层次的工作。其他人仔细研究Aidam的答案以后发现过程错了答案对了,这些细节够不说了。能够考试中战胜人类学习者的人工智能的卖点固然可以是人工智能很牛,但是,更重要是事情是,在这个基础上,人类学习者应该学什么,应该做什么?难道还要和机器比事实性知识吗?参加知识竞赛的Watson的表现,还有参加日本高考的Todai Robot的表现,以及足以使我们烦死和警惕:对人类学习者来说,要教什么,学什么,做什么,要怎么教,要怎么学,要怎么考?

大学在教什么?

英国University of Surrey的Ian Kinchin有一篇文章标题叫做“Universities as centres of non-learning”(作为最不学的地方的大学)。不是说,教了包含微积分和线性代数甚至拓扑的高等数学就是真的高等级的数学了;不是说,教了最小作用量原理和相对论甚至量子力学的物理学就是高等级的物理学了;不是说,浏览和了解和更多流派的画作和技巧就是高等级的美术了,尽管我们的大学基本上就是在教这些。那么,到底大学在各个学科上应该教什么呢,有没有教应该教的东西呢?

我一直在批评,小学教的四则运算,不管多么熟练能够计算多么高位的数字,都不是数学。那么,难道大学教的高等数学就是数学了吗?如果这样,也简单,往前赶就行了:让小学把现在初中的教了,初中把大学的教了(高中干什么?全留给复习,准备应付考试好了)。那到底什么才是教真的数学,不管大中小学。到底什么才是教各个学科?

今天遇到两个例子。第一个是我《学会学习和思考》课程的老师Kip举的他儿子的例子。他说,他居住的小区经常有人开车比较快。他儿子及其小朋友们就想看看到底那些车有没有超速。如果有测量速度的仪器(例如多普勒仪,现在马路上测速就用这个?),这是很简单的。孩子们没有这个仪器,甚至连足够长的尺子也没有。这群小朋友是这样做的:先推动自行车,记下来某一段路滚了多少圈(在车轮上做一个标记,撞到地上就记一圈),然后量好了自行车轮子一圈多长;接着,拿着秒表来给经过这段路的车计时,就知道车速了。并且,可以尽量匀速地骑行自行车,先算好速度,这样将来只需要把两个时间除一下就知道比自行车快了多少倍。这就是数学:把实际问题转化为数学问题,把关系转化成计算、转化成数学结构,是数学。类似的例子,还有我家心儿对水果店做的统计(见我们的公众号“为了理解教和学”之“用数学来做发现思考和表达”)以及对自来水使用量和生产量的分析。当然,为了有素材,有结构可以用,学点已经有的数学结构是有必要的。但是,更加重要的是,学会把问题转化成已有的数学结构或者从问题里面构建新的数学结构,才是数学。当然,除了创设情景来理解概念或者定理地图的动机,把概念之间的关系把握好理解好,也是好数学。那么,其他学科的好教学也一样,需要去追问那个学科里面最典型的思维方式、分析方法、基本研究问题、和世界以及其他学科的关系是什么,然后围绕着这个大图景来选择好例子。

说完了好数学的例子,来举一个坏的例子。天津美术学院有一个叫“李宝玖”的学生发了一个退学申明,
Withdrew
由于觉得学不到东西而退学,很了不起。尽管其退学可能有其他原因,例如违反校规很长时间不上课,但是,如果忍忍还是能够获得学位的,还是能继续混下去的。这个看其所拍摄的视频就可以了解到,也可以看下面老师对李宝玖的评价

回忆起这位学生在天津美院三年的经历,一位天津美院的老师这样说:“我了解到这个学生上大学的时候还是不错的,比较积极上进,希望以后在艺术上可以做些有影响力的事情,希望出人头地。”

我也不想具体讨论这个事情本身太多,尽管我也特别想了解美术教育到底教什么——是技法为主、欣赏为主、历史和流派介绍为主?我也不知道理想的美术应该以教什么为主。我想问的问题是,仅仅是美术教育学生从中学不到东西吗?数学、物理、化学、地理、文学、语言、经济、社会等其他学科呢?唱歌、书法、舞蹈等艺术类学科呢?我自己学过大量的数学和物理,在全球好几个不同的学校。我觉得还是能够学到东西的。学到的分几个层次:具体某个学科和某门课的知识,构成这个知识的概念和概念之间的关系,从这个具体知识开始产生的什么是数学或者物理这个学科的理解以及什么是科学的理解,甚至到学科的典型思维方式的理解,到解决学科发展的问题或者用这个学科来解决世界或者其他学科的问题的理解。因此,我认为,数学物理这些学科,还是能够从大学学到东西的,而且需要从很细节的很具体的概念和概念之间的关系抠起,同时心里要有这个学科是什么的大问题和对大问题的追求。当然,也不是每一门课都能够做到这样。例如,我学过数学老师开设的《量子力学》,其主要关注如何估计算符的本征值的上下界之类的问题,认为量子力学的叠加原理非常的平庸——你看不就是因为量子力学的基本方程是线性微分方程吗,自然你的解满足叠加原理。这就是属于只见树木不见森林。不过,人家本来就是这个方面的数学家,为了解决物理理论中的计算问题来的。

如果拿着这个标准来看其他的学科,我们问:某个学科或者课程有这个学科的大图景(对象、问题、思维方式、分析方法、和其他学科以及世界的关系)来当做教和学的中心吗?有把具体的概念、概念之间的关系等例子选择和精炼,来体现这个大图景吗?甚至,我们的大学教育的执行者们设计者们,有思考教什么的问题吗?还是在做无脑教学:拿过一本书,或者已有的一个培养方案,复制一下,从书上抄到黑板上或者PPT上,然后希望学生从黑板上或者PPT上转录到脑子里面,或者至少在考试的时候,还能在脑子里面?如果是这样,我们对得起来给了我们时间甚至敬仰的学生们吗?

看来源于同一个帖子的下一段话:

“十几年没见过你这样的学生”是片中杨书记无奈之下对李宝玖的评价。上课的时候,李宝玖也是老师眼里难对付的学生,老师正讲着课,他有时会当场质疑,“比如对于现代主义,我觉得一个二十几岁的人应该对它有一个反思,好好在哪儿,不好又不好在哪儿?不应该是直接灌输。”慢慢地,他在学校上课的时间越来越少。

如果学生当场质疑就是难对付,甚至需要对付的学生,咱们的老师们是在当老师吗,这是什么心态?老师说的就是对的?后面那句话“比如对于现代主义,我觉得一个二十几岁的人应该对它有一个反思,好好在哪儿,不好又不好在哪儿?不应该是直接灌输。”说得多好啊。反思而不是灌输,难道错了吗?这是多么好的学生啊。笛卡尔说,我从来不把没有经过我反复拷问的东西当做进一步思考的基础(大意)。科学就是反思和实验以及数学的结合才发展起来的。难道美术就不需要反思吗?

我不知道多少大学的课程实际上就是在灌输知识,并且这些知识也是没有考虑过为什么非得需要称为学习内容的知识。真希望有人能够搞一个调查,看看大学毕业十年二十年的学生对自己收到的大学教育的评价,看看这样的无脑教学有多少。

概念地图制作一例

概念地图背后是系联性思考和批判性思维。制作概念地图实际上就是这样的思维的实施和呈现。把概念地图和分析性阅读(问主要信息是什么What,主要信息是如何通过具体例子构建的How,为什么选择这个信息来表达为什么这样来表达Why,我喜欢吗对我有意义吗Meaningful这四个问题)结合比较适合初学者来学会制作概念地图,因为这个时候,概念地图的内容是已经由所阅读的文本决定了的,制作者不用过多选择什么担心内容的问题。当然,总结一本书是更加合适的任务:这时候概念地图的大小,以及需要用到的总结能力、思考的深度刚好又比较合适。顺便,关于如何对一本书做以理解为目的(而不是为了消遣或者为了获取资讯而已)的分析性阅读,推荐看看《如何阅读一本书》这本书。不过,对于初学者,可能直接总结一本书也有一定难度。这个时候,有一些更加简单的例子来当做练习是有用的。在我的书《“教的更少,学得更多”》里面,我主要用了“制作概念地图需要什么”,“什么是课程设计”,以及我自己所做的学科知识的例子。我发现,这些例子确实还不够。今天,刚好我在让心儿制作一篇她教材上的课文的图的时候,发现,这个课文比较简单,也很典型,当例子不错,尽管有点太简单了。我决定把这个例子记录下来。

这是原文,小学四年级下学期课文《沙漠之舟》。

  骆驼生活在沙漠里。它身体很高,脖子很长,能够望到很远的地方。沙漠里有水的地方很少,骆驼的嗅觉很灵敏,能帮助人们找到水源。每逢沙漠里刮起卷着沙子的旋风,它的鼻孔主紧紧地闭起来。骆驼的腿上有一大片胼胝,它就是趴在被太阳晒得滚热的沙子上,也不会烫伤。骆骆的脚掌又宽又厚,走路的时候,两个脚趾分开,不会陷到松软的沙子里去。骆驼背上有驼峰,在水多的地方,它吃得饱饱的,喝的足足的,一部分养料变成脂肪储藏在驼峰里。等到缺乏食物的时候,它就是用自己积蓄的营养来维持生命。

  洮漠宽广无边,到处是高高低低的人很认路。骆驼却能在沙漠里给我们带路。

  沙漠里的大风是很可怕的,大风卷着沙粒飞滚,有时会移来整座沙丘,把人和牲口全埋在底下。骆驼熟悉沙漠里的气候,快要刮风了,它就跪下,旅行的人可以预先做好准备。

  骆驼走得很慢,可是能驮很多东西。它是沙漠里重要的交通工具,人们把它看做渡过沙漠之海的航船,称它为“沙漠之舟”。

现在来做WHWM分析。前面是心儿写的,括号里面是我写的。

What:骆驼能够比较好地在沙漠里面生活。(其实,“之舟”的意思,还体现比较有用,但是课文没有太多讨论这一点。主要讨论了为什么能够。
How:例举了一些骆驼的身体特征,然后建立这些特征和沙漠的联系。在这里,心儿把所有的特征都例举了一下,说:“这个课文没法再缩写了,本身就很短”。我让心儿继续缩写一下。她是这样写的:骆驼很高、嗅觉灵敏、能闭起来鼻孔、腿上有大片胼胝、脚掌宽厚、有驼峰,这些能够帮助骆驼好好在沙漠里面生活。(其实,还有骆驼了解沙漠的气候,提前知道风沙,以及能驮很多东西这两个特点。但是,这篇文章没有写为什么骆驼具有这两个特点。因此,心儿没注意到也无所谓了。实际上,一篇好的文章,应该是要回答这个问题的。如果不回答,不如直接说“骆驼就是比很多其他动物都能够更加适应沙漠的生活”好了。只有提供这个答案才能促进思考,而不仅仅是提供信息。
Why:为了让读者了解一下骆驼。(从知识的角度来说属于纯粹知识,没什么值得学习的。但是,理解身体特征和沙漠的联系,还是有意义的。也就是当做一个分析性阅读的材料。
Meaningful:了解一点骆驼,还算有点意思。

把这样一个总结和缩写呈现为概念地图,就是这样:
CamelDesert

心儿说:采用画图的方式,想问题的时候可以更加有层次感,整体内容的把握上也更清楚,但是,内容上,和缩写差不了太多。

这是一个好例子,就是比较简单,如果内容本身能允许多思考几层,就更好了。

你能够倒背《史记》如流吗,倒背\(\pi\)呢?

乘法表、汉语拼音、英语音标,这些东西都是我们上学的时候需要考试的东西。我把这样的需要死记硬背的本来是起到辅助作用的东西,而不是学习的目标本身的东西,都称为“乘法表”。我更进一步断言,我们的小中大学,大多数时候,都在教乘法表,都在考乘法表,甚至直接学习乘法表。甚至,概念地图和思维导图我也可以当乘法表来用:对于给定的某一主题的知识,整理出来一个图,然后教给学生去记住,用于帮助学生整理和复习知识,而学生呢,只要记住这个图。我不否认这样做还可能真的对提高学生成绩有帮助,但是,那还是在教和学乘法表的层次。这些图示工具真正的作用在于让老师和学生通过制作这个图来做知识的整理,从整理中更进一步理解学科的大图景,找到“啊哈点”(aha moment)——理解了这个点就能明白所有的东西就能把知识融会贯穿的点。

有的人会说,那记住乘法表确实有助于更加快速地计算啊。是的,我不否认。我自己也是记住过乘法表的。如果明白乘法是加法的简便运算这个“什么是乘法”的问题,更进一步明白了加法来源于同样的单位某种事物的量加总(合计)这个“什么是加法”的问题,那么记住乘法表也无妨。但是,有的孩子在明白什么是加法之前甚至在明白“一、二”的意义之前就被灌输了“一加一等于二”,在明白乘法是加法的简便运算之前就被灌输了乘法表。这样,孩子们就失去了把实际问题抽象成数学计算数学结构的机会,而这个抽象化过程的经验,对于提出和解决新的问题,是非常有意义的。更加严重的事情是,孩子们不仅仅在数学乘法计算上要被乘法表,语文、英语、历史、政治、地理、化学、物理、数学都在背这样的乘法表。

为了理解记忆乘法表的学习和理解型学习的不同,我们来举两个例子。第一个例子是无脑除法——不管所面对的问题里面事物之间的关系,由于看起来相除法就直接用除法来求解。有\(6\)个馒头,每天吃两个,可以吃几天?如果要吃三天,每天吃几个(假设每天吃的一样多)?如果你已经会用除法,并且理解了什么是除法,那么,自然
\begin{align}
6\mbox{个}\div 2\frac{\mbox{个}}{\mbox{天}}=3\mbox{天}, \\
6\mbox{个}\div 3\mbox{天}=2\frac{\mbox{个}}{\mbox{天}},
\end{align}
也没错。但是,如果你仔细想就会发现,这两个除法所代表的含义是完全不一样的。第一个除法实际上就是减法的简便运算,馒头的总数里面先去掉第一天的量,然后再去掉第二天的量,直到没有馒头,看看能够去掉几次。第二个出发实际上是假设性思考或者说凑答案:看看如果一天吃掉一个,能够吃几天,不对的话,在尝试一天吃两个,直到刚好三天吃完。第二个例子是无脑用物理公式。我记得这样的物理学生:凡是看到问题里面出现速度(\(v\))就去找速度相关的公式,凡是出现路程(\(s\))就去找路程相关的公式,接着就开始套用这些公式,看看哪一个公式可以正好凑出来答案。以这样的思考方式,可以试着解决下面这个问题:上山\(1000m\)速度\(4\frac{m}{s}\),原路下山速度\(6\frac{m}{s}\),问平均速度多少。这个问题只要用好定义:平均速度等于总路程除以总时间,很容易就能够解决,但是,如果直接用算术平均来计算速度的平均,则就会出错。更进一步,我们应该来追问:在这里为什么算术平均不能用了,不是说好的平均吗?追问每一个计算背后的关系,为什么这个关系正好可以表达成这个计算,追问算出来的东西的意义,回到基本定义去理解,这才是理解型学习,才不是记忆乘法表。

千万不要认为你让孩子记住的乘法表很少。前几天,我家孩子被问了一个问题:“钢琴上一个八度之间有几个黑键?”。这就是乘法表。这个问题可以直接通过记住钢琴键盘的布局来回答,加上什么是一个八度的知识(不过,就算这样纯粹基于记忆的回答方式,其实,还有一个为什么八度是特殊的这样一个问题需要仔细问)。你看,这不就是把乘法表替换成记住钢琴键盘分布吗!当然,这个问题也可以用理解型的方式来回答:首先,需要知道通常的音符(白键)之间存在全音程和半音程两种;接着,还需要知道哪些音符之间是全音程哪些是半音程;接着,明白钢琴在设计的时候,要保证每一个伴音上都有键;最后,把以上三条画成一张图,就能够知道有几个黑键了。那是,除了最后的画图和推理,前面的三条,都是纯记忆性知识!这不是就是乘法表吗!因此,就算用理解型的方式来回答这个问题,其基础还是乘法表中的三行啊!当然,我们可以进一步做这三行的理解性思考:为什么八度是特殊的(答案是八度代表频率翻倍,更进一步为什么频率翻倍在听觉上就是特殊的?大概来说是因为大多数人对于音乐的感觉是频率之间的比值而不是绝对值。更进一步,这是为什么?三角函数的和差化积。再进一步,在听觉器官的层次,为什么这个三角函数的和差化积是根本性的?)?为什么当年会把白键音符定成这么奇怪的音程关系,而不是直接就是每个半音都设置一个音符?为什么钢琴最终又要保证每一个半音都有一个对应的键?但是,能够这样一步一步来做理解型学习的人,实在不多啊。问问题的人,大多数时候,也仅仅是想着,我就想知道孩子是不是知道答案!那这个不就是乘法表吗?

如果认为这样的乘法表属于应该知道的知识,是常识,那么,我就要反问了:你能够背诵《史记》吗?如果你还能够背,我就会接着问,你会背诵《左转》吗?如果你还会,我就会接着问,你会倒背《史记》吗?这些都是google应该完成的事情,而不是学习者应该完成的事情。如果乘法表、物理公式、钢琴键盘布局是应该记住的,那么凭什么《史记》、《左转》以及倒过来的《史记》就不是应该记住的了?就算你记住了这个世界上所有的有答案的问题,那你只不过就是一个菜谱、google甚至百度而已,这就是你学习和教学的目标吗?

最后,如果你还会背或者还认为应该会背,我就问,你会倒背\(\pi\)吗?

“教的更少,学得更多”的课程设计要求

我一直在散播这样的理念:一个一个的知识点不重要,知识的组织,用知识来反映一个学科大图景(一个学科的基本研究对象,基本研究问题,典型思维方式,典型分析方法,和其他学科以及世界的关系)才重要;因此,教学(和研究)都要围绕着这个学科大图景来选择教(研究)什么,然后才是怎么教的问题。这样做需要依靠系联性思考——把一个概念或者知识点放到和其他的概念的联系里面去理解,和批判性思维——没有经过理性以及实验拷问的概念知识点等不能成为进一步思考的基础。

我还举了数学、语文、力学、量子力学、系统科学等例子。比如说语文,最核心的东西不在于字词的记忆背诵默写,而在于喜欢和能够说出来自己想说的,以及搞清楚自己想搞清楚的其他人说的东西,也就是喜欢和能够交流,也就是分析性听说读写。我甚至提出了WHWM分析方法。比如说数学,最核心的东西不在于四则运算,甚至微积分运算,而在于抽象化能力——把一个问题变成数学问题并且进而来做形式化语言思考的能力。比如这些科学的分支,最主要的不是碎片化的知识,而是首先通过具体学科的例子明白科学是什么,然后明白自身学科特有的对象思维方式和分析方法是什么。

那今天,我们来看看,要实现这个体系,怎么做,需要什么。

首先,需要一个能够站的足够高脑子里面有学科大图景的老师。自己的理解不到位,只在知识点层次,那就不能看到知识的组织,并且看到这群联系起来的知识的灵魂——学科大图景。

其次,需要愿意来做理解型学习的学生。仅仅对知识点和考试成绩感兴趣的学生,可能很难转过来做理解型学习。

再次,需要一个还能够比较成体系比较有灵魂的学科。当然,一般来说,只要站的足够高,这样的灵魂总是看得见的。但是,也存在比较不容易说清楚灵魂的时候,例如,历史、语文,其典型问题和思考方式是什么,其教学的核心目标和理念是什么,还可能真不好说。

接着,假设这些条件都具备,那么,需要学一点点技术:概念地图的制作,来把思考呈现为一个有组织的知识,来帮助把学科大图景提炼出来,并且提现到具体知识之中。

最后,再具体课程或者学科的设计的层次,我们要有
1. 目标 (在设计目标的时候,要围绕着课程的主旨——教会学生学习和思考,于是要关注这个模块如何帮助学生更一般地学习和思考(这个部分要突出批判性思维、系联性思考),以及如何帮助学生做这个学科的学习和思考(这个部分要突出如何像这个领域的专家一样来思考,这个学科的大图景),以及如何使得学生们学会欣赏和开始喜欢这个学科。
2. 对学生的要求
3. 反映大图景的大图
4. 分解以后的小图,专题,以及理据性——为什么要讲这些专题,它们如何实现上面的目标
5. 课程内容的时间安排
6. 参考文献,学习材料,作业,课程项目,以及学生需要花的时间的估计。

具体的例子请关注我们《学会学习和思考》课程的教学和教学设计《系统科学导引》的网络课程《量子力学》的网络课程,《概念地图教学和学习方法》的网络课程,以及将来更多的其他课程。