忽悠报告:网络改变世界

除了分享实际研究工作,整个领域的方向感也是值得分享的。最近打算做一个比较忽悠的报告,或者说,企图促进这个领域发展的报告。当然,背后有其他研究者的还有我们自己的工作,不过,具体工作都跳过不讲了。还没有做过这样的报告呢。整理在这里。其中的概念地图,近期,由于学校“网络升级”不能访问。

NetworkMain

标题:网络改变世界
报告人:吴金闪
摘要:网络不过就是把一个系统描述成一个集合的元素(顶点)和元素之间的关系(边)。有的时候甚至关系都被简化为有还是没有。为什么这样一个简单的简化的描述能够有这么强的生命力呢?其中一个原因是网络的重要思想:顶点的内涵(性质、地位和作用)由这个顶点的连边决定,以及连边的顶点的连边决定。我把前者——内涵由连接决定——称为几何性,把后者——依赖于直接和间接联系的综合——称为网络效益。在这个报告中,我将讨论几何性和网络效益如何帮助我们改变和提高对经济学、科学计量学、概念的教和学、知识的管理等各个学科的理解。最后,我将呼吁大家协作来做一个“知识高速公路”项目,从根本上改变教和学,学的更轻松更好,保留和释放创造力,做全新的融合研究、学习、知识、产品、需求的没有边界的科学,让这个世界变得更美丽。

一颗颗的珍珠和串起来的珍珠

在老家度假(被闷热),遇到一个理解型学习的典型例子,能够很好地体现“从定义开始建立逻辑链条,体会每一个概念”,以及“从核心概念开始通过联系来学习其他知识”的重要性。分享在这里。这两个例子,如果能够再加上学科大图景——基本研究对象、基本问题、典型思维方式、典型分析方法、典型应用以及和其他学科和现实世界的关系,就是以学科大图景为目标、以系联性思考和批判性思维为核心、以概念地图为技术基础的理解型学习。

这两个孩子成绩还好,基本上题目都能够做正确,但是,看起来稍微有点吃力,平时也挺认真。这样的孩子,很多时候点拨一下,指一条路,也就能够提高了。

第一个孩子数学好点,我拿数学当例子。我问第一个问题:正弦和余弦函数的定义是什么,画图表示出来。第二个问题:从这个定义开始,画出来正弦和余弦函数的图。第三,从定义开始,证明正弦定理。第四,从定义开始,证明余弦三角函数的两角和定理。第五,从正弦和余弦函数开始,证明所有常用三角函数公式(和差化积、积化和差、万能公式)。

在第一个问题中,孩子出现了混合三角函数图像和三角函数定义的问题。说明知识有碎片化的可能,没有体系化。不过,后来想明白了。一个小小的问题是,所有的定义直接在单位圆(\(r=1\))上写下来的,所以没有出现\(r\)。可以接受,但是,还有有理解没有完全到位的危险。

接着在第二个问题中,孩子直接挑选了\(0, \frac{\pi}{2}, \pi, \frac{3\pi}{2}, 2\pi\)这几个特殊点来做图。确实用到了定义中的单位圆来取值。因此,差不多构建了从定义到性质曲线的逻辑,但是,还有不够的地方:仅仅依靠这几个特殊点,很难把函数图画出来的,除非依靠记忆。于是,我接着问:你怎么知道这些特殊点之间是直接连起来的,不是好多个转折波动?回答,这个时候需要考虑单调性。很好。有了单调性,至少在这些特殊点范围之内就大概解决问题了(剩下还有一个凹凸性问题,这个需要用到导数的概念,暂且忽略,其实也可以讲明白)。接着问:这些特殊点之外呢,例如大于\(2\pi\)的时候,小于\(0\)的时候呢?回答,这个时候需要依靠奇偶对称性周期性,它们都可以从定义得到。这个时候,学生就明白了为什么要学最大值最小值单调性奇偶性周期性这些概念。它们是建立三角函数从定义到性质曲线的桥梁的工具。这个从定义到性质曲线两个是什么中间的为什么对于理解三角函数非常重要,对于理解为什么要学习最大值最小值单调性奇偶性周期性这几个概念也非常重要,而不是单纯地为了学习这几个概念。

第三个问题可以再一次检验对定义的理解,需要考虑到\(r\)的存在。

第四个稍微有点难,但是,对于完整体建立整个逻辑链条非常重要。能够完成这一步和下一步,就知道了整个三角函数公式,其实可以建立在两角和公式的基础上,而两角和公式则建立在三角函数的定义的基础上。

这样就第一建立了整个三角函数部分的知识结构,并且,仅仅需要定义加上仔细的推理计算。第二,更一般地,所有的学习,都要尽量从定义出发,运用推理计算,构建整个概念的大厦。这才是理解型学习,如果还能够结合好的例子用起来的话。

第二个孩子化学好点。我拿化学做例子。问,化学里面你觉得最最重要的知识是什么?每种重要化学反应物的制备,金属的金属性强弱等等。提示,如果你是高一的化学老师,你准备给你的学生讲什么?学生回答,就按照教科书上的讲啊。继续问,如果你只有一个小时,你讲什么?回答,哪些是金属,哪些不是,分界线在哪里。这个答案第一体现了这个孩子认为金属性是比较重要和基础的概念。这个值得肯定。确实,有很多的考试题最后落到的考点是金属性的强弱,例如一种金属用来把另一种金属从溶液中替换出来。第二,体现了一定的系统性,也就是说不是一种一种金属来记住的,而是一群一群来记住的:某一族和另一族金属的金属性的区别,族内的区别。但是,仍然,这仅仅是知识。接着问,为什么金属和非金属在元素周期表上存在着一个分界线,周期表是按照什么东西排列的?答,核外电子的数量不一样。问,为什么核外电子的数量不一样就能得到不同的金属性?答,失电子能力和得电子能力不一样。问,为什么失电子能力和得电子能力不一样?答,因为8个(最外层)电子是稳定的结构,这些原子都会倾向于变成8个(最外层)电子,所以多一两个的容易失去(金属性),少一两个的容易获得(高氧化性元素)。其实,还可以继续问,为什么8个是稳定的?

经过这一系列问题,孩子自己就发现,其实知识之间是有联系的,有一些知识是处于基础和核心的地位的。例如,核外电子排布是元素周期表的基础,元素周期表是整个无机化学的基础,大量的具体化学反应物的性质可以通过元素周期表来理解。当然,将来还会了解到,核外电子排布其实来自于量子物理学这个更加基础的东西,甚至量子物理学本身真正需要掌握的核心实验事实和理论基础也就几条。这样,通过找出来最核心的概念和知识,然后通过掌握线索来学习其他概念和知识,就能够做到事半功倍:学习到的是知识的组织,而不仅仅是知识。用线条编织好的珍珠很容易使用和找到,甚至构成比单颗珍珠更加漂亮的图案,而一颗颗的珍珠是非常难以运用的。学习就是要搞懂每颗珍珠,然后考虑好在编织的时候,放在其他哪些珍珠旁边才更加合适。

另外,所谓的减负,是要对这个机械式学习负主要责任的。减负是一个很高的要求,需要老师深入浅出,看起来教的挺简单但是教的实际上很深刻很启发思考;需要学生们不满足于肤浅,不满足于单个的知识而是通过寻找知识的联系来学习,通过学得深刻使得学习变得系统性变得简单。然而,实际上,减负的操作方式是去掉学习中的难点,尽量让孩子们重复练习简单问题,让平均分在95分以上。于是,学习只能成为赔小心拼更少的失误,只能成为拼熟练程度从而提高解题速度。非常遗憾的是,实际上,大多数时候,难点往往是核心知识关键知识,那些扮演者骨架功能的知识——通过它们就能够撑起来整个学科的知识的大厦,能够把大量的知识联系起来。例如,元素周期表的理解,例如动量和动量守恒,例如WHWM分析阅读和分析写作。

什么是系统科学

通过《系统科学概论》、《系统科学基础》课程的教学,以及最近关于广义投入产出分析的研究,增加了对系统科学的理解,准备做几个报告,并修改《系统科学导引》的书稿。把整体思路记录在这里。

什么是系统科学

系统科学人拿着数学的斧子,用物理的心法,在砍各个学科的木头。有的时候也用一下其他心法。

有时候也提炼一下心法,改造一下斧子。我们也希望通过从砍木头(具体系统的研究)到一般斧子(分析方法)一般心法(学科思想)以及反过来从心法斧子到砍木头的过程来融合不同的心法,甚至发展和建立自己的心法。

作系统科学的报告,以及讲授《系统科学概论》和《系统科学基础》的目的就是让人通过看和学习别人砍木头,体验一下这些斧子、心法。

那系统科学有没有一些自己的心法、斧子甚至木头呢?

自己的心法:从个体到整体,从直接到间接,尽管还是从物理学来的。自己的斧头,概念地图或者说系统图示法。自己的木头,没有。或者说,别人家的木头都是自己家的。

物理学的木头大部分时候是自己家的,有的时候也是别人家的。

数学没有木头,只有木头带来的启发。心法也是自己家的,不是物理学的。不过,有的地方和物理学的心法很有关系。

系统科学的特点:学科融合,从具体系统到一般思想和方法以及反过来,从个体到整体,到直接到间接。

心法的具体内容:

什么是科学

来自于观察和实验的数据决定一切,构造能够解释更多现象的心智模型确实是理论建设和学科发展的目标,但是能够解释数据才是最根本的。心智模型最好是可以理解的,但不是必须的。更多的相容的心智模型构成一个理论。整理出来最基本的基础,从逻辑上演绎出来其他结果,是一个理论的框架结构。

相互作用的核心地位

事物之间的联系使得世界丰富多彩,使得深入的研究成为可能。相互作用有各种体现,需要各种各样的(又相互协调一致的)研究方法。有了系统的个体之间的相互作用,从个体到整体从直接到间接的心法才有了用武之地。

斧子有哪些

矢量算符的概念和矩阵分析、无穷小的概念和微分方程、概率论和随机过程、统计学

其他的斧子:概念地图和理解型学习

砍木头的例子

物理学(用数学的斧子看物理学家的木头,当做我们系统科学的例子):力学,统计力学,量子力学,额外的心法:用统一的理论形式来描述丰富的现象。在这一部分砍木头的例子里面当然,也有一些需要学习和理解,甚至会用的斧子(物理学的概念和一些分析计算方法,例如相变、关联函数、熵、Monte Carlo方法等等),更有运用这些斧子的心法的具体体现。

其他的例子:广义投入产出分析(汉字、科学学、经济产业、交通、灾害风险、国际贸易、食物链、金融、金融和经济)、待补充

这就是科学啊

最近在和小勇还有汪明他们在合作一个交通网络重要道路和节点的度量的项目。我们需要提供一个去掉一段道路或者一个节点以后的某种损失的度量。他们拿到这个度量以后会结合地质或者其他灾害发生的几率,来衡量风险。

当然,直接的度量,就是考虑每一段道路或者节点目前的流量。不过,由于其不再能够承担这些流量,其他的节点和道路上的流量还需要做相应的调整,因此,不能仅仅考虑直接流量。那么,如何来度量这个直接加上间接的流量效益呢?

最关键的就是这样的流量损失会重分配或者说传播。这是讨论这个问题的第一个关键点:传播,或者说直接到间接。

第二个思路上的关键点是假想地去掉一个(或者多个)单元的思想——Hypothetical Extraction Method (HEM)。

有了这两个思想和看问题的角度,我们可以考虑如下具体的算法:

  1. 用最短距离重分配,维持外界对系统的总需求不变的情况下,对比各个路段和节点的新流量和旧流量。
  2. 用PageRank算法来看看,去掉路段或者顶点之后,对比PageRank矩阵的本征矢量。这样做有间接效益,但是,意义不明确。
  3. 用投入产出分析加上HEM。这么多方法,用哪一个呢?
    1. 传统投入产出+HEM。数据本身只有道路系统和流量,没有外界。这个简单,把每个节点的总输出看做一个叫做“社会”的外界传播过来的流量,把每个节点的总接收到的投入看做一个叫做“社会”的外界从系统里面取走的流量。因此,这个HEM描述的是在外界和系统的关系不发生改变的情况下,去掉一个节点或者一段道路,系统的应对。
    2. 目标外界HEM。按照
      \begin{align}
      X = \left(1-F^{\left(-k\right)}\right)Y^{\left(k\right)},
      \end{align}
      当\(Y^{\left(k\right)} = x^{k}_{j}\)的时候,计算出来的\(X\)就是\(x^{k}_{j}\)在系统里面传播的效果。于是,\(\sum_{ij}\left(1-F^{\left(-k\right)}\right)_{ij}x^{k}_{j}\)就体现了\(x^{k}_{j}\)的乘数效应。于是,正好就能够用来度量路段\(kj\)的重要性。

    3. 本征向量HEM。一个投入产出矩阵的最大本征值对应的本征向量代表了这个生产系统的最优投入结构——每一个部门最好就需求这么多或者供给这么多。在交通问题里面,这就代表最好每一个节点上的总进或者出的客流的最有配比。当然,实际客流的结构不一定就是这个最有客流的结构。于是,这里相当于,仅仅从道路结构还有目前的客流分配方式来考虑,去掉一个节点或者一段道路前后,这个最优配比的变化。

除了描述单一路段或者单一节点的影响力,我们还可以考虑同时去掉两个路段或者节点的影响力的问题,以及这样的影响力和两者分开去掉的影响力之和的对比。很有可能,我们能够看到干涉效益——两者之和不等于同时去掉两者的效益。更进一步,这样的干涉效益,是不能通过仅仅考察直接流量来反应的,是我们这个方法特有的。

能够找到一个问题,同时三种方法都可以自然地用上,也是不容易的。这三个计算分析分别反应了道路和节点不同意义上的重要性。

除了这个具体工作,通过这个工作,我们还发现:

  1. 传播很重要(PageRank或者投入产出或者更一般的流平衡分析)
  2. 去掉一个点或者边来讨论重要性有意义
  3. 去掉两个点或者边可以反映更深刻的干涉效益。

这些是具有一般意义的。要把它们在各种系统里面实现,来解决具体系统的问题。从具体问题到一般方法,再到更一般的视角或者思想,然后回到更多方法,更多具体系统。这就是科学啊。

原则上,广义投入产出研究的四个方法——开放系统矩阵逆、封闭系统右本征向量HEM、封闭系统左本征向量HEM(也就是PageRank和PageRank HEM)和封闭系统目标外界HEM,按照所面对的系统是开放的还是封闭的,只能采取相应的方法。

但是,通过下面的手续(这个手续受这个交通系统的具体工作的启发),无论面对的系统是封闭还是开放系统,这四个分析方法完全都可以使用了。如果是开放系统,通过补充上那个作为外界的系统的数据,就成了封闭系统了。如果是封闭系统,通过加入一个假想的“外界”——把每一个节点到其他节点的出流当做从“外界”传过来的,把每个节点接受其他节点的入流当做到“外界”中去。这样系统就成了一个处处守恒的系统了。然后,把这个“外界”当做开放系统分析方法中的外界,就可以把这个封闭系统改造成开放系统来做后续分析了。

教学相长

系联性思考(”See through connections”是我的邮件签名档)在我的研究工作和教学中有独特的地位。甚至它也是系统科学的核心思想。

系统科学还没有发展成熟。它有自己的思想——从个体到整体、从直接到间接、从具体系统到一般分析方法以及反过来从一般方法到具体系统(跨学科特性),有一些具有一定一般性的分析方法,没有自己的核心方程和理论,没有明确的学科知识基础,甚至没有一个好的界定(例如,有很多人把它看做应用数学,例如运筹学和控制论,的分支,或者反过来把应用数学看做系统科学的一部分)。一门仅仅有思想和不成体系的方法的科学是不能称作一门科学的。

于是,当我开始教授《系统科学基础》这门课的时候,第一个要解决的问题,就是思考什么是系统科学以及如何给学生说明白什么是系统科学。内容要体现系统科学的核心思想,还要通过具体的研究工作来体现,最好还要整理出来一个现有分析方法的体系,找到这个体系的知识基础并且进一步给学生整理一下这些知识基础。

于是,我发现,我必须做两件事情:从各种具有系统科学思想的研究工作中思考什么是系统科学,把系统科学的分析方法成立出来体系并且找到最少量最必要的知识基础。当然,整理好了之后,怎么跟学生分享,也是一个问题——不过,神奇的是,这个问题的答案还是在系联性思考。

第一件事情需要把不同的研究工作的共同点找到,有的时候还需要把各自的特点也找出来。这个也就是把不同的研究工作联系起来。第二件事情,需要把具有一定一般性的研究方法提炼出来——例如用网络来简化描述相互作用、相变的概念和分析技术(例如关联函数),并且把这些方法的知识基础整理和精简出来,突破学科和课程的限制,做到融会贯通。

第一件事情在我的研究工作上的直接影响就是每一个研究工作我会问:体现了系统科学的核心思想的哪一些,用到了和发展了哪一些方法。于是,跨学科性和从个体到整体从直接到间接确实成了我的研究工作的中心思想,不管所分析的具体系统是什么。第二件事情,再加上我们汉字结构和汉字学习的工作,促使我开始思考“精简教育”——有些东西不学不太影响对整个学科的理解而有些东西的学习顺序需要优化,并且找到了实现它的工具——概念地图。进而,对于教学的目的和学习的目的,也做了深刻的思考。我们学习是为了创造和创造性地使用知识,但是不是记住知识。对于创造和创造性地使用知识来说,最重要的事情是理解和内化知识形成一个相互联系的知识的体系。于是,我发现,还是系联性思考。

这个我自己身上的例子很好地体现了教学相长,教学和研究工作相互促进,教学和我自己的思考和理解相互促进。当然,在具体的知识层面的例子,传授这个具体知识导致我自己的理解更深刻更加融会贯通,也有。不过,这个就是教学相长的小小侧面了。

把我自己身上的这个例子记录下来,留给我自己进一步体会,还有其他人——尤其是年轻老师——参考。

不过,现在基本上有了一些能够体现学科思想和研究方法的具体例子,跨学科的融合了的知识基础也差不多已经成体系。因此,从我自己的角度来说,写完这本教材就可以教其他课去了。我准备先建设几年的《学会学习和思考》,然后,去上《数学模型》。

另外,整个过程是一个自加强正反馈过程:我用自己对系统科学和教学学习的思考为主线来整理和教授系统科学,整理和教授系统科学使得我对系统科学和教学学习的思考更加明确。这个正反馈,尽管是好事,有可能掉入一个局域最值的陷阱——再也看不见那些不在自己眼睛里面的东西,由于现在的眼睛只看那些觉得会进入眼睛的东西。这个问题,一方面需要通过看看和听听其他人怎么说,一方面,也只有等到过了这个欣赏最值的阶段,以后再来回顾反思了。