《系统科学导引》序——方福康

以下是方老师给《系统科学导引》写的序。非常值得看看,想想,有除了本书序之外的价值。提前拿出来跟大家分享。

《系统科学导引》序

方福康

看到吴金闪教授这本“系统科学导引”,明显地感觉到与众不同的地方:书名不叫导论,也没有用引言这一类标题,而是用了“导引”这样一种开放性的提法。这个提法明白地告诉读者,本书要通过学习引导你考虑一些系统科学的基本问题,告诉你在哪些科学知识的基础上去思考,如何去思考。从本书的内容和结构来看,很明显的存在着三条主线,即系统科学的发展进程以及其主要内容和成就,然后就是用去本书大量的篇幅论述作为一门科学其发展的理论基础,特别是数学和物理在建立一个理论体系中的作用,再者就是对如何进一步发展系统科学的思考。其实,这一部分发展系统科学的思想是贯穿全书的,因为“导引”的目的就是要引发读者的思考,特别是面对系统科学这一新兴学科所涉及的未知世界。

在一本篇幅有限的教材里,要完成这三项任务是困难的。这里显出吴金闪教授与众不同的地方,他志存高远,宣称要用最少的语言、用最核心的概念来阐明问题。这是一项挑战,考验的是吴金闪教授对系统科学这一学科产生和发展理解的深度,考验的是对于系统科学赖以发展的科学基本理论掌握的程度和高度概括的能力。当我们阅读其力学和量子力学的二章,可以明显地感到吴教授为实现他的诺言所做的努力。至于系统科学的展开和后续发展的内容,则由于这门学科发展的迅速,内容十分广泛,不同学者会有他本人的取向和偏爱,只要把系统科学的特点予以说明就可以了,尽管会具有浓厚的个人色彩。所以,对于吴金闪教授这本“导引”教材,如果仔细体会,无论对于系统科学发展的历程,发展这门学科所需要的理论储备以及如何去发展这门学科,都会受益匪浅,而对于初涉系统科学的青年学子来说,更是能启迪他们的思维,更快更好地进入到系统科学这一广阔的领域。

作为一篇序言,也是对应吴金闪教授“导引”二字的提法,下面,沿着序言中所提出的三个问题,提出一些看法,作为一种意见参与讨论,也可以算作序言的一个延伸部分。

(一)

在 2015 年北京大学的毕业典礼上,有一个著名的演讲,当时身为生命科学学院院长的饶毅教授,代表学校教师向毕业生致词。总共 1500 多字的讲话,获得了多次热烈的掌声。对于我这个读者来说,看重是演讲中的二句话,“从物理学来说,无机的原子逆热力学第二定律出现生物是奇迹”,“从生物学来说,按进化规律产生遗传信息指导组装人类是奇迹”。

一位生物学家,能够对科学的前沿作如此的概括,确实能使人感受到他的功力。实际上,所谈到的第一个奇迹涉及到的是现代系统科学实质性的开始。这里的要点是逆热力学第二定律的提法,当学者们认识到在逆热力学第二定律的后面,还存在着一幅崭新的画卷,此时一个新的科学世界的历程就开始了。在这里有二个学者是需要提到的,一位是 N. Wiener,他最早对逆热力学第二定律的世界有清晰的理念。他指出“我们所做的是在奔向无序的巨流中努力逆流而上,否则它将一切最终陷于热力学第二定律所描绘的平衡和同质的热寂之中……我们的主要使命就是建立起一块块具有秩序和体系的独立领地……我们只有全力奔跑,才能留在原地”[1] 。另一位要提到的学者是 I. Prigogine,他给出了逆热力学第二定律的物理内容和数学形式。这就是耗散结构理论。这个理论冲破了热力学第二定律的限制,指出对于开放系统,在远离平衡的条件下,能够形成一种相对稳定的结构,称之为耗散结构。Prigogine 先是用实验确切地在流体、化学反应二个系统中让世人看到了这个相对稳定的耗散结构。再者,他证明了在热平衡的线性区是不可能出现这种结构的,一定在远离平衡的非线性区,才会有相对稳定的,称之为耗散结构的出现。然后,在论证和讨论了耗散结构的各种性质特点之后,Prigogine 和他的 Brussels 学派,发展了一套数学理论,来定量地描述耗散结构形成的过程、性质和特点,并将其应用到各具体系统和领域,特别是出现了被称为奇迹的生物。耗散结构的出现,包括实验和他的理论体系,使得突破热力学第二定律的想法从议论变为科学。

在此之后到现在的 40 年间,无论从研究的领域,和理论计算的方法都有很大的发展。研究的领域,从最初 80 年代由 Science 提到的 7 个方向,发展到 21世纪初,由 Hoker 的归纳,有了 12 大门类,28 个学科领域,涵盖了生命、神经、人类学、社会、经济、军事、管理等一切方面。研究的方法,也从原初的数理方程,展开到应用计算机、网络、大数据等现代信息工具。面对着系统科学这样一个庞大的体系,包括这门学科的兴起、发展的历程、多种数学工具的运用、涵盖内容众多的学科体系、以及这门学科仍在迅猛发展的势头,要在一本篇幅有限的著作里,要诠释这样一件科学事件是不容易的。但在,吴金闪教授这部著作中,可以看到,他以自己独特的风格完成了一个很有特色的答案。

然而系统科学或复杂性研究目前的进展并不令人满意。虽然有众多研究领域的展开,在研究工具上,网络和计算机发挥了强大的威力,应用于各种具体系统也取得令人欣喜的结果,但是对复杂系统基本规律的探索并没有取得实质性的进展,各个研究领域,各种研究结果,还是停留在己有的理论基础上,只是在外延上获得发展和展开。像饶毅教授提出的生物学奇迹的探索,涉及到进化规律、遗传信息、组装人类这样一些实际上是复杂性研究核心理论问题的研究,并没有获得理论上的突破,还有待于系统科学的未来。

(二)

吴金闪教授这本“导引”著作的另一个显著特点是认认真真的讨论了系统科学所涉及的科学基础。系统科学作为 21 世纪的前沿学科,讨论的完全是一堆全新的复杂系统对象,从数理学科的角度来观察,是从未系统地处理过的。而从耗散结构理论开始,复杂系统的研究显然已经进入到了一个新的阶段,即用数理科学的工具和方法,来获得科学的定量化的结果。这样的研究,与早期的系统科学研究如一般系统论那样定性的讨论是完全不同,在这里需要的是实实在在的科学理论概念和处理实际问题的数理方法。因此在教学内容的选择上,既要照顾到在科学历史上那些行之有效,有成功经验的数理科学方法,又要适当地介绍,随着复杂性研究工作的进展,在近些年来新发展起来的工具和方法。这二方面都有丰富的内容,而要在一个篇幅有限的教材中完成这二项硬任务是考验吴教授的理论基础和学术功力。吴金闪教授没有迴避这个矛盾,他宣称要用最少的文字语言来介绍这些最经典的理论,而实际上他是很出色地完成了这个任务。在理论物理学的经典科学库存中,吴教授选择了力学、量子力学、和统计物理三门课程。其中量子力学是最能体现业务实力的,我们可以从吴金闪教授用最少语言的描述中,看看他是如何处理量子力学这门学科的。

量子力学作为微观世界的奠基之作,与相对论一起,被称为 20 世纪巅峰的成就,独领风骚达半个多世纪。但是量子力学的核心内容只不过是少数几条基本原理(常见的提法是 5 条基本原理)。正是在量子力学基本原理的基础上,搭起了处理各类微观客体运动规律的理论框架。不仅如此,在精妙的数学描述下,量子力学的基本内容获得了十分抽象而又十分精确的数学表述。由量子力学的物理内容所揭示的微观粒子的描述,不过是 Hilbert 空间中的一个矢量,或者说是在这个空间中所描述的一个状态,算子作用于矢量,引起状态的变化,而形成运动方程。Hilbert 空间中矢量的变换或描述状态的方式变换,构成了表象理论。用物理语言颇为费力的一些内容,在精巧的数学语言下变得简单、精确。这种深刻的物理思想和精巧的数字语言的结合,正是揭示物质运动基本规律最有力的工具。在吴金闪教授所写的有关量子力学的章节,可以看到他用最少的语言而做的最大的努力,竭力将量子力学的物理抽象和涉及的数学语言传递给读者。类似的,在力学这一部分,在极有限的篇幅中,不仅介绍了牛顿力学,而且要讲到分析力学。综观全书,吴金闪教授始终强调物理观念和数学思想的重要性。这样的强调不仅是为了继承,更是为了发展,为的是建立一个复杂系统所需要的理论,作好必要的理论储备。

(三)

创新,是一门学科成长、壮大、发展的根本之道。系统科学的发展需要创新,而且是不断创新。目前对系统科学最需要的,是对于复杂系统这个未知世界基本规律的掌握,并由此进一步建立起各种运算体系并解决具体课题。吴金闪教授的著作将创新的理念贯彻全书并指出了必须注意的要点,一是要具体化,另一项是联系、联系、再联系。对于具体系统的关注,各家会有所不同,但是总体上的目标是探索和发掘复杂系统这个未知世界的基本规律。

首先会想到的问题,是世间事物的运动形式和发展规律,不应该只停留在物理世界的物质和能量的理论框架内,特别是涉及生命、神经、人类、社会这样一群复杂系统或更确切的说是复杂适应系统。信息在系统演化和发展过程中的作用己十分明显和重要。所以在理论框架上,应该建立起一个物质、能量、信息的三元素世界,在这个更宽的框架内描述他们的状态,发掘其运动规律。但是在我们的科学宝库中,并没有现成的含有物质、能量、信息三元素世界的理论框架,物理学是 20 世纪影响较大的一门学科,涉及了微观领域的各个部门和高速运行的客体等。但是,在物理学中只讨论物质和能量,不涉及信息。另外一门专门讨论信息的学问——信息论,则是专门研究信息传递过程的,从信息源、信道,到信宿,讨论的是信息如何准确传递,如何解决抗干扰。在信息论中,也没有涉及物质和能量的相互关系。所以在现有的科学库存中,信息与物质没有现成的交集,更谈不到信息与物质相互作用的方式与内容。在这个领域内,无论是理论概念,或是计算方法,目前还没有形成被大家所公认的并可被大家接受的理论成果。

尽管信息与物质的相互作用其规律还没有被充分揭示,但已经有很多学者和实际工作者关注和讨论了信息的重要作用,并做出了许多有意义的启示,为进一步解决这个问题提供了准备。早期有生物学家汤佩松,后来钱学森、徐光宪也有过论述,周光召还提出了信息与物质的相互作用,在社会系统中会起主要的作用。之后,随着对信息的研究展开,徐光宪先生提出了人工信息量的概念,并进行了量值的初步的估算。不同于依靠生物自然进化而形成的自然信息量,人工信息量是指人类由于有了语言以后所生成的信息。徐先生的估算人类自然信息量的总量为10的35次方 bit 量级,而全球人工信息总量估算是 10的20 次方 bit 量级,且每年约以30%的速度增长[2]。徐先生的人工信息量的概念实际上是为人类建立了一套完全不同于生物自然进化而形成的信息系统,不妨称之为第二信息系统。这套建立在语言发展基礎上的人类所特有的第二信息系统,在人类的发展壮大和人类社会的形成和进步起到了决定性的作用。首先,由于语言的产生和第二信息系统的形成使人类与动物界彻底分离开来,逐步成为自然界的主宰[3,4]。然后,由于第二信息系统的不断发展与完善,并与物质生产、社会体制相互结合逐步完善,使得人类从一些弱小的种群,发展壮大成为强大的族群,直到形成社会和国家,成为在地球上目前最为强大的生命体。

信息与物质相互作用的重要性是清楚的,但是迄今为至还没有一个信息与物质相互作用关系的数学表述形式,需要作一些试探。遵循着达尔文所指出的语言对人类发展的关键作用,最近我们讨论了语言作为信息对人脑这类物质的发展过程。在实验数据的支持下,我们得到了这一类包含信息物质运动的数学表达形式,可以用一个非自治的动力方程来描述,其中信息与物质的相互作用是方程中含时间$t$的驱动项。这样的一个计算结果仅是一个单例。它虽然给出了信息与物质相互作用在这个具体问题中的表达式,但并不一定显示出是一种普适的形式,因为信息与物质相互作用是复杂的,存在多种表现形式,现在我们还未能窥测他的全貌。但无论如何,在这里我们找到了一种具体的信息与物质相互作用的数学表述形式及其所反映的科学内容,希望能成为一个好的开始,在探索复杂系统的基本规律上获得进步。

方福康
2018年4月

参考文献
[1] Norbert Wiener, I Am a Mathematician: The Later Life of a Prodigy, 1964, p.324.
[2] 徐光宪,化学分子信息量的计算和可见宇宙信息量的估,中国科学 B 辑:化学,2007年,第 37 卷, 第 4 期:313-31.
[3] 达尔文,《人类的由来》,第三章,1887.
[4] Martin A. Nowak,Evolutionary Dynamics,Harvard University Press,2006.

《系统科学导引》图书和MOOC课程上线了

经常听到“这是一个系统工程”,什么什么“是一个系统性问题”这样的说法,来形容某件事情或者某个东西比较复杂,有的时候也意味着这个事情或者这个东西应该用某种适合“系统性问题”的方式来解决。如果这个说法有意义,其实就要求我们就必须先有一些这样的解决方法。我们有吗?甚至,我们有什么样的问题是系统性问题的一个比较科学完整的说法或者定义吗?如果这些都没有,那么,当我们说什么什么是“系统工程”是“系统性问题”的时候,也就是“我们无能为力、问题太过复杂”的代名词。

作为科学家,我们显然不能满足于这样的代名词:系统科学就是实在太复杂的我们没有办法的研究对象的代名词。因此,《系统科学导引》MOOC课程和书的最主要的目的就是讨论什么是系统科学,系统科学有哪一些比较有自己学科特点的思维方式和分析方法,有哪一些有特点的研究实例。我们也稍微会回答一下,需要哪些数学物理的知识、思维方式和分析方法的基础。

本课程和书的基础是我在北京师范大学系统科学学院开设的“系统科学概论”和“系统科学数理基础”两门课。为了能够让学生体会到什么是系统科学,并且从欣赏研究实例和做练习中学会一些系统科学的思维方式和研究方法,我必须自己先有一个反映什么是系统科学的概念体系以及相应的研究实例的体系。这各课程和书就是这样一个不断地挑战我自己对系统科学的认知,不断地整理体系的所得到的一个结果,不能算是这个学科的一个完整的整理。经过前人的多年积累以及我自己七年的课程建设,本课程和书就是我抛出来一块“什么是系统科学”的砖,来引出来玉或者更多的砖。

系统科学就是具有系统特点的科学。那么,什么是科学,系统特点又指的是什么?这些就是本课程和书要通过具体研究工作的例子来回答的问题。除了对交叉科学和复杂性研究感兴趣的研究者、教师、学生,以及把物理数学学活的学习者,本课程和书还强烈推荐给对科学感兴趣的一般读者。相信我,你可以看懂的,前半部分“系统科学概论”,完全可以当做科学普及来看。

课程和书的特点:

  1. 从科学而不是哲学和数学的角度来讨论系统科学
    • 批判性思维、系联性思考、可重复性V.S.可证伪性的讨论
    • 科学(物理学、系统科学)和数学的关系
    • 赏析大量的具体科学研究工作来体现什么是系统科学
  2. 系统科学的思维方式和分析方法的提炼总结
    • 系联:从孤立到有联系,从直接到间接,从个体到整体
    • 分析与综合或者说还原论和整体论的结合
    • 交叉性:从具体问题中来,到具体问题中去,留下可能的一般性理论

资源列表:

感谢北京师范大学研究生院、北京师范大学系统科学学院对课程建设和图书出版的支持。感谢课程和图书的编辑们的付出。

第二届系统科学大会《系统科学导引》专题讨论邀请

各位老师,

基于北京师范大学系统科学学院这些年的系统科学专业的教学积累,以及我自己这几年的教学经验,我写了旨在传播什么是系统科学的基础教材《系统科学导引》。教材已经在出版过程中,预计第二届系统科学大会之前可以印刷出来。乘着今年系统科学大会(2018年5月12-13日)的机会,我组织了一个基础教材讨论的会议,邀请大家来参加这个专题讨论。

这个专题讨论会以《系统科学导引》为基础(我会提前发送电子版——在这里下载http://www.systemsci.org/jinshanw/wp-content/uploads/sites/2/2018/02/InvitationtoSS.pdf——和纸质版给参会人员,并在这个专题讨论做一个这本书的介绍),但是不限于关于本书的思想、内容和形式。如果有其他合适的值得当作系统科学基本教材的书籍分享,也非常欢迎。

投稿非常简单:在第二届系统科学大会会议主页(http://iss.amss.cas.cn/cssc2018/)注册以后,在投稿系统内提交稿件就行。稿件内容:如果你有具体内容(关于本书的或者其他系统科学基础教材的)要分享,则请准备一个简短的摘要;如果你没有特别具体的内容就是要提关于本书的建议和意见,则请在摘要写上“参与讨论”即可。

投稿截止时间:2018年2月28日。

专题信息:
————————————
专题代码: utghK4 (请在投稿的时候选择“Invited Session Paper”,并在投稿表格中填入这个代码)
Title: 系统科学基本教材建设讨论,以《系统科学导引》为例
Corresponding organizer: 吴金闪 (51362)
Organizers with PINs: 吴金闪 (51362)
Abstract:
《系统科学导引》已经在出版过程中。在这个专题讨论中中,我将介绍这本书的主要内容、设计思想,以及讨论一些例子,来跟大家展开对这本书的讨论。在此之前,我会把电子版和纸质版的书送到感兴趣的参会者手上。以这本书为例,这个小组讨论将展开对系统科学的基本教材建设的讨论。除了对本书进一步修改、推广的意见和建议之外,这个小组讨论还争取能够在本书基础上形成本学科的基本教材的撰写计划。

附《系统科学导引》一书基本信息:
这本书旨在从大量具体研究工作的案例中总结提炼什么是系统科学,并且按照这个总结来组织研究工作、准备系统科学的数学物理基础。对于一个学科的发展和成熟,这样的总结是有必要的。但是,在这个什么是系统科学,以及哪些研究工作和数学物理基础应该算作系统科学,是需要讨论并且很难达成一致的问题。

书稿可以在这里下载:http://www.systemsci.org/jinshanw/books/

下面是本书封面上阐述的什么是系统科学:

联系\(^{1}\),联系\(^{2}\),联系\(^{3}\)
从具体系统中来,到具体系统中去
从孤立到有联系,从直接到间接,从个体到整体
More is Different, More is The Same(一片两片三四片,构成系统出涌现;五片六片七八片,飞入系统都不见)

Keywords:
《系统科学导引》、学科建设、教材建设

————————————

期待与大家相会系统科学大会,并得到大家的指导。谢谢。

吴金闪

研究和教学中的数学建模

提出问题,把问题转化成一个数学问题是科学研究中非常非常重要的两步。当然,解决问题和检验,也是重要的,不过,我认为比不上前者。把一个问题用合适的数学结构来表达,需要考虑这个问题内在的结构——也就是这个问题里面有哪些关键因素,这些关键因素之间有什么关系,这个系统的状态如何描述,如果有变化呢,则还关心如何变化、什么导致的变化。而这一步,传统上,叫做数学建模。

采用什么样的数学结构来描述所面对的系统的状态,这是数学建模要解决的第一个问题。理想情况,我们希望这个表示是忠实的:任何这个系统的状态都可以用这个数学结构来描述,任何这个数学结构的状态都在所面对的系统上找得到对应的状态;任何一个对这个状态的操作,正好对应这个数学结构上的一种映射;任何一个这个数学结构上的映射,正好对应着对这个实际系统的一个操作。当然,这样的理想情况一般是做不到的,这个时候,我们只要在我们关心的范围内满足上面的忠实性就可以,甚至只要近似地满足忠实性就可以。

于是,这个时候,我们自然要通过了解系统的状态,以及可能的对这些状态的操作,来寻找合适的数学结构。另一方面,我们也必须考虑,某一个在这个数学结构上能够做的计算,对应着什么样的实际系统的性质或者操作。

实际上,我认为,大多数时候,理论科学家,尤其是理论物理学家、系统科学研究者,都在做这样的数学建模的事情。因此,我也打算什么时候来建设一门数学建模的课程。实际上,这个帖子就是供我自己慢慢整理,形成一个这样的课程用的。当然,也非常欢迎有人给我提供线索。

比如说,量子系统的数学模型——以Hilbert空间矢量为基础的量子力学,就是这样的数学模型的极好的例子。当然,经典力学的质点——刚体——弹性体——流体也是,甚至背后的确定性方程——随机性方程也是。不过,有一些可能需要比较多的数学和物理的基础,不一定适合当做数学建模的例子。

网络科学的例子应该有很多,例如网络上的传染病模型,以及我们自己的汉字学习和检测的工作,广义投入产出分析的工作等。另外,昨天偶然得到一个很好的小例子:一个学生在计算地铁网络在攻击下的抗毁能力,主要通过攻击之后剩下的最大连通集团的大小来当指标;这个时候,一个自然的问题就是,为什么选择这个指标是有实际意义的,在实际问题中意味着什么,如果要让这个指标有实际意义我们需要做什么假设,这个假设是否具有合理性。在实际问题中,这样的思考往往就能够创新性的来源,并且这也是任何数学模型必须解决的问题——为了这个表示具有合理的“忠实性”,我们的假设是什么,数学结构和实际对象之间的联系是什么。

有了这个大原则——数学建模就是找到能够忠实或者近似忠实地表示实际系统的数学结构,我们还有一些更小的典型思维方式。比如说,数学建模更多的是艺术,而不是技术,尽管我们会非常努力地技术化一般化。因此,在教和学数学建模的过程中,就必须采用欣赏、临摹、创作的方式,而不是做大量的习题求解的方式。再比如说,数学建模不应该按照模型解法来分类教学,而是按照建模的思想,建模所需要的思维方式来做教学。更多的其他思维方式以后再整理,或者等遇到合适的例子再总结在这里。

基于这个数学建模的典型思维方式的重要性,在系统科学和物理学导论里面,都应该增加一小节关于数学模型的介绍、讨论和欣赏,除了专门开设数学建模课程之外。其实,这个小节比较简单,只需要用之前讲过的例子,但是从数学模型的角度来再一次欣赏和讨论一下就可以,而且可以放在数学和科学的关系那个大标题下面。

顺便,数学模型应该由科学家来教,而不是数学家。当然,非常厉害的数学家是能够看到数学和实际问题之间的联系的,也是受实际问题启发的。这方面可以看看Gowers的《Mathematics, a very short introduction》,或者丘成桐、陶哲轩对这个问题的讨论。不过大多数数学家就会进入某一个已经数学化形式化的问题里面去做。这也是由数学的特性决定的——严密的逻辑演绎在数学里面的特殊重要性:不想科学还可以实践检验,数学就只能检验内在自洽性,于是自然也就更强调严密。因此,这个不是数学家或者数学的缺陷,而是自然使然。那么,谁来教数学建模?科学家,有具体领域背景的科学家和没有具体领域背景的计算机科学家,一起来完成。

概念网络上的高效学习方式

对于一个的集合\(L=\left\{1,2,\cdots, i, \cdots, \right\}\)中每个个体的学习,如果给定了每一个学习对象的难度\(\vec{C}=\left\{c_{i}\right\}\)和价值\(\vec{V}=\left\{v_{i}\right\}\),我们的学习顺序\(\vec{S}=\left[s_{1}, s_{2}, \cdots, \right]^{T}\)的问题是这样定义的:

  1. 给定\(\vec{S}\)之后在第\(m\)步的累计成本为
  2. \begin{align}
    C\left(\vec{S}, m\right) = \sum_{j=1}^{m} C_{s_{j}}
    \end{align}

  3. 给定\(\vec{S}\)之后在第\(m\)步的累计价值为
  4. \begin{align}
    V\left(\vec{S}, m\right) = \sum_{j=1}^{m} V_{s_{j}}
    \end{align}

我们希望某种意义上——例如在学习过程中的任何一步或者都某个具体的第M步——成本最小,价值最大。

如果这些个体之间相互没有联系,则我们没有特别好的巧妙的办法,就是一个简单的优化问题。例如,我们可以先考虑两种极限:成本完全一样或者价值完全一样的情况。例如,前者,这个时候对于任何的\(\vec{S}\),\(C\left(\vec{S}, m\right)\propto m\),我们只能考虑优化\(V\left(\vec{S}, m\right)\)。于是我们发现,按照价值的递减顺序,也就是选择价值大的来先学就好。这时候能够保证在任何一步\(V\left(\vec{S}, m\right)\)都是最大的。更一般的成本函数和价值函数,应该,运筹学之类的学科也有答案了。如果没有,也无所谓,交给运筹学去解决好了。

更重要的问题是,一旦个体之间有联系,会如何?也就是说,一旦一个字\(j\)的学习难度会随着相联系的字\(i\)的学习状态(是否已经被学习到)而改变,这个时候,如何解决上面的优化问题。

那,我们先来看学习成本会如何变化。本质上,这个变化机制当然应该来源于实际学习过程。这里,我们先给出一个描述框架和大概描述。

我们认为,概念之间的逻辑关系,可以做为关联的客观表现。以汉字为例,汉字之间通过结构关系相互联系,这一点是客观的(尽管繁体字和简体字在汉字之间是如何从结构上联系起来的这一点上不一样。先考虑例如仅仅简体字)。例如:木——林——森,人——从——众,水——冰——淼,(木,一)——本,(人,本)——体。当然,这个客观的结构联系是否就能代表逻辑联系,是有待讨论的。也就是说,在汉字集合上,存在着一个逻辑关系网络,网络的每一条边代表上面举例中的一个字\(i\)(更简单的字,处在更底层)成为另一个字\(j\)(更复杂的字,处在更上层)的一部分这样的结构关系\(A=\left(a^{i}_{j}\right)_{N\times N}\)(这个矩阵的标记采用的是投入产出习惯的符号,从\(i\)投入到\(j\)。)。这个结构关系上面叠加了一层逻辑关系。这个逻辑关系可以用来改变学习成本。再次强调,这仅仅是一个理想模型。记每一个概念的当前状态——学到或者没有学到——为\(\vec{K}\left(t\right)\)或者每一个概念\(i\)的状态\(k_{i}\left(t\right)=\pm 1\)。例如,我们可以定义每一个字在当前时刻的学习成本为一个由网络结构和网络上各个顶点的当前时刻的状态决定的函数\(c_{i}=c_{i}\left(A,\vec{K}\left(t\right)\right)\),而\(\vec{K}\left(t\right)\)实际上是学习顺序\(\vec{S}\)的函数。于是,学习成本\(C\)和学习成果\(V\)都是学习顺序\(\vec{S}\)的函数。当然,这个函数由于有网络关系,比完全没有联系的情况要复杂。但是,给定网络\(A\),那么\(C\left(\vec{S}, m; A\right)\)和\(V\left(\vec{S}, m; A\right)\)就是完全确定的函数,就可以讨论优化问题。下面给出一种我们使用过的成本决定机制。

      
  1. 认识下层字\(j\),以一定的概率降低上层字\(i\)的学习成本,\(\omega^{j, \left(\uparrow\right)}_{i} \),和结构矩阵的元素\(a^{j}_{i}\)有关。原则上可以不遵循结构矩阵,来自于其他实证关系。做为一个简化模型,我们可以假设\(\omega^{j, \left(\uparrow\right)}_{i} = 0 \mbox{或者} a^{j}_{i}\)。更复杂的需要考虑理据性。
  2. 认识上层字\(j\),以一定的概率降低下层字\(i\)的学习成本\(\omega^{j, \left(\downarrow\right)}_{i} \),和结构矩阵的元素\(a^{i}_{j}\)有关。原则上可以不遵循结构矩阵,来自于其他实证关系。做为一个简化模型,我们可以假设\(\omega^{j, \left(\downarrow\right)}_{i} = 0\)。更复杂的需要考虑理据性。
  3. 有了这个改变学习成本的概率,我们再来看学习成本改变的值。采用递归定义:
  4. \begin{align}
    c_{i}\left(t\right) = \left(1-k_{i}\right) \cdot \left[\Pi_{u}\left(1-k_{u}\omega^{u,\left(\downarrow\right)}_{i}\right)a^{i}_{u}\right]\cdot \left\{1+\sum_{d}\left(1-k_{d}\omega^{d\left(\uparrow\right)}_{i}\right) \cdot \left[1+\left(1-k_{d}\right)c_{d}\left(t\right)\right]a^{d}_{i}\right\}.
    \end{align}

第一项的含义是,如果字\(i\)本身是学习过的,也就是\(k_{i}=1\),则\(c_{i}\left(t\right)=0\)。第二项的含义是,每一个字\(i\)上层字\(u\)如果学习过,则会成比例地降低字\(i\)的学习成本。第三项表示字\(i\)的学习成本包含三项——整体组合成本(按照单位一算),有几个子结构,每一个子结构如果不认得的话成本的累计。同时,如果下层的字学习过,则整体上会按照降低成本的几率再次降低子结构的成本(那时候子结构自己已经认得了,没有学习成本了)。由于采用了递归定义,整个网络不能有循环。其次,递归的每次都是从当前需要算成本的开始,然后往下计算——递归表达式中仅仅出现了往下的顶点的学习成本。

我们在Efficient learning strategy of Chinese characters based on network approach中的成本更新机制实际上就是上面的一般表达是的简化模型:
\begin{align}
c_{i}\left(t\right) = \left(1-k_{i}\right) \cdot \left\{1+\sum_{d}\left[1+\left(1-k_{d}\right)c_{d}\left(t\right)\right]a^{d}_{i}\right\}.
\end{align}
就算在这个简化机制下,我们也没有精确求解开这个优化问题。而是,基于对问题的理解,提出了一种近似算法:顶点权分配算法——后来我们发现实际上是一种广义投入产出分析计算。

现在,我们有了一个结构网络\(A\),两个这个网络上的逻辑关系\(\Omega^{\left(\downarrow\right)}, \Omega^{\left(\uparrow\right)}\),有一个学习顺序\(\vec{S}\),一个依赖于学习顺序的成本更新机制\(M\left(\vec{S}\right)\left|\right._{\vec{C}\left(t-1\right)\rightarrow \vec{C}\left(t\right)}\),以及初始条件\(\vec{C}\left(0\right)\)。还有一个价值变量\(\vec{V}\left(t\right)\),或者更复杂一点一个可能依赖于学习顺序的价值更新机制——这里当做价值不更新。

问:什么样的学习顺序\(\vec{S}\),会使得整个学习过程、在这个过程中的某个时间点m、或者在某个时间点m之前的过程中的学习效率最高——例如用平均每个字的学习成本来衡量。也可以为了学习到给定学习对象集合\(T=\left\{t_{1}, t_{2}, \cdots\right\}\)里面的所有的字的整体成本。