这就是科学啊

最近在和小勇还有汪明他们在合作一个交通网络重要道路和节点的度量的项目。我们需要提供一个去掉一段道路或者一个节点以后的某种损失的度量。他们拿到这个度量以后会结合地质或者其他灾害发生的几率,来衡量风险。

当然,直接的度量,就是考虑每一段道路或者节点目前的流量。不过,由于其不再能够承担这些流量,其他的节点和道路上的流量还需要做相应的调整,因此,不能仅仅考虑直接流量。那么,如何来度量这个直接加上间接的流量效益呢?

最关键的就是这样的流量损失会重分配或者说传播。这是讨论这个问题的第一个关键点:传播,或者说直接到间接。

第二个思路上的关键点是假想地去掉一个(或者多个)单元的思想——Hypothetical Extraction Method (HEM)。

有了这两个思想和看问题的角度,我们可以考虑如下具体的算法:

  1. 用最短距离重分配,维持外界对系统的总需求不变的情况下,对比各个路段和节点的新流量和旧流量。
  2. 用PageRank算法来看看,去掉路段或者顶点之后,对比PageRank矩阵的本征矢量。这样做有间接效益,但是,意义不明确。
  3. 用投入产出分析加上HEM。这么多方法,用哪一个呢?
    1. 传统投入产出+HEM。数据本身只有道路系统和流量,没有外界。这个简单,把每个节点的总输出看做一个叫做“社会”的外界传播过来的流量,把每个节点的总接收到的投入看做一个叫做“社会”的外界从系统里面取走的流量。因此,这个HEM描述的是在外界和系统的关系不发生改变的情况下,去掉一个节点或者一段道路,系统的应对。
    2. 目标外界HEM。按照
      \begin{align}
      X = \left(1-F^{\left(-k\right)}\right)Y^{\left(k\right)},
      \end{align}
      当\(Y^{\left(k\right)} = x^{k}_{j}\)的时候,计算出来的\(X\)就是\(x^{k}_{j}\)在系统里面传播的效果。于是,\(\sum_{ij}\left(1-F^{\left(-k\right)}\right)_{ij}x^{k}_{j}\)就体现了\(x^{k}_{j}\)的乘数效应。于是,正好就能够用来度量路段\(kj\)的重要性。

    3. 本征向量HEM。一个投入产出矩阵的最大本征值对应的本征向量代表了这个生产系统的最优投入结构——每一个部门最好就需求这么多或者供给这么多。在交通问题里面,这就代表最好每一个节点上的总进或者出的客流的最有配比。当然,实际客流的结构不一定就是这个最有客流的结构。于是,这里相当于,仅仅从道路结构还有目前的客流分配方式来考虑,去掉一个节点或者一段道路前后,这个最优配比的变化。

除了描述单一路段或者单一节点的影响力,我们还可以考虑同时去掉两个路段或者节点的影响力的问题,以及这样的影响力和两者分开去掉的影响力之和的对比。很有可能,我们能够看到干涉效益——两者之和不等于同时去掉两者的效益。更进一步,这样的干涉效益,是不能通过仅仅考察直接流量来反应的,是我们这个方法特有的。

能够找到一个问题,同时三种方法都可以自然地用上,也是不容易的。这三个计算分析分别反应了道路和节点不同意义上的重要性。

除了这个具体工作,通过这个工作,我们还发现:

  1. 传播很重要(PageRank或者投入产出或者更一般的流平衡分析)
  2. 去掉一个点或者边来讨论重要性有意义
  3. 去掉两个点或者边可以反映更深刻的干涉效益。

这些是具有一般意义的。要把它们在各种系统里面实现,来解决具体系统的问题。从具体问题到一般方法,再到更一般的视角或者思想,然后回到更多方法,更多具体系统。这就是科学啊。

原则上,广义投入产出研究的四个方法——开放系统矩阵逆、封闭系统右本征向量HEM、封闭系统左本征向量HEM(也就是PageRank和PageRank HEM)和封闭系统目标外界HEM,按照所面对的系统是开放的还是封闭的,只能采取相应的方法。

但是,通过下面的手续(这个手续受这个交通系统的具体工作的启发),无论面对的系统是封闭还是开放系统,这四个分析方法完全都可以使用了。如果是开放系统,通过补充上那个作为外界的系统的数据,就成了封闭系统了。如果是封闭系统,通过加入一个假想的“外界”——把每一个节点到其他节点的出流当做从“外界”传过来的,把每个节点接受其他节点的入流当做到“外界”中去。这样系统就成了一个处处守恒的系统了。然后,把这个“外界”当做开放系统分析方法中的外界,就可以把这个封闭系统改造成开放系统来做后续分析了。

广义投入产出分析用于科学学的文章出来了

http://www.sciencedirect.com/science/article/pii/S1751157715300717
Interrelations among scientific fields and their relative influences revealed by an input–output analysis
Zhesi Shen, Liying Yang, Jiansuo Pei, Menghui Li, Chensheng Wu, Jianzhang Bao, Tian Wei, Zengru Di, Ronald Rousseau, Jinshan Wu

科学领域间相互关系及相对影响的投入产出分析

这是一篇原创性比较高的文章。Journal of Informetrics也是信息科学领域有影响力的期刊。

通常一个学科领域内有很多个子领域。我们的工作试图回答以下两个问题:第一、这些子领域哪一个最有影响力?第二、给定某一个子领域,其对其他的子领域有什么样的影响或者其最受哪个领域的影响?他们把经济系统中的Leontief投入产出方法改造成为一个封闭系统的方法。然后用这个封闭系统投入产出方法回答了以上的两个问题。这个封闭系统的投入产出方法具有广泛的适用性。

经济系统可以看作包含N各部门,如农业、纺织、矿业等。Leontief 投入产出分析的做法是构造一个线性方程,把最终需求部分独立从投入产出网络中出来当作已知量,把各个生产部门的总产出当作未知量。这样可以回答,当最终需求产生一定的变化时,各个生产部门的总产出需要做怎样的相应变化。投入产出分析里面最重要的思想是:直接影响(最终需求本身)和间接影响(生产最终需求直接所需要的各部门投入,生产这些投入的投入,……)必须同时得到考虑。

同样,在科学领域的关系中,也必须考虑一个领域对另外一个领域的直接引用,这些引用的引用,这些引用的引用的引用,等等。于是,问题就成了一个如何综合考虑直接和间接引用的数学问题。

在科学领域的关系中,由于没有最终消费部门,我们提出封闭系统的投入产出分析方法:放弃线性方程的描述而采用本征向量的方式来分析,同时我们通过研究去掉一个部门的结果来看一个部门的影响。对于我们的封闭系统矩阵,去掉第k行和第k列,计算这个矩阵的本征值和本征向量,计算这个矩阵的最大本征值与1的差,这个差就是产业部门k的影响力,相应的本征向量就可以作为产业部门k对其他部门的影响的度量的基础。

用上述方法分析了美国物理学会(APS)杂志上发表文章的数据。把每个一级分类号(PACS)看作一个部门(子领域),把子领域i中文章对子领域j中文章的引用数量作为j领域对i领域的投入,经过归一化建立子领域间的投入产出关系。

首先研究了不同时期子领域的相对重要性,以及重要性的演化。通过分析投入产出分析方法得到的子领域相对重要性与子领域总被引用次数的相关性,发现两者具有正相关性。但也有一些特例,如统计物理(05)的在投入产出分析中得到的排名高于利用引用数所得到的排名,说明统计物理在对其他领域具有重要的间接影响。


图1 投入产出重要性排名与引用次数排名的相关关系。

另外给出了子领域相对重要性的演化过程,随着总引用次数的增加,发现某些领域的重要性(IOF-Z Score)在增加,如03量子力学,而某些领域对其他领域的影响力在降低,如74 (超导,这不表示其自身的重要性在降低,仅仅是对其他子领域而言)(图2)。


图2:1991至2011年间相对重要性(IOF-Z Score)与引用次数(Total Citation)的关系。点击图片会显示动画

另外,发现03量子力学的重要性排名在随时间增长,在2011年成为了影响力最强的子领域,而有的领域在一直下降。


图3 :20个最有影响的子领域影响力排名变化图。

这个工作提出了封闭系统的投入产出分析方法,并应用在美国物理学会杂志发表的文章记录上。发现通过考虑直接连接和间接连接,这个分析方法可以比通过引用次数和文章数挖掘出子领域间深层次的相互关系。这个方法还可以用来分析所有具有投入产出关系的系统中各个元素的影响力和相互影响。

除了科学领域(其他的领域的也可以做了),后续的这个方法用于其他研究主体:科学家、学校、城市、国家、基金单位,都可以开始做了。

顺便,借个贴:今天再看了一遍Susskind的关于Feynman的Ted talk,https://www.ted.com/talks/leonard_susskind_my_friend_richard_feynman。在怎么做研究,怎么讲课,怎么思考上还是很有感触。推荐大家都看看。也推荐都看看Feynman的讲义和小册子们。

广义投入产出研究基本文献

首先,了解投入产出:Input-Output Analysis Foundations and Extensions by Ronald E. Miller and Peter D. Blair.

其次,了解PageRank:The PageRank Citation Ranking: Bringing Order to the Web by L. Page, S. Brin, R. Motwani, and T. Winograd;Google matrix analysis of directed networks by Leonardo Ermann, Klaus M. Frahm, and Dima L. Shepelyansky。

接着,了解科学学:Bibliometrics and Citation Analysis: From the Science Citation Index to Cybermetrics by Nicola De Bellis

接着,了解流平衡分析和系统生物学:Systems Biology: Properties of Reconstructed Networks by Bernhard Ø. Palsson,What is flux balance analysis? by Jeffrey D Orth, Ines Thiele and Bernhard Ø Palsson

最后,几个领域连通起来的视角(前面的所有的准备就是为了能够明白这个):PageRank: Standing on the Shoulders of Giants by Massimo Franceschet,Spectral Ranking by Sebastiano Vigna,吴金闪的广义投入产出分析和细节投入产出分析投入产出矩阵分析的主要思想小结,以及吴金闪的报告《广义投入产出分析》

所有的知识的学习的出发点都可以是Wikipedia和google。

在理解和了解这一基本思想和这些学科的基本研究问题之后,可以思考如何用这个思想来解决这些学科的基本问题,以及还可以用来解决其他哪些问题(注意,我们的汉字学习的工作——Efficient Learning Strategy of Chinese Characters Based on Network Approach——实际上也是这个思想的一个应用)。

争取以后每一个领域,我都整理出来基本文献,供后来人使用。

刚才学生问,做什么样的研究。研究工作只有两个目标:顶天(最高深最核心的学问)、立地(最具实际性的学问)。如果还能够从立地的问题中提炼出顶天的来,或者把顶天的用于立地 的,就更加有意思了。其他的,不解决这两个问题以及它们的联系的学问,都不是学问,比如大多数研究者跟在人家屁股后面的工作。可借鉴,不跟从,要么钻研深刻的理论核心问题,要么解决实际问题中能够用非平庸的数学结构解决的问题。

学生还问,为什么我从来不直接给答案。当学生或者其他意图学到东西的人问我一个问题的时候,我通常会问更多的问题,意图是:搞清楚学生的根本问题在哪里,铺设台阶引导其思考,逼迫学生思考背后的原因然后能够做到举一反三。如果学生的答案有错,我也不会告诉他错了,而是沿着他的思路,问更多的推演的问题,然后让学生自己意识到答案的问题。这样做,学生能够得到的收获会更多。但是,大部分人都不是客观的思考者,会觉得我顺着思路把他逼到墙角,是不可接受的事情,于是,所谓的自尊伤害了思考。当然,这也是物理学家的问题,很多时候,他们把所有的问题简单地当做科学问题,分不清楚生活问题和科学问题的界线,搞不清楚学生的自尊和搞清楚问题有什么关系。这个也只能提醒自己一下,一不小心,就又忘了。

几个项目召唤研究者

除了要求比较高的非平衡疏运理论、汉字结构与汉字学习项目,目前,还有几个相对来说比较容易上手的项目需要多个研究者。我把它们总结在这里。

  1. 广义投入产出和拓展PageRank研究一个系统中主体的排名和相互影响
  2. 最后通牒博弈理论和实验的研究
  3. 几个移动App的开发

广义投入产出和拓展PageRank研究一个系统中主体的排名和相互影响
我们最近提出的广义投入产出方法和拓展的PageRank算法,可以用来讨论学术单位(大学和研究所、国家、作者)、学术领域、期刊、文章等各种主体的排名和相互关系。本质上就是问这样的问题:如果某一个主体的贡献缺失,对整体产生什么样的影响,对其他每一个主体个体产生什么影响。

实际上,这两个分析方法还可以用于经济领域的排名和相互影响,产业链或食物链中产品或者物种的排名和相互影响,专利领域和各个专利在整个专利研究中的排名和相互影响。甚至,如果有数据,例如有研究经费、研究论文、专利、专利的经济效益这个大系统的数据,我们可以讨论这样的问题:某一项研究在整个经济和科学技术中的地位。

目前,论文发表的数据比较全、专利的数据有一部分、经济领域的数据比较全、食物链的数据有相当一部分,需要研究者来开展研究。如果是研究生,就需要学习我们的方法(思想、算法和程序),然后(可能需要稍作修改)运用到以上的各种数据上,然后与各个领域的专家一起来完成找到值得呈现的结论,最后完成文章的写作。这里每一个不同的主体,例如研究领域、作者、期刊、大学等等等等,都是一个独立的有待完成的工作。

这里的具体问题主要是科学计量学和经济学,但是,如果你学会方法以后,找到其他的方向可以运用这个方法来回答那个领域内部的研究者感兴趣的问题,那么,只要找到合适的数据,你就可以开展相应的研究。

最后通牒博弈理论和实验的研究
在最后通牒博弈中,基于完全理性的博弈理论给出的结果是提议者给出最少的不为零的钱给接受者,而接受者接受这个提议。实际实验和观察的结果都不符合这个理论结果。于是,构造一个理论能够给出与实验和观察相符的结果就是一个非常重要的问题。

在现有的理论中,基本上还是坚持决策者的行为是在追求某种目标函数的最优化的这样一个思路。只不过,考虑的因素,除了钱,还包含公平性、利它性、声誉、报复、博弈着之间的联系等。当然,博弈的基本精神就是,在考虑最优的时候,不仅仅要考虑在对方行为确定的情况下自己的最优,还需要考虑对方的行为也是通过假设“我”的行为确定的情况下做优化来确定的。因此,这个最优化不是简单的单一主体和单一目标的最优化,而是多主体、多目标(通常一个主体一个目标,也可以更多)的最优化。

更一般地来说,除了“最优”的思路,我们还可以考虑“更优”的思路,也就是说,决策者不是选择最优的那个行动来执行,而是按照一定的比例来选择更优的行动(不是最好的也会被选中)。

更更一般地来说,没准,把所有考虑的因素放到一个目标函数里面,然后来考虑最优或者更优,都是理论上极大的简化。因此,有可能需要一个放弃整个这样的目标函数优化的思路来构造理论。注意,我们的大部分物理学其实也是符合这个思路的一个理论。当然,在我们不得不这样做之前,我们还是希望在这个思路的范围内来构造我们的博弈决策的理论。

具体到最后通牒博弈,我们就需要找到这样的一个目标函数,并且,这个函数里面的量都是可定义和可测量的,里面的参数,如果有的话,也是可以确定出来的。而且,根据这样的一个目标函数,我们可以通过最优或者更优的方式来给出理论结果,并能够与实验和观察相符。

目前,我们的实验方案已经基本确定下来,初步的结论也很有意思,不过,还有大量的实验工作和数据处理、理论模型的建构等工作需要展开。如果你有兴趣做一些对理论有基础性贡献的,用数学物理的角度(或者说科学的角度)来做一些社会科学理论研究的,工作,那你可以来尝试一下这个。

几个移动App的开发
在研究工作以及作为一个科学家的日常生活中产生了很多可以分享给其他人的产品的想法。有实现的价值。

例如,最近我想起来实现一个多次多通道计时器。多通道就是有多个计时的任务相互重叠,一个没有完成另一个就已经开始的情况。多次就是一个计时任务中需要设置多个提醒的时间点的情况。多次在学术报告中会经常出现,例如离结束5分钟、2分钟和结束分别提醒。多通道在完成多任务的时候经常出现。这样的功能,也可以通过专门的硬件来实现,但是在手机时代,用手机App来实现是最好的方式。当然,这个App非常小众,钱途堪忧,对需要的人却很有价值。

其他的更多的ideas还包括强制事件和日程管理、课程和报告点评等等。有兴趣和能力的,可以一起来做做。

广义投入产出分析和细节投入产出分析

希望解决的根本问题:

  1. 产业部门之间的相互关系1。如果我们希望某个产业部门的总产出(包含中间消耗)或者是净产出(不包含中间消耗,只计算直接消费)有一个单位的增加,我们需要增加的各个其他产业部门的总投入或者净投入(不包含通过中间生产过程得到的投入)是多少。例如,在包含最终消费和劳动力的开放系统的投入产出中,这个问题就是:为了得到最终消费的某一个产品的一个单位的增加,需要劳动力部门在各个产业上增加多少投入。在封闭系统中,这个问题如何回答还不知道。
  2. 产业部门之间的相互关系2。如果我们减少某个产业部门的总投入(包含中间投入)或者是净投入(不包含中间投入,只计算直接投入)一个单位,各个其他产业部门的净产出(不包含通过投入给中间生产过程的部分)和总产出是多少。例如,在包含最终消费和劳动力的开放系统的投入产出中,这个问题就是:减少劳动力部门在某个产业上的投入一个单位,所有产品的总产量和净产量如何变化。
  3. 产业部门之间的相互关系3。如果我们希望在整个系统中去掉某个产业部门,整个系统中受影响最大的部门是哪一个?
  4. 产业部门的影响力度量。哪一个产业部门对整个系统最重要?

这些问题可以通过投入产出矩阵(总投入与总投入之间的关系或者总产出与总产出之间的关系),也可以通过概率转移矩阵(总投入与总产出之间的关系,或者总产出与总投入之间的关系)来讨论。数学手段不一样,包含的信息应该是一样的。

所有的投入产出分析从这里开始:给定一个产业部门的集合\(\left\{j=1,\cdots,N\right\}\),每一个部门之间的投入产出绝对量\(\left\{x^{i}_{j}\right\}\),表示部门\(i\)投入到部门\(j\)的产品\(i\)的数量。这里产品和部门相互认同。我们会讨论部门和产品有区别的更加细节的投入产出分析。

我们可以定义:

  1. 反向投入产出矩阵
    \[B^{i}_{j}=\frac{x^{i}_{j}}{X^{j}},\hspace{2cm} (1)\]
    其中\(X^{i}=\sum_{j=1}^{N}x^{i}_{j}\)。于是,我们有
    \[\sum_{j=1}^{N}B^{i}_{j}X^{j}=X^{i}\Longrightarrow B^{a}_{b}X^{b}=X^{a},\hspace{2cm} (2)\]
    从这里我们看出来,\(B\)的右本征向量是平庸的,就是\(X^{a}\)。

    如果我们在取和中去掉其中的某一个部门\(k\),则
    \[\sum_{j\neq k}B^{i}_{j}X^{j}+x^{i}_{k}=X^{i}\Longrightarrow B^{\left(-k\right)}X^{\left(-k\right)}+Y_{\left(k\right)} = X^{\left(-k\right)}. \]
    于是,
    \[X^{\left(-k\right)} = \left(1-B^{\left(-k\right)}\right)^{-1}Y_{\left(k\right)}, \hspace{2cm} (12)\]
    并且
    \[X^{k} = \sum_{j\neq k}B^{k}_{j}X^{\left(-k\right),j}+x^{k}_{k}. \]
    这里的方程(12)就是Loentief投入产出的核心公式。在那里,通常把部门\(k\)取作最终需求部门\(N\)。这个表达式可以用来回答预期\(k\)部门的产能有一个单位的增加的情况下,系统的其他部门的产能如何变化。在这个条件下,我们能够计算出来所有的\(\Delta x^{i}_{j}\)于是也就得到了所有的\(\Delta X_{j}\),所有部门的需要的投入的增量。这样,我们就相当于回答了:如果需要增加\(k\)部门的一个单位净产出,需要的各部门的总投入是多少。如果我们还能够知道初期额外投入的多少就更好了,也就是去掉中间生产过程产生的投入。有可能把\(F\)和\(B\)合起来可以解决这个问题。

  2. 正向投入产出矩阵
    \[F^{i}_{j}=\frac{x^{i}_{j}}{X_{i}},\hspace{2cm} (3)\]
    其中\(X_{i}=\sum_{j=1}^{N}x^{j}_{i}\)。相应地,我们有
    \[\sum_{j=1}^{N}X_{i}F^{i}_{j}=X_{j}\Longrightarrow X_{a}F^{a}_{b}=X_{b},\hspace{2cm} (4)\]
    从这里我们看出来,\(F\)的左本征向量是平庸的,就是\(X_{a}\)。
  3. 正向概率转移矩阵
    \[MF^{i}_{j}=\frac{x^{i}_{j}}{X_{j}}.\hspace{2cm} (5)\]
    如果我们还是照着上面的方式企图写出本征向量的形式,我们有
    \[\sum_{j=1}^{N}MF^{i}_{j}X_{j}=X^{i}.\hspace{2cm} (6)\]
    这个是矢量和对偶矢量之间的关系,而不是同类型的矢量之间的关系。把一个投入向量变成一个产出向量。同时,我们发现这个矩阵的左右本征矢量可能都不是平庸的。
  4. 反向概率转移矩阵
    \[MB^{i}_{j}=\frac{x^{i}_{j}}{X^{i}}.\hspace{2cm} (7)\]
    如果我们还是照着上面的方式企图写出本征向量的形式,我们有
    \[\sum_{i=1}^{N}X^{i}MB^{i}_{j}=X_{j}.\hspace{2cm} (8)\]
    它把一个产出向量变成一个投入向量。同时,我们发现这个矩阵的左右本征矢量可能都不是平庸的。

有了这四个定义,我们可以问\(B\)的左本征矢量、\(F\)的右本征矢量、\(MF\)和\(MB\)的左右本征矢量有什么含义,我们还可以讨论如何把平庸的关系(2)和(4)变得有用。由于概率转移矩阵的特点,在这里我们仅仅讨论最大本征值,也就是\(1\)所对应的本征向量。
\[\tilde{P}B=\tilde{P}\Longrightarrow \sum_{i}\tilde{P}_{i}\frac{x^{i}_{j}}{X^{j}} = \tilde{P}_{j} \Longrightarrow \sum_{i}X^{i}\tilde{P}_{i}\frac{x^{i}_{j}}{X^{i}} = X^{j}\tilde{P}_{j} \Longrightarrow P_{a} MB^{a}_{b} = P_{b}. (9)\]
于是\(B\)的左本征矢量与\(MB\)的左本征矢量是一样的(差一个常数)。同理可以把\(F\)的右本征矢量与\(MF\)的右本征矢量联系起来。

现在我们来看\(MB\)的右本征矢,假设为\(W\),则
\[\sum_{j}\frac{x^{i}_{j}}{X^{i}}W^{j} = W^{i} \Longrightarrow \sum_{j}x^{i}_{j}W^{j} = X^{i}W^{i} \Longrightarrow W^{j} = 1. \]
于是,我们发现\(MB\)的右本征矢是平庸的。同理,\(MF\)的左本征矢也是平庸的。

总结一下:四种归一化方法定义了矩阵\(B,F,MB,MF\),其中\(B\)的右本征矢和\(MB\)的右本征矢是平庸的、\(F\)的左本征矢和\(MF\)的左本征矢是平庸的,\(B\)的左本征矢和\(MB\)的左本征矢认同,\(F\)的右本征矢和\(MF\)的右本征矢认同。

也就是说,对于通常的投入产出分析矩阵,如果我们计算本征矢量而不是线性方程(参考投入产出矩阵分析的主要思想小结),那么这个本征矢量和稳定概率分布是一个东西(差一个常数),而后者是PageRank算法的基础。

这个时候,我们再来考虑去掉一行一列的本征向量的含义就比较清楚了。以这个为基础,我们可以讨论两个产业部门的关系,以及每一个产业部门的重要性衡量。

细节的投入产出分析,也就是考虑到产品之间的配比的投入产出分析(举例来说,一斤面粉和半斤水生产一斤面包和半斤脏水,如果需要增加面包产量一斤,实际上就意味着增加脏水半斤。这个面包和脏水之间不是简单的投入产出关系,而是共同生产关系。这个关系没有被通常的投入产出考虑进来),需要考虑两个矩阵\({L_{\alpha}}^{j}\)和\(R_{\alpha,j}\),分别表示发生一次工艺\(\alpha\)的生产需要和产生\(j\)产品的数量。如果我们知道这个时间内每一个生产部门的生产的次数\(V^{\alpha}\),那么我们就可以计算总需求和总产出分别为,
\[X^{j}=\sum_{\alpha}L_{\alpha}^{j}V^{\alpha}, \hspace{2cm} (10)\]
为产品\(j\)投入到所有产业的总和。
\[X_{j}=\sum_{\alpha}R_{\alpha,j}V^{\alpha}, \hspace{2cm} (11)\]
为所有产业生产出来的产品\(j\)总和。

当假设一个产业部门只生产一样产品的时候,\(R_{\alpha,j}=\delta_{\alpha,j}\),于是\(X_{j}=V^{\alpha}\),于是,公式(10)成为
\[X^{j}=\sum_{i}L_{i}^{j}X_{i}. \hspace{2cm} (13)\]
这个时候,可以看出来,\(L\)与\(MF\)相当。对于这个生产过程,可以存在多种理解。例如,给定投入向量\(X^{a}\),我们希望得到最优的产出向量。例如,我们要求投入向量实际上来自于产出向量。例如,给定总价格和投入资金,我们希望得到最优的产出值。所有的这些问题都可以用这个\(L\)和\(R\)的数学模型来描述。

对于一个封闭系统(总投入等于总产出),则
\[\sum_{\alpha}L_{\alpha}^{j}V^{\alpha} = \sum_{\alpha}R_{\alpha,j}V^{\alpha} \Longrightarrow \sum_{\alpha}\left(L_{\alpha}^{j}-R_{\alpha,j}\right)V^{\alpha}=0 , \hspace{2cm} (14)\]
对于一个开放系统系统(总投入不等于总产出,但是外界输出已知),则
\[\sum_{\alpha}\left(L_{\alpha}^{j} – R_{\alpha,j}\right)V^{\alpha} = b^{j}. \hspace{2cm} (15)\]
这两个方程意味着,为了满足外界的需求,各个部门的生产频率是受约束的(如果能够完全确定下来就更好了。通常做不到,因为方程不是方的)。

回到化学反应网络的层次,\(L\)和\(R\)被合起来称为化学反应系数矩阵\(S\),相当于把\(L\)当作负的\(R\)当作正的,一起叫做\(S\)。这个时候系统的行为完全由如下微分方程描述,
\[\frac{d}{dt} X_{i} = \sum_{r=1}^{M} \kappa^{r}\Pi_{j=1}^{N} \left(X_{j}\right)^{\frac{\left|S_{r}^{j}\right| – S_{r}^{j}}{2}}S_{r}^{i}, \hspace{2cm} (16)\]
其中\(\kappa^{r}\)是化学反应速率常数(外生变量)。联系两个公式,我们发现,实际上,相当于
\[ \kappa^{r}\Pi_{j=1}^{N} \left(X_{j}\right)^{\frac{\left|S_{r}^{j}\right| – S_{r}^{j}}{2}} = V^{r}.\hspace{2cm} (17)\]

这也就是说,尽管整个化学反应是由外生变量系数矩阵\(S\)和外生变量反应速率矢量\(\kappa\)所决定的一个系统,但是,一定程度上说,例如优化进化的结果使得系统出于平衡的封闭系统状态或者外界输出一定的开放系统的状态(还可以有其他的约束和优化目标,例如经济学的最大利润目标),速率矢量\(\kappa\)也是,一个由\(S\)(加上\(b\)在开放系统中)决定的,适合这个\(S\)的满足一些额外约束和最大化某些额外目标的,参数。

于是,整个问题的研究可以走两条路:第一,在外生变量\(\kappa\)完全已知的情况下,用公式(16)讨论时间演化的过程和演化的结果;第二,通过\(S\)(按照公式(14)加上其他约束)来确定\(V\)从而也确定\(\kappa\),接着得到\(X\)。前者就是化学反应网络和微分方程的方式。后者被称为化学反应网络和流平衡分析(Flux Balanced Analysis)。

在第一个数学模型中(暂时忽略\(b\)的问题,当作封闭系统),研究某个物种多了少了对其他的影响非常简单,只要放到微分方程中去演化一下得到一个定态末状态就行了。但是,这样就需要\(\kappa\)这一外生变量。

在第二个数学模型中,对于某个化学反应(产业部门)的重要性就比较容易讨论,例如\(S\)中去掉某一个列(反应角标\(r\)),然后就可以讨论这个时候的\(V\),并且进而得到这个时候的\(X\)。但是,如何讨论某一个\(X_j\)对一个\(X_k\)的影响呢?

可以考虑这样:在满足约束(例如\(X_j\)最大值约束)的情况下,在同样的\(S\)的情况下,使得某个类似的目标最大的这样的\(V\),然后从\(V\)得到\(X\),来得到\(X_j\)对\(X_k\)的影响。

可以尝试。由于这个流平衡分析与化学反应、基因网络联系更紧密,可以考虑,先用这样的体系做例子,来发展方法,然后,回到经济学和科学计量学。

2014年复杂系统暑期学校报告