这就是科学啊

最近在和小勇还有汪明他们在合作一个交通网络重要道路和节点的度量的项目。我们需要提供一个去掉一段道路或者一个节点以后的某种损失的度量。他们拿到这个度量以后会结合地质或者其他灾害发生的几率,来衡量风险。

当然,直接的度量,就是考虑每一段道路或者节点目前的流量。不过,由于其不再能够承担这些流量,其他的节点和道路上的流量还需要做相应的调整,因此,不能仅仅考虑直接流量。那么,如何来度量这个直接加上间接的流量效益呢?

最关键的就是这样的流量损失会重分配或者说传播。这是讨论这个问题的第一个关键点:传播,或者说直接到间接。

第二个思路上的关键点是假想地去掉一个(或者多个)单元的思想——Hypothetical Extraction Method (HEM)。

有了这两个思想和看问题的角度,我们可以考虑如下具体的算法:

  1. 用最短距离重分配,维持外界对系统的总需求不变的情况下,对比各个路段和节点的新流量和旧流量。
  2. 用PageRank算法来看看,去掉路段或者顶点之后,对比PageRank矩阵的本征矢量。这样做有间接效益,但是,意义不明确。
  3. 用投入产出分析加上HEM。这么多方法,用哪一个呢?
    1. 传统投入产出+HEM。数据本身只有道路系统和流量,没有外界。这个简单,把每个节点的总输出看做一个叫做“社会”的外界传播过来的流量,把每个节点的总接收到的投入看做一个叫做“社会”的外界从系统里面取走的流量。因此,这个HEM描述的是在外界和系统的关系不发生改变的情况下,去掉一个节点或者一段道路,系统的应对。
    2. 目标外界HEM。按照
      \begin{align}
      X = \left(1-F^{\left(-k\right)}\right)Y^{\left(k\right)},
      \end{align}
      当\(Y^{\left(k\right)} = x^{k}_{j}\)的时候,计算出来的\(X\)就是\(x^{k}_{j}\)在系统里面传播的效果。于是,\(\sum_{ij}\left(1-F^{\left(-k\right)}\right)_{ij}x^{k}_{j}\)就体现了\(x^{k}_{j}\)的乘数效应。于是,正好就能够用来度量路段\(kj\)的重要性。

    3. 本征向量HEM。一个投入产出矩阵的最大本征值对应的本征向量代表了这个生产系统的最优投入结构——每一个部门最好就需求这么多或者供给这么多。在交通问题里面,这就代表最好每一个节点上的总进或者出的客流的最有配比。当然,实际客流的结构不一定就是这个最有客流的结构。于是,这里相当于,仅仅从道路结构还有目前的客流分配方式来考虑,去掉一个节点或者一段道路前后,这个最优配比的变化。

除了描述单一路段或者单一节点的影响力,我们还可以考虑同时去掉两个路段或者节点的影响力的问题,以及这样的影响力和两者分开去掉的影响力之和的对比。很有可能,我们能够看到干涉效益——两者之和不等于同时去掉两者的效益。更进一步,这样的干涉效益,是不能通过仅仅考察直接流量来反应的,是我们这个方法特有的。

能够找到一个问题,同时三种方法都可以自然地用上,也是不容易的。这三个计算分析分别反应了道路和节点不同意义上的重要性。

除了这个具体工作,通过这个工作,我们还发现:

  1. 传播很重要(PageRank或者投入产出或者更一般的流平衡分析)
  2. 去掉一个点或者边来讨论重要性有意义
  3. 去掉两个点或者边可以反映更深刻的干涉效益。

这些是具有一般意义的。要把它们在各种系统里面实现,来解决具体系统的问题。从具体问题到一般方法,再到更一般的视角或者思想,然后回到更多方法,更多具体系统。这就是科学啊。

原则上,广义投入产出研究的四个方法——开放系统矩阵逆、封闭系统右本征向量HEM、封闭系统左本征向量HEM(也就是PageRank和PageRank HEM)和封闭系统目标外界HEM,按照所面对的系统是开放的还是封闭的,只能采取相应的方法。

但是,通过下面的手续(这个手续受这个交通系统的具体工作的启发),无论面对的系统是封闭还是开放系统,这四个分析方法完全都可以使用了。如果是开放系统,通过补充上那个作为外界的系统的数据,就成了封闭系统了。如果是封闭系统,通过加入一个假想的“外界”——把每一个节点到其他节点的出流当做从“外界”传过来的,把每个节点接受其他节点的入流当做到“外界”中去。这样系统就成了一个处处守恒的系统了。然后,把这个“外界”当做开放系统分析方法中的外界,就可以把这个封闭系统改造成开放系统来做后续分析了。