http://www.sciencedirect.com/science/article/pii/S1751157715300717
Interrelations among scientific fields and their relative influences revealed by an input–output analysis
Zhesi Shen, Liying Yang, Jiansuo Pei, Menghui Li, Chensheng Wu, Jianzhang Bao, Tian Wei, Zengru Di, Ronald Rousseau, Jinshan Wu
科学领域间相互关系及相对影响的投入产出分析
这是一篇原创性比较高的文章。Journal of Informetrics也是信息科学领域有影响力的期刊。
通常一个学科领域内有很多个子领域。我们的工作试图回答以下两个问题:第一、这些子领域哪一个最有影响力?第二、给定某一个子领域,其对其他的子领域有什么样的影响或者其最受哪个领域的影响?他们把经济系统中的Leontief投入产出方法改造成为一个封闭系统的方法。然后用这个封闭系统投入产出方法回答了以上的两个问题。这个封闭系统的投入产出方法具有广泛的适用性。
经济系统可以看作包含N各部门,如农业、纺织、矿业等。Leontief 投入产出分析的做法是构造一个线性方程,把最终需求部分独立从投入产出网络中出来当作已知量,把各个生产部门的总产出当作未知量。这样可以回答,当最终需求产生一定的变化时,各个生产部门的总产出需要做怎样的相应变化。投入产出分析里面最重要的思想是:直接影响(最终需求本身)和间接影响(生产最终需求直接所需要的各部门投入,生产这些投入的投入,……)必须同时得到考虑。
同样,在科学领域的关系中,也必须考虑一个领域对另外一个领域的直接引用,这些引用的引用,这些引用的引用的引用,等等。于是,问题就成了一个如何综合考虑直接和间接引用的数学问题。
在科学领域的关系中,由于没有最终消费部门,我们提出封闭系统的投入产出分析方法:放弃线性方程的描述而采用本征向量的方式来分析,同时我们通过研究去掉一个部门的结果来看一个部门的影响。对于我们的封闭系统矩阵,去掉第k行和第k列,计算这个矩阵的本征值和本征向量,计算这个矩阵的最大本征值与1的差,这个差就是产业部门k的影响力,相应的本征向量就可以作为产业部门k对其他部门的影响的度量的基础。
用上述方法分析了美国物理学会(APS)杂志上发表文章的数据。把每个一级分类号(PACS)看作一个部门(子领域),把子领域i中文章对子领域j中文章的引用数量作为j领域对i领域的投入,经过归一化建立子领域间的投入产出关系。
首先研究了不同时期子领域的相对重要性,以及重要性的演化。通过分析投入产出分析方法得到的子领域相对重要性与子领域总被引用次数的相关性,发现两者具有正相关性。但也有一些特例,如统计物理(05)的在投入产出分析中得到的排名高于利用引用数所得到的排名,说明统计物理在对其他领域具有重要的间接影响。
图1 投入产出重要性排名与引用次数排名的相关关系。
另外给出了子领域相对重要性的演化过程,随着总引用次数的增加,发现某些领域的重要性(IOF-Z Score)在增加,如03量子力学,而某些领域对其他领域的影响力在降低,如74 (超导,这不表示其自身的重要性在降低,仅仅是对其他子领域而言)(图2)。
图2:1991至2011年间相对重要性(IOF-Z Score)与引用次数(Total Citation)的关系。点击图片会显示动画。
另外,发现03量子力学的重要性排名在随时间增长,在2011年成为了影响力最强的子领域,而有的领域在一直下降。
图3 :20个最有影响的子领域影响力排名变化图。
这个工作提出了封闭系统的投入产出分析方法,并应用在美国物理学会杂志发表的文章记录上。发现通过考虑直接连接和间接连接,这个分析方法可以比通过引用次数和文章数挖掘出子领域间深层次的相互关系。这个方法还可以用来分析所有具有投入产出关系的系统中各个元素的影响力和相互影响。
除了科学领域(其他的领域的也可以做了),后续的这个方法用于其他研究主体:科学家、学校、城市、国家、基金单位,都可以开始做了。
顺便,借个贴:今天再看了一遍Susskind的关于Feynman的Ted talk,https://www.ted.com/talks/leonard_susskind_my_friend_richard_feynman。在怎么做研究,怎么讲课,怎么思考上还是很有感触。推荐大家都看看。也推荐都看看Feynman的讲义和小册子们。