思考记录,关于层次结构有向网络

从一个有向网络中识别出层次结构。
从无向边网络数据(获取数据阶段有限制)加上整体的宏观的大致的方向,能不能还原有向网络?

科学研究领域的增长与基金支持的关系,最快或者最有影响或者最什么什么的领域的识别,两种分类号所形成的集团的对应关系。

把pacs代码,基金分类号,或者关键词作为顶点,同一篇文章或者同一份申请,或者教材的同一段(同一句?)作为连接。这个网络可以研究学科门类的发展、形成,找到不同类型和特征的门类,可以讨论关键概念与方法的集合以及这个集合上的层次关系(知识地图),基金支持与门类发展之间的关系。也可以在不同国家之间作对比研究。也可以开展基金项目评价,以及对评阅人的评价。

分类代码做为顶点,研究论文当做边,含有时间序列信息的连接预测问题。

关于科学研究的研究的几个问题

在这个项目中,我们的研究对象某一个学术研究领域在某一段时期内的进展以及这一时期内研发基金对这一领域的投入情况。我们希望讨论下面几个问题以及更一般的探讨讨论这几个问题的一般方法,以期将来能够类似的研究别的领域:第一、领域内研究内容的层次结构与分类,也就是粗粒化图像;第二、将来这个领域研究工作的增长点、热点、可能突破点的预测;第三、研发投入与研究进展的关系、不同组织管理的研发基金表现的评估;第四、研发项目成果评价与立项评阅人评价;第五、从论文中制作这个领域内基本概念之间的联系以及基于这个联系的层次结构,即知识地图。

以物理学为例,我们介绍一下处理方法的基本思路。我们从收集三份数据开始:物理学采用AIP PACS号的论文的部分信息(PACS号、论文唯一编号、作者);中国国家自然科学基金物理学项目的申请书部分信息(包含申请人、申请类别、申请书唯一编号、评阅人最终意见、项目成果);国内物理学主流期刊论文的部分信息(关键词、论文唯一编号、作者)。如果可能的话,其他国家(例如美国)的自然科学基金申请书的部分信息(最主要的是申请类别、申请书唯一编号)也是很有意义的。

利用pacs号(顶点)与论文(边)构建一个网络,或者申请类别(顶点)与申请书(边)构建一个网络,或者关键词(顶点)与论文、教材、专著(边)构建一个网络。这个网络反映了这个领域的基本概念以及概念之间的联系。我们认为大部分研究工作都是建立了概念之间的一种联系。

在这个网络上我们可以寻找集团结构,并在这几个网络的集团结构之间作比较。例如,我们可以比较所有网络上相应集团比例大小随着时间的演化。在这里,找到相应的集团是一个技术问题。不过,简单地来说,pacs或者基金申请类别号本来就已经是有层次结构的。因此,不从网络上的集团结构,而从单纯地层次结构我们也可以作上述的比较研究。从这里,我们可以对研发基金投入的表现有一个比较完整的认识。

在这个网络上,我们可以做含有时间序列的边的预测。这样我们就可以从一个侧面了解此领域科学研究的趋势。

从论文中获取关键词、基本概念,只能得到两个概念之间存在连接,不知道从两一个连到哪一个。如何恢复方向信息?当然,基本的整体的方向性是有的,只是丢掉了其中一部分边的方向,如何恢复?这是一个非平庸的技术问题。

研发基金的管理者总是希望支持最有潜力的项目的。项目的区分则完全由项目评阅人来完成。自然管理者希望评阅人公正,而且识别能力强。通过对比项目在评审阶段的意见和完成的成果的评价,我们可以对评阅人做一个评价。甚至,管理者可以设立一个奖项,就像APS最佳审稿人。这表明获奖者公正又有眼光,又愿意投入公益。这是很高的声誉。

这两天才发现,这些问题别人也在讨论:http://grants.nih.gov/grants/KM/OERRM/OER_KM_events/,
尤其是
http://grants.nih.gov/grants/KM/OERRM/OER_KM_events/Borner.pdf

http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2864309/

文献整理与科普计划,研究工作

1、复杂网络回答具体科学的问题;What can the methodology of network analysis offer to concrete fields: a survey of direct applications
2、经济物理学的物理学与经济学,以及工程。研究必须回答前两者,在此基础上回答后面的问题;Physics and Economics of Econophysics
3、非平衡统计基本问题研究新进展;慢慢写,一边做一边写,初步的发在理工学报
4、博弈论理论与实践:Does game theory work, how to make it work under more general situation. 一边调研,一边整理。

1.1 汉字的研究
1.2 科学论文发表与科研项目立项与进展的网络研究
1.3 产品网络、化学反应网络

2.1 金融数据时间序列区间相关性研究
2.2 人群意见相关性实证与理论研究

3.1 BBGKY2
3.2 GFPE与Lindblad方程
3.3 大系统的BBGKY
3.4 BBGKY与tDMRG、NEGF的对比
3.5 GFPE与Redfield方程,解析解,三阶项的处理
3.6 BBGKY标准计算程序
3.7 GFPE标准计算程序
3.8 BBGKY、GFPE之于具体系统,具体现象(热导、电导)

4.1 控制实验
4.2 囚徒困境
4.3 Coordination Game
4.4 Centipede Game

5 量子博弈卖出去
6 量子力学经典问题卖出去
7 统计物理教学论文写完卖出去
8 社会学习的问题组织一下,交代出去

转述好像来自饶毅的话(大意):研究(生)的层次
第一个层次,别人的工作很好,都做了自己想做的了,没什么好干的。
第二个层次,个别细节还可以提高,有一些离散的点上可以挖挖坑。
第三个层次,很多人在做烂东西,很多方面可以做革命性的工作。
第四个层次,聪明人还是很多的,很多人也在思考革命性的东西。能不能做出来,谁先做出来,努力、才智、运气(灵感来的早晚,刺激的时机)都有关系。众里寻他千百度,为伊消得人憔悴,没准也能妙手而得之。