思考记录,关于层次结构有向网络

从一个有向网络中识别出层次结构。
从无向边网络数据(获取数据阶段有限制)加上整体的宏观的大致的方向,能不能还原有向网络?

科学研究领域的增长与基金支持的关系,最快或者最有影响或者最什么什么的领域的识别,两种分类号所形成的集团的对应关系。

把pacs代码,基金分类号,或者关键词作为顶点,同一篇文章或者同一份申请,或者教材的同一段(同一句?)作为连接。这个网络可以研究学科门类的发展、形成,找到不同类型和特征的门类,可以讨论关键概念与方法的集合以及这个集合上的层次关系(知识地图),基金支持与门类发展之间的关系。也可以在不同国家之间作对比研究。也可以开展基金项目评价,以及对评阅人的评价。

分类代码做为顶点,研究论文当做边,含有时间序列信息的连接预测问题。

关于科学研究的研究的几个问题

在这个项目中,我们的研究对象某一个学术研究领域在某一段时期内的进展以及这一时期内研发基金对这一领域的投入情况。我们希望讨论下面几个问题以及更一般的探讨讨论这几个问题的一般方法,以期将来能够类似的研究别的领域:第一、领域内研究内容的层次结构与分类,也就是粗粒化图像;第二、将来这个领域研究工作的增长点、热点、可能突破点的预测;第三、研发投入与研究进展的关系、不同组织管理的研发基金表现的评估;第四、研发项目成果评价与立项评阅人评价;第五、从论文中制作这个领域内基本概念之间的联系以及基于这个联系的层次结构,即知识地图。

以物理学为例,我们介绍一下处理方法的基本思路。我们从收集三份数据开始:物理学采用AIP PACS号的论文的部分信息(PACS号、论文唯一编号、作者);中国国家自然科学基金物理学项目的申请书部分信息(包含申请人、申请类别、申请书唯一编号、评阅人最终意见、项目成果);国内物理学主流期刊论文的部分信息(关键词、论文唯一编号、作者)。如果可能的话,其他国家(例如美国)的自然科学基金申请书的部分信息(最主要的是申请类别、申请书唯一编号)也是很有意义的。

利用pacs号(顶点)与论文(边)构建一个网络,或者申请类别(顶点)与申请书(边)构建一个网络,或者关键词(顶点)与论文、教材、专著(边)构建一个网络。这个网络反映了这个领域的基本概念以及概念之间的联系。我们认为大部分研究工作都是建立了概念之间的一种联系。

在这个网络上我们可以寻找集团结构,并在这几个网络的集团结构之间作比较。例如,我们可以比较所有网络上相应集团比例大小随着时间的演化。在这里,找到相应的集团是一个技术问题。不过,简单地来说,pacs或者基金申请类别号本来就已经是有层次结构的。因此,不从网络上的集团结构,而从单纯地层次结构我们也可以作上述的比较研究。从这里,我们可以对研发基金投入的表现有一个比较完整的认识。

在这个网络上,我们可以做含有时间序列的边的预测。这样我们就可以从一个侧面了解此领域科学研究的趋势。

从论文中获取关键词、基本概念,只能得到两个概念之间存在连接,不知道从两一个连到哪一个。如何恢复方向信息?当然,基本的整体的方向性是有的,只是丢掉了其中一部分边的方向,如何恢复?这是一个非平庸的技术问题。

研发基金的管理者总是希望支持最有潜力的项目的。项目的区分则完全由项目评阅人来完成。自然管理者希望评阅人公正,而且识别能力强。通过对比项目在评审阶段的意见和完成的成果的评价,我们可以对评阅人做一个评价。甚至,管理者可以设立一个奖项,就像APS最佳审稿人。这表明获奖者公正又有眼光,又愿意投入公益。这是很高的声誉。

这两天才发现,这些问题别人也在讨论:http://grants.nih.gov/grants/KM/OERRM/OER_KM_events/,
尤其是
http://grants.nih.gov/grants/KM/OERRM/OER_KM_events/Borner.pdf

http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2864309/

《思考记录,关于层次结构有向网络》有一个想法

发表评论

电子邮件地址不会被公开。 必填项已用*标注