科学学基础文献和讨论班

最近整理了科学学基础文献,准备开设讨论班。大致分以下几个模块:

1、吴金闪,导言(科学学的任务:信息检索与获取、信息推荐、综述整理、研究工作评价、研究者评价、基金支持评价、科学与技术关系评价、学科领域发展现状评估与热点以及增长点的识别、科技决策支持;形式数据和内容数据),讲稿
2、文献计量学、信息计量学等传统的科学学,杨立英,讲稿
3、敖滨,Linkage analysis,简单统计计算分析科学与专利、经济之间的联系,主要讲一下日本人的和Narin的工作,2014年2月24日,晚 上6:30-7:30
4、沈哲思,我们自己的投入产出方法,国家、领域、期刊、城市、大学或者研究所以及企业、基金支持单位等各种群体的地位以及它们之间的关系,2014年2月25日,晚上6:30-7:30
5、韦添,Page rank用于Linkage analysis,Eigenfactor,国家、领域、期刊、城市、大学或者研究所以及企业、基金支持单位等各种群体的地位以及它们之间的关系,2014年2月26日,晚上6:30-7:30
6、韦添,已知标注推测——PACS推测PACS分类,形式分析,以及结合LDA方法的内容分析,2014年2月26日,晚上6:30-7:30
7、闫小勇,文献自动摘要,分词,热点话题的识别等等技术,加在韦添的后面,2014年2月26日,晚上7:30-8:00
8、张江,推广的投入产出用于国际贸易、食物链网络的研究,2014年3月3日,晚上6:30-7:30
9、李梦辉,文献计量学软件以及背后的理论,包含知识地图、学科前沿等,主要介绍一下 HistCite, CiteSpace, Sci2 tools以及他们背后的理论,2014年3月4日,上午10:00-11:00
10、李梦辉,数据工作总结、热点追踪问题研究小结和下一步计划,2014年3月4日,上午10:00-11:00

整理的文献(有我的,其中也有Ronald的贡献第一部分第二部分第三部分,有解压密码)。暂时仅供内部使用。

我做研究生的时候

我在三个地方念过研究生:北京师范大学,Simon Fraser University, UBC。对很多学生,我的经验不一定有很大的借鉴意义,但是至少比较小的借鉴意义是有的。我稍作整理,比较随意的整理。

我在北京师范大学物理系的研究生导师是杨展如,我们本科热力学与统计物理的老师。所以在入学之前,1998年底或者1999年初,我就拿到了杨老师找过来的一篇中文的关于“Bose-Einstein 凝聚”的介绍性文章。让我从那里开始了解这个领域,看一看硕士期间可以在这个里面做什么。杨老师那个时候已经是副校长,不能很好地随时跟踪文献的新进展。于是,杨老师说,有一天,杨老师是要从我们这里学习新材料的。(杨老师就是这样一个正直、坦率,心胸开阔的人!我觉得我的心胸也还不算小,但是,有什么想不通的时候,我就想想我身边这些心胸特别宽广的人)于是,我从这个介绍性文章开始,追踪文献,看了大量的英文文章。有的时候遇到杨老师、裴寿镛老师,我就问,这个期刊的缩写到底代表什么等非常弱智的,但是又急需得到帮助的问题。那个时候我们没有google,电子图书以及电子图书馆也基本没有。遇到读不懂的文章,就把主要线路看明白(从哪里开始,做的是什么),怎么做的部分留下来,请教杨老师和其他的老师,还有师兄。杨老师基本上就是一个我随时可以获得帮助的地方,给我指点关于这个领域的方向,指出什么地方可以补充这个领域的基础知识。我觉得这个就是一个导师最应该发挥的作用。(当然,也有另外一种类型的导师,做什么,怎么做基本上都设计好了,学生只用学会如何实现。这样的,也有好的,但是我不喜欢。我现在自己做导师的时候,就算我已经完全设计好了,也喜欢把问题和文献给学生,然后让学生悟出来。当然,悟不出来的时候,问我,我可以给提示。)

后来,有那么一段时间,我找到了一个可以做的方向(大约是外磁场中二维BEC的计算。按照经典统计力学二维系统没有BEC,能级简併度或者说态密度决定的。但是,加了外磁场以后简併度改变了,使得二维系统也可能实现凝聚了),但是经过更加广泛的阅读之后发现,这个问题已经被一组研究者完成了。后来,入学之后,学习了高等量子力学之后,还试过一些别的计算,例如计算凝聚体的形状,速度分布,考虑粒子之间的相互作用等等。也经常发现要么我还做不了,要么已经被其他人解决了。现在想起来,这个就是饶毅说的研究生的第一个阶段:很多事都被做了。其实是涉猎的广泛程度和深入程度都不够,够深的话,可以研究更难的问题,够广的话,可以把它与别的东西联系起来。例如,从够深的角度来说,最近我才知道有一个叫做Lattice Boltzmann的方法,也可以用来求解决定凝聚体形状的方程。从够广的角度来说,我后来发现,其实研究网络的研究者也有把网络与BEC整合在一起的。这一阶段,我主要提高了从阅读大量的文献中,整理研究现状,提炼研究问题的能力。我把它叫做“学会做综述”。

过了这个第一个阶段,主要的工作领域,受包景东老师启发,开始做统计系统的Monte Carlo模拟。在这个问题本身仅仅做了一个算不上数的工作,但是,重要的是,第一学会了数值模拟,第二后来把这个工具用来研究社会分工现象(与狄增如老师合作),把两个不太相关的领域连在了一起来看。而且,这个工作提出(后来发现是再发现而已)的利用Boltzmann分布描述决策的思路,非常深刻。这个时候,我已经基本上学会思考的深入的同时,思考的广泛。这个需要随时思考问题,思考的好的习惯,还需要看大量的文献和书籍来了解这个领域。

但是,其实,我花在看文献和书籍上的时间也不是特别多(还是挺多的,但不是主要时间),主要的时间,我是在思考。通常,我会通过某种方式对某一个领域或者某种方法感兴趣。然后,自己思考这个领域的基本科学问题或者这个方法的基本的精神。接着,找一两本这个领域比较新(有一定的前瞻性)的又比较旧(有很好的基础问题的思考)的书来看,接着想问题,与自己之前的思考对比。然后,尝试问自己,该做什么,能做什么,从哪里动手。这个时候,如果有这个方面的综述,我就可以开始利用综述来检验我思考的做什么的问题。如果没有,就做大量的文献阅读。经常,我会发现很多我想做的事情,确实被做了,或者暂时没有发现,等到我开始这个工作,才发现被做了。这个就是我这种基本上独立思考的工作方式的一个缺点:没有阅读足够的文献。但是,这样的方式,确实省时间。前提是,在技术上的准备,在这个领域的基本问题的认识上,做了比较好的准备。而且,这个自己思考的过程不是浪费,把有意义的工作的思路自己想一遍也是快乐的研究问题的过程。进一步,这样的思考,往往引导我进一下一步,思考其他人还没有解决甚至没有思考的问题,这个就更有意思了。我把这个叫做“学会独立思考”。

在BNU和SFU之间,我花了一年多的时间在系统科学系与系统科学系的老师们一起开展复杂网络和经济物理学的工作,并讲授经济物理学和数学模型的课程,指导学生。我做的事情也基本上是思考做什么,怎么做,看文献,总结研究现状。期间,我们通过努力实现了好几个方面研究论文的零的突破,并成功申请获得了多个自然科学基金。让一个硕士毕业的学生有机会承担着么大的责任,这是很难得的。这也是我选择毕业以后直接回来的原因。听说就有硕士生向当时的系主任王有贵反映为什么让硕士生来给他讲硕士课程的。不过,我后来从别人那里当成故事才知道的这件事情。我从硕士二年级开始就带别的硕士开展工作,所以,我自己从来没有觉得这有什么不合适的。我从小学四年级开始代我们老师讲我们自己班里的作业课,我从来没觉得不合适的。

在SFU的一年(博士,没老板),是我开阔思路的方向上非常有成效的一年:把量子系统和博弈论结合,利用复杂网络的思考方式来解决很多实际系统的问题,思考量子力学基本问题(有关测量和随机性,受裴老师启发)。

进入UBC之后,七年多的硕士加博士期间,只研究一个问题:量子非平衡输运定态的求解。这个问题是我的导师Mona Berciu非常感兴趣的问题,但是从非平衡定态,量子力学基本方程,出发的计算,不是Mona的已有研究领域。所以,同样,我的导师对我的指导方式是提供各种帮助。我思考某个问题过不去的时候,导师是我要找的人;我的推导甚至数值计算需要第二双眼睛的时候,导师是我要找的人。Mona非常了不起,我的所有的公式,她必然自己顺着思路独立推导一遍,我的程序的每一个步骤,她也一定做到心里有数。其中,有一个特别关键的地方,我们困住了很长时间,直到有一天,Mona说,你别给我看你的推导了,我已经明白了你的思路,我自己来。然后,经过Mona引入的一个额外的变换,我的计算中一个含时项就变成了不含时项。这个进展直接使得我们的计算变得看起来非常可行。这个看法直到后来遇到$N$很大的时候,方程的维数$4^N$实在太大,才改变的比较现实。之后,我试探了各种求解方程的高效率的算法(我在这个时候学会了数值线性代数,数值分析的另外一条腿,前一条是Monte Carlo模拟),并行计算,稀疏矩阵的计算等等。但是都没有成功地解开我们预期很容易就能够解开的方程。直到第六年的某个时间,我忽然想起来试试Green函数,接着想起来试试相干态表象。事实证明这两个方法都能够极大程度地提高求解这个方程的效率。

第一件重要的事情:对一个领域的基本问题有自己的认识和思考。这个不一定通过阅读大量的文献来得到,而是阅读合理的数量的文献,加上自己的体会,加上已经掌握的相关领域的知识,和解决这个领域的问题的一般技术
第二件重要的事情:梳理文献,建立这个研究领域的图景。这个需要学会如何阅读文献,加工出合适的信息,还需要如何寻找合适的文献。这方面科学学发展起来的技术可以帮忙。例如寻找这个小领域最有影响力的作者和文章是有帮助的。
第三件重要的事情:如果有一件事情可以让你坐上5年以上的板凳,还是很有激情和动力,那么你很幸运获得了一个非常难得的机会,大多数研究生没有这个可贵的经历。

其他的小的经验:不仅仅你的导师是你的老师,非常熟悉的技术才能成为你的思考的一部分(例如,稳定性分析的概念和技术,你需要熟练到一定程度,才能任何时刻都想得起来自觉地去用它。这是为什么你学习非线性动力学的时候需要做一定的练习量。而不能等到其它研究者在这里用了你才知道,哦,原来,这个也可以用在这里!),开阔的视野,好的技术,对领域的深入的认识对于真正的研究工作都是需要的。

owncloud,Cmapserver文件存储的默认路径

owncloud的默认文件存储路径是 /var/www/owncloud/data

Cmapserver的默认文件存储路径是 /opt/Cmapserver/serverRootFolder

需要建立两个单独的分区(可以使LVM的逻辑卷,也可以是实际分区,推荐使用前者),来存储这两个文件库。

另外,修改配置owncloud文件允许4G以上大文件的上传。

dell9020主板加独显需要额外电源的问题

Dell9020加显卡,需要额外的6pin显卡电源接口。原装电源不提供额外显卡电源接口。

换电源的话,Dell9020主板不能用通常的电源,其独特的8pin主板供电,使得通常电源的20pin,24pin供电接口都不能用。由于电压配置不一样,也没法通过把20pin改成8pin来实现。

解决方法很简单:买一根sata电源转pci-e电源数据线。当然,不要买功率太高的显卡,要不然290W的原装电源不够用。

其他人对Big Data, Bigger Physics 的表述

大数据不是数据很大,excel表格装不下,mysql数据库要挂,而是利用记录下来的人类生活的各个方面的数据来检验、发展思想,改进技术,从而改变生活方式。很多以前只能够想想、辩论以下的事情,甚至想不到能够做严肃研究的事情,现在可以在大数据的条件下得到研究了。当然,大数据的获得和维护是基础,是很重要的一个方面,但是重要的多的是用大数据研究什么问题,如何开展这样的研究。这个,不是计算机科学家的任务和强项,而是物理学家的任务和专业:从物理系统做到社会、经济、人类行为的系统。这也是我称之为大物理学(Big Physics)的原因。

我们看看,其他有水平的人怎么说。

1.Big Data Needs a Big Theory to Go with It by Geoffrey West in Scientific American

大数据需要大理论

Just as the industrial age produced the laws of thermodynamics, we need universal laws of complexity to solve our seemingly intractable problems.

正像工业化时代催生了热力学,我们需要新的关于复杂性的理论来解决这个看起来不太好对付的新时代。

2.How Big Data Can Transform Society for the Better by Alex Pentland in Scientific American

大数据如何让世界更美好

The digital traces we leave behind each day reveal more about us than we know. This could become a privacy nightmare—or it could be the foundation of a healthier, more prosperous world.

我们留下来的数字面包屑解释的关于我们的信息远远超过我们的估计。这个可能成为一个隐私的噩梦,或者一个更加健康和繁荣的世界的基础。

Today’s cities and governments still operate according to principles developed two centuries ago, during the industrial revolution. To address 21st-century problems such as exploding population growth and climate change, we need new thinking.

Big data can deliver that thinking. The digital bread crumbs we leave behind as we go about our daily lives—which reveal more about us than anything we choose to disclose—provide a powerful tool for tackling social problems.

Alex Pentland’s next book, Social Physics: How Ideas Turn Into Actions will be published in January 2014 by Penguin Press.

Alex Pentland的下一本书:社会物理学:思想如何转变成行动,将在2014年一月由Penguin出版社出版。