数学家经济学家生命科学家物理学家追热点的工作终于被JoI接受了

Menghui Li, Liying Yang, Huina Zhang, Zhesi Shen, Chensheng Wu, Jinshan Wu, Do mathematicians, economists and biomedical scientists trace large topics more strongly than physicists?, Journal of Informetrics, 11(2), 598–607(2017).

经验获得:1. 用的专有名词,即使跟之前的其他人使用的意思基本无关,即使看起来一点也不像专有名词,还是要把它和之前的联系起来,做好明确的区分。2. 如果有可能,让领域内的专家读一遍提一提问题,会很有帮助。就是这样的专家不好找。以后还是要尽量多找找。

额外获得:通过这篇文章额外收获了两个合作者。 他们还是觉得这一系列工作,尽管有各种非专业的缺陷,但是,很有新意,很不错。合作项目已经基本设计好。

科学学研究工作整理

以下是部分已经完成的工作和正在开展的工作。欢迎所有人来合作和讨论。甚至直接拿过去做就行,只要做的时候给我一个消息

在科学学方面,核心的创新是围绕下面几个方面:科学学三层网络框架、间接联系、概念网络。对于什么是科学计量学这个问题的认识,可以看之前的总结。具体研究工作随手记下来的有这些:

  1. 框架和间接联系用于论文-专利-基金分析,回答相互联系的问题,用于作者-论文-主题回答作者论文多样性创新性问题、作者论文主题评价排序的问题、相互影响的问题。方法上考虑发展广义投入产出用于多层网络。
  2. 广义投入产出用于单层网络(个方法的比较:固定外界的,封闭系统的,目标外界的,以及和pagerank的比较)
    1. 把基金数据和aps国家数据合并,做成一个基金国家当做外界,国家乘以领域作为投入产出部门的投入产出表,分析某国家的基金总量或者某领域的基金对于某国家某领域的贡献
    2. 领域为单位的投入产出表(文章已发表, Journal of Informetrics)、国家领域为单位的投入产出表、城市领域为单位的投入产出表、期刊为单位的投入产出表、论文为单位的投入产出表。间接影响,排序,相互关系。
    3. 引文网络中的真引用:给定论文,其引文中最关键的,引用其的论文中最受其影响的(Measuring academic influence: Not all citations are equal, Transitive reduction of citation networks, Tracing the evolution of physics on the backbone of citation networks)。
  3. 追热点和领域演化问题:
    1. 中国科学家是否经常在领域变热之后大规模加入,还是有提前量:分析领域大小时间序列和这个国家论文这个领域论文数量时间序列的相关性,时间延迟相关性和Granger相关性(李梦辉)。
    2. 领域演化的Allometric标度律(文章已发表, Scientometrics)和科学家发文章追热点行为(文章已发表,Scientifc Reports, Journal of Informetrics,链接是arXiv上的,等JoI出版正式版本再修改链接)
    3. 引用论文是否存在热点追踪现象:把论文的引用次数当做热点指标,看每个单位时间内的新引用分布是否符合现有的文章的热度的函数(李梦辉)。
    4. 论文审稿等待时间、被引用次数、作者属性(h指数、文章数量、被引次数、获大奖)、 文章标题属性、图的属性(数量、是否美观等)、参考文献属性(数量、总被引次数)等之间的相关关系分析。等待时间和被引用次数的工作已经发表于Scientometrics
  4. 大鱼吃小鱼,平等和效率的问题。先看平等问题,将来再看好不好,效率问题
    1. 中国和国际科学家的基金金额和工资,是否存在大鱼吃小鱼现象,Gini系数的时间演化规律。同样的问题可以在学校研究所的层次来讨论(沈哲思)。
    2. 学校层面还可以讨论其他指标的Gini系数,例如总学生人力资本量。投入阶段,可以用高考成绩,产出阶段不好办。
  5. 学科概念地图到学习顺序、状态检测,到hem效率降低。
  6. 作者的问题选择,追哪些因素
  7. 多大才够大,用于期刊学校科学家(教学、科研)评价。
  8. 三层网络用于论文聚类,考虑word2vec。和单层网络比较。
  9. 数据建设:
    1. 整合wos和专利、基金
    2. 建立学科概念地图(自动Wikipedia、人工)
    3. 利用机构领域,加上合作网络,来做作者姓名识别。
  10. 服务:
    1. 综述点评网
    2. 技术部门-学科领域相互关系研究发布(做图用方块,横向直接纵向间接?)
    3. IOF各主体排序
    4. 做一个软件给每篇文章产生一个概念地图形式的摘要
    5. 科学计量学iof分析软件(IO-Scope)

从“莫名其妙”的理解看语文学习和教学

心儿回家做作业,能用“莫名其妙”造句,能够大概说出来它的意思“不能说出来原因或者道理”。我让她解释一下“名”什么意思,“莫”什么意思,“其”、“妙”什么意思。解释每一个字的时候,要注意合起来为什么是这样一个意思。心儿居然知道“名”是说出来的意思,但是,其他都不知道。这让我非常吃惊。

她说,“名”的意思是老师上课讲过的。按道理来说,既然老师有讲“名”的意识,自然是知道学生对整个词语的意思的理解是构建在对每一个部分的理解的基础之上的,也就是了解理解型学习。那么,原则上,老师应该也提过这个词里面其他几个字的意思。因此,很有可能是心儿上课没有认真听主动思考。但是,回过头来,我教孩子的时候,说过,你考多少我都开心,你学到多少知识我也开心,都有奖励,当然高一点多一点会有额外的奖励,只要做到主动思考多问为什么。这个表现在语文上,就是第一做好总结,第二做好分析性阅读(问主要信息是什么,怎么表达,为什么这样表达,为什么表达这个信息,我喜欢吗),第三做好字词的分解和理解,以及第四个更高的层次——有东西要表达愿意表达,也就是我说的“我说我想说”。心儿在第一个表现不错,第二个上也可以接受,竟然第三个完全不是这么想的。我觉得不可思议(“莫名其妙”)。每次心儿问我一个词一个字什么意思的时候,我都是尽量从分解、联系、对比的方式来解释的。我觉得应该能够养成好习惯。

因此,我非常怀疑,是在小学学习的某个阶段,这种分解、联系、对比的理解型学习方式,被“你就记住这个词(字)的意思,会造句(组词)就行了”给代替了。如果有机会,我希望心儿的老师能够帮我解答一下这个疑惑,到底是心儿没有认真听讲,还是学校的学习没有注意鼓励,甚至是反过来压制,孩子的分解、联系、对比的理解型学习方法。

分解、对比(找共性找差异)、联系以及再一次的整合成一个整体,这就是学习方法,也是科学研究方法。物理学、化学、生物学,整个科学都是这样研究的。在整体的层面看起来很不相同甚至不相关的事情,做好分解之后,经常会被联系和统一起来。这样看问题就简单深入。也就更加容易做思考、问题解决甚至问题提出的迁移。深入和迁移,就能够促进创造。

这也是为什么我们要提出来学习汉字需要依靠汉字之间的关系,学习科学概念需要依靠概念体系(也就是概念地图,学科大图景——基本问题、典型思维方式、典型分析计算方法、典型例子)。这也是为什么有的时候减轻学习任务——例如某些困难的概念不学习或者要求低,实际上会使得学习任务更加重:缺了这一环,其他的东西反而更加难以理解了,只能靠记忆了。是否理解起来困难不是选择是否当做学习内容的标准,而应该是从整个学科体系的学习来判断,就好像我们在汉字研究中做的一样。

顺便,沿着这个思路,我应该去研究一下,是否在网络中去掉某些顶点之后,状态探测变得更加困难或者学习成本变得更高。如果仅仅运用记忆型学习,自然,东西越少越简单。但是,很有可能,从整体的角度,去掉某些顶点,却更困难了。

昨天,通过一位老师了解到,除了我了解比较多的Ausubel、Novak的理解型学习和概念地图,科学(尤其是物理学和系统科学)的系联性思考,Bruner的结构主义教学(可以看《教育过程》一书)也提出了类似的思想:知识不是教学目标,对知识的组织和理解,是教学目标。或者说通过学习对知识的理解和组织来学习的这样的方法是教学的目标。所以,这个思想还是不少人有的。包括写《教育的目的》的Whitehead,以及其他更多人。但是,一方面,我还是觉得,批判性思维、系联性思考以及关注学科大图景(从大图景来选择教什么,怎么教,并且这个选择是可计算的——见我们汉字学习的工作),这个提法比结构主义教学更合适。另一方面,我们的研究工作使得这个思想能够做计算了。这个还是有贡献的。下一步,就需要把这样的具体学科的网络找出来,算出来,做做教学和学习实验看看,然后再整理出来一个方案。

如何阅读文献

阅读文献,根本上就是思考和理解的问题,因此,原则就是一条:尽量多问为什么,尽量去理解。

当然,根据文献的不同要求有所不一样。例如,大部分当做背景和兴趣拓展的文献,主要关注文献的逻辑框架就可以了,主要问了一个什么问题,什么地方是新的(问题、方法还是结论方面的创新,还是看问题的角度,还是新的理解,新的整理工作的线索),大概如何做的,有什么不足,在整个学术背景下面属于什么层次的问题,你喜欢或者同意吗?如果是直接工作的基础,还需要做综合性批判性阅读,也就是看看其他人的工作和这个工作的关系,其他人怎么看,你怎么看。如果不仅仅是问题和思想的工作基础,还是方法的工作基础,还需要搞清楚怎么做的,达到必要的时候能够重复这个工作的程度。

我以为,这也就是阅读文献的全部了。也就是:What(主要信息是什么),How(这个信息如何传达的),Why(为什么作者要传达这个信息),Meaningful(对我来说意味着什么),也就完了。但是,今天学生讲文献的时候,我发现,根本问题不在这个层次上。也许,阅读文献,确实也是要学习要教的。在我下面讲细节的层次之前,再一次强调,看文献就是多问为什么,多理解,多思考WHWM的问题,搞清楚整体逻辑框架,做一些综合性批判性阅读,甚至整理出来一个这方面研究的综述。

再来说细节层次的如何阅读文献。第一,把公式的数学形式和公式的动机、目的联系起来,问为什么要写成这样。公式不是用来记住和使用的东西,而是一种思想的表达。不理解的东西是不可能拿来用并且用得好的。第二,把图表和主要结论联系起来,问为什么这个结论可以从这个图表里面得到,问为什么作者要用这样的图表。当然,更深一个层次的问题,也就到了作者为什么要表达这个结论或者信息这个属于我前面提到的更高层次的问题。第三,把自己当做计算机,问有足够清楚在每一步做什么吗(具体每一步怎么做是不是要搞清楚,需要考虑自己的研究工作和文献的关系)?

另一个技术问题,我发现竟然学生不知道通过google和Web of Science以及Scopus等专业数据库来检索文献,而是依靠百度。我真的没想到,这个东西也是要教的。自己摸索,只要有心,三两下就搞定了。因此,这也反映出来,现在的学生确实浮躁,不深入思考。就算老师给一个非常明确的问题,只做体力活,还可以直接发Nature,也是没有意义的,它不能锻炼你的研究能力,仅仅是干学术民工的能力。

找到合适的文献是文献阅读的重要一步。从某几篇论文开始,通过引用关系,向前向后追踪,直到找到某个综述或者追踪出来一个整体图景,是一个方面。另外,通过同主题检索,有的时候甚至作者检索,获取比较全面的了解,也是很有必要的。这些文献数据库,还有知识图谱,对于学术研究真得是有用的。例如,我写基金的时候找的那一堆文献,就是在我已经有了对问题的了解和自己想做什么之后(一般来说,看文献之前需要有对问题的了解和自己的想法,如果没有,看太多文献是很危险的。思考在前,看在后。当然,你一定要问我看之前思考怎么来,我不得不承认有的时候需要先看一点点。注意,是一点点。关于这个问题,推荐看看《科学研究的艺术》这本书),通过以上两种方式,收集整理出来的。先找到Narin这个人和他在linkage上的主要工作,然后向前向后追,接着用追到的论文为基础,展开同主题和同作者检索和阅读,最后,形成自己的综述。综述并不是单纯地把其他人工作做一个总结,还需要整理,整理出来一个组织这些工作的线索脉络,而且还需要关注自己想做的问题和前人的工作的关系。

回到读文献的更高的层次。阅读文献的目的,一方面固然是学会怎么做,看到大家在做什么,甚至从怎么做和大家做什么的结合的地方发现前人工作的不足从而开始做点工作,但是,更重要的目的是,通过了解这个问题的整个研究现状,把自己的研究工作放到整个学术背景的下面,更清楚地了解学科的发展方向、基本问题、典型思考方式、典型分析方法这个我叫做大图景的东西,以及在这个大图景下,自己的目前和将来的工作是什么地位。当然,今天也遇到另一个文献阅读做的好一点的学生,思考比较深入,还有了一点点体系。

再一次推荐大家去看《如何阅读一本书》以及我的《概念地图学习和教学方法》,去掌握批判性思维、系联性思考,以及养成多问为什么的习惯。

读《谈谈方法》和《社会契约论》有感

科学知识和科学精神不是一回事。科学精神需要通过学习科学知识来体现和体会。学习科学的主要目标却不是科学知识而是对科学知识的内涵、来源以及背后的原则的理解。这也是为什么我开设《学会学习和思考》:学会科学地思考问题,看待世界,远远比学会具体科学知识重要。当然,不经过具体知识尤其是对具体知识的体系化的整理和理解,根本就谈不上领会科学精神。具体学科的知识和具体学科的思考方法,每一个学科,都不一样。但是,很少的几样有共性的科学精神还是有的。那就是:怀疑和反思、构建一个(相容的尽量统一的假设尽量少的可计算的)心智模型来理解世界的企图、做实验和尊重事实、做计算(依靠数学来做逻辑推理)

在物理学的发展而言,Plato的精神世界对应着现实世界(或者应该反过来说,甚至认为只有精神世界才是真实,现实世界仅仅是虚像)、 Socrates的思考和反思、 Aristotle企图建立物理学是什么(关于运动和世界怎么样,为什么的理论和思考)的体系、Descartes的怀疑是一切科学的基础(“我对我自己是否存在的反思证明我存在”、“我从来不把没有经过反复思考的东西当做真理”)、Bacon的经验主义和归纳,这些应该算作物理学建立的思想上的基础,也就是“怀疑和反思、构建一个心智模型来理解世界的企图”这一部分。而Galileo的实验和理想实验(确实对物理学具体知识的贡献已近非凡)真正使得物理学依靠做实验的方式从哲学中独立出来应该算是做实验和尊重事实这一部分。接着Newton对天体运动记录的深入思考以及把天体运动和Galileo的地上运动统一起来的万有引力模型和动力学方程以及表达动力学方程的微积分的提出,应该算可计算这一部分。所有的这些——怀疑反思心智模型做实验做计算——合起来是物理学也是现代物理学的基础,尤其是相对论和量子力学。物理知识进步了发展了变化了,科学思想仍然是一样的。这些有的时候也被称为科学方法论。

一直学物理,更加关注具体知识,直到有一天开始上课,才渐渐开始关心如何把自己对科学的背后的理解,对科学知识的来源和体系结构的理解,对概念之间的联系的理解,传授给学生,促进学生理解科学,理解科学的发展,甚至促进社会的进步。于是,开始看起来Whitehead和Descartes。强烈推荐每一个做科学的对科学感兴趣的教科学的都看看Descartes的《谈谈方法》和Whitehead《教育的目的》。其中,Descartes在《谈谈方法》以自身的理性思考的经验为基础提出来:
1. 从来不把没有经过反复思考和反思的东西当做思考的基础(怀疑反思);
2. 把问题分解成更简单的小问题来处理(分析);
3. 认识问题要有一个从简单到复杂的顺序,或者对于还没有这样的体系的东西也要建立起来这样一个顺序体系(联系、体系);
4. 尽量反复全面地考察问题(一致性最少假设)。
科学不就是用这样的一个方式来考察世界得到的结果吗。Descartes不仅是一个思考者,他还把这样的思考真的用来发展具体的数学知识(解析几何)和物理学知识(光学)。除了批判性思维,Descartes在这里还提到了系联性思考。

一个学会了用这样的方式——批判性思维、系联性思考、心智模型、做实验、做计算——来认识世界思考问题的人,不仅仅能够更好地理解自然的世界,可能还可以促进社会的世界的进步。不过,这个时候,我开始想,学会了思考和学习,还差什么才能真的促进社会的进步呢?所为促进社会的进步,不是指你在这个社会里面混得如鱼得水,很自如,而是你思考问题所在你思考出路在哪里。这个时候,Rousseau的《社会契约论》就突然出现在我的脑子里:一个稳定的社会成为社会的基础是什么?一些个体为什么要一定程度上服从另外一些个体,或者服从另外一些个体所代表的集体?要知道,Rousseau他自己可不是一个统治者,也不算贵族,甚至不算大富,在当时以血统和权威作为基础的社会里面,怎么会开始一个关于统治权问题的如此跳脱的思考呢?例如,他论述强权不是社会的基础的时候,是这样说的:如果强权是基础,那么,当有人开始不服从并且获得了更加强权的地位的时候,是不是就反过来大家——包含之前的处于强权地位的个体,就要服从这个新的强权呢?于是,你看强权不鼓励服从啊。接着,他开始问既然强权不是基础,那么是不是有一部分人真的可以放弃一切呢,例如奴隶制社会的奴隶。这个时候,也许你可以认为已经有能力做出放弃的选择的成人可以放弃,但是就算如此,他们也没有权利代替他们的子女来放弃啊。于是,一部分人主动放弃一切权利主张也不是社会的基础。那么,到底什么是社会的基础?

你可以看到,在这个问题完全没有答案的时代,在这个问题甚至否没有提出的必要性的时代,Rousseau开始探讨这个问题,并且提供了一个可能的答案:契约。为什么他能够做到这样,怎么做到的,不过就是反思,不断地深入地反思。

一部分人已经能够吃饱饭了。让吃饱饭的人中的一部分思考起来,是我们教育者的责任。启发他们思考什么(看什么书),帮助他们做如何思考,是我们思考者的责任。

对了,说起来看什么书,思考什么问题,推荐大家,尤其是教育者,看看我的这本书《概念地图教学和学习方法——教的更少学得更多》