写给研究生的研究方法

最近,我在学习概率图模型。其实,好几年前,从我做汉字学习和检测算法的时候,我就知道(也谢谢周海军的工作给我的启发,我记得是不是海军有一次聊汉字工作的时候还提到了概率图模型来着,但至少是提到过消息传递算法),我需要概率图模型来解决汉字检测的问题:在汉字检测中,我们需要回答两个可以用概率图模型来回答的问题。第一,我们需要算出来一旦测量了某个汉字并且得到被试认识或者不认识这个汉字这个结果之后,其他的没有测量过汉字的认识和不认识的几率如何变化。第二,有了第一个结果,我们还需要确定一个最优的检测顺序,使得测量尽可能少的汉字却能得到尽可能多的汉字的是否被认识的信息。

但是,由于各种原因,我连《概率图模型》那本巨著都买了(谢谢王馨帮我千里迢迢背回来这么死沉死沉的书),也没有真的开始学习。直到最近,乘着Daphne Koller的概率图模型公开课,终于老老实实学习了一下。目前,已经完成第一遍的学习,了解了知识,基本上想通了这些知识之间的联系,了解了这个领域在做什么基础理论上和应用上。现在,在学习第二遍,开始思考知识之上的层面,例如怎么用,这个课为什么这样讲为什么讲这些。无论上面的哪一个层面,Daphne的课都非常值得借鉴。

当然,下一步就是去把这个方法用来解决我的汉字检测的问题。并且,很有可能,我们的第二个问题,是超越目前的概率图模型的框架的,也就是一个基础性的创新。同时,随着研究的开展,也会需要再一次地来学习某些和具体研究直接相关的内容,促进研究的开展和对概率图模型的理解。

从这个例子,我想向研究生说一点关于研究方法的事情。研究上的创新主要包含:新问题、新方法、新整理的思路(也包含新理解新解释)、新结果。而且,这里的新意的程度是有相对顺序的。新问题和新方法最重要,新结果最低。因此,那种修改别人的模型参数,得到一些新结果的,除非结果本身的新意特别大,跟前人的结果有定性区别,意义不大。

按照这样的一个新意的追求,研究上的创新也有一个一般过程:找一个感兴趣的问题,先思考大概怎么做,有了整体思路或者至少有方向了再来看文献检验这个思路或者方向,接着进一步学习必要的技术,做出来,检验一下。

你说,那我要是就没有问题怎么办?那是平时学习和思考的方法不对。永远要批判着学习和思考,不是接收,慢慢形成对一个领域的整体认知。无论是学科的基础问题,还是实际现象,都能够启发你提出新问题。当然,如果别人已经提出问题,但是就是没有好方法,那这个新意也是不错的。

你问,不看大量文献,怎么形成整体认知?看了呢,又违反了上面的现有问题思路和方向,再来看文献的方法。那是看文献的方法不对。只要冲着整理整个领域的典型研究问题、思维方式、分析方法去看,就不需要看大量文献,不需要看太多细节。看文献是为了构建自己对学科的大图景的认知地图,而不是去记住人家怎么做,照着做。当然,你要是都学不会人家怎么做,那也是白看。进得去,出得来,还能反思。这就是看文献的要求。

你说,我就是学不会从细节到整体,从整体到细节的大图景学习,理解型学习和思考,那怎么办?那,再努力一下试试,但是如果还不行,就请你不要走学术研究,至少理科的务实的提出问题和解决问题的,这条路。赶紧赚钱去吧。任何工作都是职业上的区别,而且,一般来说你走其他的路,赚的钱都比走学术的路要多。所以,不要在学术上困死,除非你跟我一样特别愿意和享受做学问,还能做,还不太计较赚钱多少。

硬核本科人才培养

学习的根本目的是创造知识、创造性地使用知识,以及欣赏知识的创造和创造性的使用,对于这些目的,最重要的是对知识的理解。这就需要通过“以成长型思维和学科大图景为目标的以批判性思维和系联性思考为指导的以概念地图为基础基础的理解型学习”,搞清楚学什么、怎么学、为什么学这个。除了学习方法的基础,当然,创造和创造性地使用以及欣赏,还需要学会一些前人的知识和前人解决问题的方法以及其中体现的思想。那么,这样的知识和思想,以及解决问题的过程和经验的体验,包含哪一些呢?

首先,本科所学习的东西,要比较基础,比较普适,将来可以专门化到多个领域。在“学科层次和本科专业选择”这个帖子里面我讨论了学科的层次结构。从中可以看到,做为科学的语言的数学以及最体现科学的精神的物理,正好就是满足上面的要求的要学习的东西。

其次,一定要在一定量(越少越好)的学会具体知识的基础上,体会好每一个学科的大图景,也就是典型研究对象、典型研究问题、典型思维方式、典型分析方法、和世界还有其他学科的关系。

最后,还要进一步从具体学科的学习升华到上面的理解型学习的目标——学会学习和思考:“以成长型思维和学科大图景为目标的以批判性思维和系联性思考为指导的以概念地图为基础基础的理解型学习”。

当然,补充一下,创造体验式学习和以项目为基础的学习,是非常重要的教和学的方式,“做中学”、“学以致用”能够帮助学习者更好地实现上面的几个学习目标。

顺便,最近学院在讨论系统科学本科人才培养。在这个帖子里面,我来分享我对本科人才培养的思考。我先设计一个硬核版本的,将来再设计一个更软一点的。在“工具、课程与学习资料”这个帖子里面有一部分课程的学习资源。

硬核版本本科培养目标:具有扎实数学物理知识和思维方式(批判性思维、系统性的知识体系、数学和科学的关系等)的基础,具有对一两个专门领域的一定理解,具有一定创新精神和成长型思维,具有系统思维(系联性思考)的多学科复合型人才。

核心课程

  • 学习方法部分:学会学习和思考(理解型学习、创造体验式学习、以项目为基础的学习、讲给别人听、分解和综合、系联性思考、知识的系统性)
  • 数学部分:数学分析(或者微积分)、高等代数(或者线性代数)、概率论、统计学、复变函数(选修)、拓扑学(选修)、群论(选修)、微分几何(选修)、泛函分析(选修)、优化理论(运筹学、控制论)、微分方程定性理论(选修)
  • 物理部分:力学、分析力学、统计物理学(压缩热力学部分)、电磁学电动力学狭义相对论结合(压缩内容,主要学会对称性、电磁学中的数学、狭义相对论的提出等)、高等统计物理学(选修),量子力学(选修)
  • 计算机科学部分:算法导论、编程语言(做中学)和编程方法(面向过程、面向对象)的结合、科学计算(微分方程数值求解、数值积分、数值线性代数、插值、作图),机器学习基础(选修)
  • 系统科学部分(夹带私货):系统科学概论(有整理出来的具体研究工作案例支撑,有听一听的,还有做一做的,或者分为系统思维1和2)、数学建模(最重要提升用数学结构描述世界的能力,也学习一些典型现象和对应的模型,不过最重要的是这个构建对应的过程以及其中体现的思维。例如,可以结合以具体领域的例子支撑的非线性动力学,可以把量子系统的行为到量子状态的矢量描述当做例子)、数据科学(从数据中获取信息的能力和技术)、网络科学(系联、和矩阵分析的关系)、复杂适应性系统
  • 经济学部分:微观经济学、博弈论、计量经济学(选修)
  • 领域方向课部分:经济学导论(选修)、生物学导论(选修)、神经科学导论(选修)、地球科学导论(选修)、环境科学导论(选修)、教育学导论(选修)、历史学导论(选修)、人工智能导论(选修)、语言学导论(选修)

具体课程目标

  • 学会学习和思考:以成长型思维和学科大图景为目标的以批判性思维和系联性思考为指导的以概念地图为基础基础的理解型学习、创造体验式学习、以项目为基础的学习、讲给别人听(同伴教学法)、分解和综合、系联性思考、知识的系统性。以具体学科的学习为例,从知识的学习中提炼出来学科大图景,解决学什么、怎么学、为什么的问题。直接先修课(间接依赖的忽略):无,实际上需要学习者对一两门课程具有比较深刻的认识。
  • 力学:力学世界观(系统的状态,状态描述,状态变化的原因)、一个学科的系统化的概念体系(用最少的基本概念和假设来通过逻辑构建整个理论)、数学是科学的语言(描述世界,开展思考)、科学和现实的关系(科学是世界的可计算的可证伪但是迄今为止尚未被证伪的心智模型),用具体的力学的知识来体现好上面这些目标,力学是物理学的导论课,甚至是整个科学的导论课。直接先修课(间接依赖的忽略):数学分析(最好能够在课程之间例如和数学分析或者微积分协调一下,帮助力学的学生能够具有学习力学的基础,力学的老师呢可以把需要微积分的地方稍微往后一点等等微积分的进度),如果没有数学分析的基础,则需要增开一个实用微积分短训。
  • 分析力学:从最小作用量原理得到整个力学理论、变分方程的运用、乐朗德变换的运用、力学系统的完整描述(拉氏量、哈密顿量),做到能够从一个系统的完整描述开始得到所有的力学信息。直接先修课(间接依赖的忽略):数学分析、力学。
  • 统计物理学:从力学到统计物理学的推导的尝试、平衡态统计的系综理论(理想气体、Ising模型)、关联函数、相变、平均场理论、布朗运动和随机过程、统计物理学在其他系统中的运用,做到能够用分布函数及其演化方程的方式来描述物理的以及其他的多体系统以及在这中间的例如关联函数和平均场理论等一些方法。直接先修课(间接依赖的忽略):数学分析、线性代数、概率论、分析力学。
  • 电磁学电动力学狭义相对论结合:从电磁学的现象到积分形式的基本方程、从积分形式的基本方程到微分形式的基本方程、用格林函数和对称性来在一些具体系统上求解这些方程、位移电流的引入、光速不变的发现,实验和理论上的困境导致狭义相对论的出现、狭义相对论的基本内容(时空、距离),做到从实验和理论上的困境出发来找到突破口找到更加统一的理论,同时也学习一点场的数学。直接先修课(间接依赖的忽略):数学分析、力学,推荐具有分析力学的基础。
  • 高等统计物理学:关联函数临界现象和相变、平均场理论的更多表现形式、随机微分方程和统计物理学中的随机过程、Kubo的非平衡统计力学框架(投影算符、有效方程)、统计物理学的研究实例。这门课是在眼界和具体方法上对《统计物理学》的补充。直接先修课(间接依赖的忽略):数学分析、线性代数、概率论、分析力学、统计物理学。
  • 量子力学:量子系统的行为、量子状态的数学模型、量子状态变化的数学描述、对其他可能的理论形式的探索。这门课能够非常好地体现科学和现实的关系,科学和数学的关系,从知识都到科学研究的过程、困难、创造和逻辑,同时也对矢量的一般威力有一定的认识。直接先修课(间接依赖的忽略):线性代数、分析力学。
  • 数学分析:集合、映射、极限、微分等概念体系为主,具体计算为辅,主要启发学生做深入和严密的思考,面对当年数学基础的挑战,顺便也学点无穷小、微积分等知识。直接先修课(间接依赖的忽略):中学数学。
  • 线性代数:集合、映射、矢量空间,矩阵论,做到善于把实际对象变成矢量和矩阵。直接先修课(间接依赖的忽略):中学数学。
  • 概率论:古典概型、现代概率论、随机事件和随机变量、中心极限定理、大数定律、贝叶斯公式,做到对概率论的基本概念和重要结果心里有数,能够把问题变成概率论问题。直接先修课(间接依赖的忽略):数学分析、线性代数。
  • 统计学:经验分布函数(empirical distribution function)、样本、置信区间、统计学基本问题(从给定样本中得到经验分布以及这个经验分布的接近程度)、非参数估计、参数估计、p值的含义和问题、贝叶斯推断,做到对统计学的基本问题心里有数,能够把问题变成一个统计学问题。直接先修课(间接依赖的忽略):概率论。
  • 数学建模:用具体的建模过程、学科发展过程的例子,来展示什么是数学建模——也就是把实际问题变成一个数学问题然后解决问题的过程。做到把实际现象和问题变成数学物理学问题,用合适的数学结构和物理概念来描述世界,了解科学研究的基本过程(从现象或者理论中提出问题、把问题数学化、求解问题、检验和推广答案)。这是整个科学课程的核心之一。直接先修课(间接依赖的忽略):数学分析、线性代数、概率论、力学、统计学。
  • 数据科学:给数据建模挖掘出信息的思维习惯和能力,时间序列处理、统计模型、关系数据的处理。直接先修课(间接依赖的忽略):数学分析、线性代数、概率论、统计学、编程语言和编程方法、机器学习,推荐具有数学建模的基础。
  • 系统思维1,2:用具体的研究工作的例子来展示系统科学都能够做什么,系统思想在里面起到了什么作用。一定要把(目前阶段看到的)系统思想提炼好,体现这些思想的例子分类分层次整理好。其中第一门课不太需要学生动手算,能欣赏,看出来哪里系统科学了,了解点什么是系统科学就行。直接先修课(间接依赖的忽略):高中数学、高中物理。第二门课,要求学生能够算,甚至能够主动提出和解决问题。直接先修课(间接依赖的忽略):数学分析、线性代数、概率论、力学、统计学、统计物理学。
  • 网络科学:用网络——相互联系起来的事物——来描述世界,解决问题的思维习惯和能力、典型网络分析方法和软件包、网络谱理论(矩阵、张量)、网络上的过程、网络的演化、网络的典型应用。直接先修课(间接依赖的忽略):线性代数、概率论、编程语言和编程方法。
  • 复杂适应性系统:内部状态和外部驱动互动更新的系统的典型例子和应用,也可以放到数学模型里面讲授。直接先修课(间接依赖的忽略):数学分析、线性代数、概率论、力学、编程语言和编程方法。
  • 优化理论:运筹学、控制论,现代视角:静态和动态过程的给定目标和约束的优化问题,和网络等学科的结合,和实际应用结合。直接先修课(间接依赖的忽略):数学分析、线性代数、分析力学、科学计算。
  • 编程语言和编程方法:编程的基本逻辑(教计算机干明确地的活)、变量、状态、操作、逻辑门、图灵机,顺便学会一门语言,了解和运用面向过程编程、面向对象编程。直接先修课(间接依赖的忽略):无。
  • 算法导论:典型优秀算法的思想、编程、应用和算法复杂度分析、可计算性。直接先修课(间接依赖的忽略):数学分析、线性代数、编程语言和编程方法。
  • 科学计算:数值微积分、插值、Monto Carlo、数值线性代数,科学计算软件包、并行计算、Linux操作,具有较强通用性的科学计算的算法和算法的运用,结合以项目为基础的学习。直接先修课(间接依赖的忽略):算法导论、编程语言和编程方法。
  • 机器学习基础:神经网络模型、优化算法、典型机器学习问题和算法、自然语言处理、知识图谱、自动机器学习,帮助学生准备进一步学习和发展更加专门的机器学习算法的基础。直接先修课(间接依赖的忽略):数学分析、线性代数、概率论、算法导论、编程语言和编程方法,推荐具有网络科学的基础。
  • 微观经济学:理性人假设、给定共同约束和共同目标的优化问题在经济学上的应用,结合经济学导引介绍一般均衡理论等整个经济学的大厦如何依赖于微观经济学,理论框架的问题。直接先修课(间接依赖的忽略):数学分析,推荐具有优化理论的基础。
  • 博弈论:多方可能有冲突的约束和目标的优化问题在经济学上的应用、多方的理性人假设,结合经济学导引介绍一般均衡理论等整个经济学的大厦如何依赖于博弈论,博弈实验研究和理论框架的问题。直接先修课(间接依赖的忽略):数学分析,线性代数,推荐具有优化理论的基础。
  • 计量经济学:截面数据的处理、时间序列数据的处理,回归、结构方程模型等统计模型,典型随机过程及其在经济数据和经济问题中的应用。也可以把内容拆分以后放到数学建模和数据科学里面。直接先修课(间接依赖的忽略):微观经济学、统计学,推荐具有数据科学、数学建模的基础。
  • 各学科导论课:用具体例子,体现好每一门学科的大图景:典型研究对象、典型研究问题、典型分析方法、典型思维方式、和世界还有其他学科的关系,精炼、清晰、深入,低起点、高终点。尽量做到除了大学基础数学(数学分析、线性代数、概率论)和物理(力学)之外,不需要其他先修课。

104536355

后续待补充

什么是研究工作,什么是一个博士生的研究工作

学习的根本目的是为了创造知识、创造性地运用知识、欣赏知识和知识的创造过程。当然,顺便,为了实现这些目的,最重要的是理解知识,也就是看到概念之间的联系、看到概念和它诞生的时候的问题的联系、看到概念和学科大图景(一个学科的典型研究对象、典型研究问题、典型思维方式、典型分析方法、和世界还与其他学科的关系)之间的联系。只有在学习的时候得到了深刻的理解、用了研究性学习(创造体验式学习,把一个概念的典型场景从原始论文或者其他地方提炼出来,设计好一个问题,让学生通过解决这个场景问题来自己提出概念),才能帮助我们做好的研究。不过,这个理解知识不是我们今天要说的重点。我们今天来说说,既然研究是学习的根本目的之一,甚至也是学习的重要方法之一,那什么才是研究,尤其对于一个博士生来说。

首先,研究是大概来说这样的一个过程:提出问题之前的准备(包括学科知识和大图景的研究性学习、论文阅读,论文阅读要看到论文之间的联系,形成概念地图,得到所研究问题的来龙去脉和现状的整体认知)、提出问题、把问题形式化(例如变成一个数学问题、变成一个实验)、求解问题、检验答案(先假设形式化准确,用其他方法或者极端情况来对比一下一般的答案,设置对比实验组;如果过了这一关,回到形式化这一步,看一看假设是否可以接受,如果修改其中某些假设会怎样;最后,可能还要做实验和实践的检验),以及之后的撰写和投稿论文(这里也有很多技能要学习,例如结构化写作)。一个希望做研究工作的人,毫无疑问,要通过一两个工作来对这个研究过程形成一定的认识。尤其是提出问题这一步,就算在导师已经提好问题的情况下,也要回到场景去体会一下,问

  1. 为什么会提出这个问题?
  2. 如何提出的这个问题?

当然,熟悉过程,学会一些技能,理解好学科,这些都是训练。基本上是硕士阶段应该完成的事情。当然,随着研究工作的开展,你对学科可能会有更好的理解。如果是博士,则还有更高的要求:你得是某个方面的专家,以及有一两把善于使用的刀子,以及对某个领域的兴趣和对磨刀子甚至发明刀子的兴趣

其次,研究不仅仅是上面的那个过程而已,研究是通过找到和解决一个学科当前还不能解决的问题(可能是形式化之前的偏实际场景的问题或者形式化之后的偏理论体系的问题)来补充甚至重构这个学科当前的知识体系和大图景。对于后者,有的研究工作会给这个学科提供新的思维方式分析方法,因此,不仅仅是解决了某个问题而已。因此,对于任何一个研究工作,都要问类似这样的问题(对于欣赏他人的研究工作,也要问类似的问题):

  1. 在我自己要做的这个研究之前,
    1. 这个问题确实还没有解决吗,没有人研究过或者说没有人用这种方法研究过吗?
    2. 这个问题可能的答案是什么,如果我们得到了某个答案,对于整个学科甚至整个科学和技术来说,意味着什么?
    3. 这个问题的解决大概需要什么知识和技能的基础,尤其要识别出来其中最关键的那一步,我从中能够学会什么?
  2. 在我解决这个问题之后,
    1. 这个工作提出了新问题,发展了新方法、得到了新结论、提供了新案例新应用场景?
    2. 这个问题以及现在的解决方式和答案,还有什么需要继续改进的,还可以怎样进一步发展和迁移?
    3. 我从中学会了什么,学会的东西可以如何帮助我成为一个研究者?可以从学科大图景的角度来思考,从知识和技能的角度来思考。

经过这些思考,你除了了解了研究的流程,还对某个学科分支的研究现状——已经解决的没有解决的问题、问题的理论和实践价值、典型思维方式和分析方法,以及这个现状的来龙去脉——有了比较好的认知,还有一两把善于使用的刀子(思维方式、分析方法、提出问题、问题的形式化等等,任何一步任何一个方向比较强,都行)。这时候就差不多可以成为博士了:在你所研究的问题的方面,你已经和这个领域的最前沿的研究者在思考和面对类似的问题了(尽管你可能没有人家快、深入、可靠等等),你已经超过你的导师了,如果这个导师不是也正好做这个问题的直接研究的话。

拿论文追热点的工作当例子

我们来问和回答上面的问题。

为什么会提出这个问题?如何提出的这个问题?
论文的创新性的度量是一个很重要的问题,论文的评价、推荐、甚至将来是否选择把这个论文加入学科核心知识结构,都需要依靠这个创新性。但是,人类是通过阅读论文,把这个论文的核心内容提炼出来,在其他研究工作的背景上,来做这个创新性的评价的。也就是说,如果算法要能做的话,要先解决本论文的核心内容提取、其他研究论文的核心内容提取、作对比的技术,这些问题。在那之前呢?我们是不是可以通过引用行为来衡量追热点程度,也就是一定程度上创新性的反面呢?例如有的人引用一篇论文,真的是因为看到很多其他人也在引用这篇论文。

这个问题确实还没有解决吗,没有人研究过或者说没有人用这种方法研究过吗?
创新性的问题有人研究但是进展有限(这句话背后是大量的论文),领域层面的平均追热点程度有人研究,论文个体层面没有。更进一步,暂时没有发现用追热点程度传递的方式来衡量论文追热点程度。

这个问题可能的答案是什么,如果我们得到了某个答案,对于整个学科甚至整个科学和技术来说,意味着什么?
有可能可以找到一个能够描述论文追热点程度,也就是创新性的反面,的指标。不过,这个需要检验,而且这样的检验不是很容易。如果做出来了,第一确实就可以帮助做论文的评价和推荐等任务,多了一个维度;第二,可能可以在科学学领域进一步推广影响力扩散(从直接到间接)这个思维方式和分析方法。

这个问题的解决大概需要什么知识和技能的基础,尤其要识别出来其中最关键的那一步,我从中能够学会什么?
从中可以学会影响力扩散的思维方式和分析方法,也能够进一步了解科学学这个领域。

这个工作提出了新问题,发展了新方法、得到了新结论、提供了新案例新应用场景?
新方法,可以用于论文评价等场景。

这个问题以及现在的解决方式和答案,还有什么需要继续改进的,还可以怎样进一步发展和迁移?
还没有实现真正的论文创新性度量,这个论文追热点指标本身也还需要进一步的验证。

我从中学会了什么,学会的东西可以如何帮助我成为一个研究者?可以从学科大图景的角度来思考,从知识和技能的角度来思考。
这个留给建林回答。以下是建林的回答。

类似用户画像,对一篇论文我们也可以从多个角度或维度来描述,比如论文的学科交叉性、创新性、影响力、作者特征、期刊特征等等。在本研究中我们主要试图通过刻画一篇论文追踪热点的程度来间接刻画一篇论文的创新性。通过这个研究,我不仅加深了对论文间“引用”关系的认识,主要还学会了更深入地思考问题,用系统思维或是“联系”的视角去看待和解决问题。“论文追热点”是个很有意思的研究主题,在开展研究的过程中我有一系列的思考和疑问,比如:论文是否存在追热点这种现象?如果存在,我们如何来度量论文追热点的程度?当我们提出了量化指标,又该如何验证?这种指标的设计思想是否可拓展?根据指标得分来判断追热点程度高或低的论文有什么特征(在发表时间上、学科分布上、国家分布上)?哪些因素又会影响这些特征?对于这些疑问,我需要通过查文献、实证研究、反复调整算法指标来解决,也需要多思考这些问题之间的逻辑,不至于使自己偏离研究主线。通过这项工作培养了我自己独立思考的习惯以及严谨的科研态度,有助于日后书写项目申请书时理清研究思路以及学会独立开展一项研究工作。在本研究中,除了学会思考问题,还需要补充很多相关的背景知识,而这些知识主要是从相关文献中获得,学会如何整理这些相关文献也是必备的一项技能,主要是理清这些文献与当前研究的联系。

拿综述文献识别的工作当例子

为什么会提出这个问题?如何提出的这个问题?
实际工作中,我们需要把总数文献识别出来,单独做处理,不管是评价还是用来构建学科概念地图的基础帮助学生进入一个领域(总数文献在这方面无与伦比)。

这个问题确实还没有解决吗,没有人研究过或者说没有人用这种方法研究过吗?
前人提出了多个经验指标,例如参考文献的数量、看期刊。但是,还没有真正解决识别的问题,尽管已经可用。我们打算构建一个机器学习分类器来做这件事情。

这个问题可能的答案是什么,如果我们得到了某个答案,对于整个学科甚至整个科学和技术来说,意味着什么?
对于这个问题,有一个综述文献分类器的作用就是可以区分综述文献了。

这个问题的解决大概需要什么知识和技能的基础,尤其要识别出来其中最关键的那一步,我从中能够学会什么?
需要学会机器学习,尤其是其中的自然语言处理和分类器。由于实际标注数据中有噪声,因此,这个工作除了实现一下分类器之外,还需要考虑噪声的解决。后者是一个科学问题,前者基本上就是工程问题。从中,我还能学会如何区分工程和科学问题,以及从研究工作中提出和解决科学问题。

这个工作提出了新问题,发展了新方法、得到了新结论、提供了新案例新应用场景?
新工具(分类器)、新方法(噪声问题,不过后来发现这个方法的精神已经有前人的工作,尽管细节不同)。

这个问题以及现在的解决方式和答案,还有什么需要继续改进的,还可以怎样进一步发展和迁移?
分类结果还需要进一步的验证。可以把噪声处理的方式作进一步的研究和应用。

我从中学会了什么,学会的东西可以如何帮助我成为一个研究者?可以从学科大图景的角度来思考,从知识和技能的角度来思考。
这个留给骆慧颖回答。以下是骆慧颖的回答。

首先是在整个工作过程中将数据处理、构建模型、训练模型等技术运用于实践的过程中掌握了这项技术,编程能力也得到了提升。这对于我来说是一种知识和技能的积累,也是研究nlp的基础。其次是学会了如何去区分问题和工程问题,也学会了面对科学和工程问题怎么去思考。如老师所说的,构建分类器是一个工程问题,而处理噪声数据就是一个科学问题了。科学问题就像是“咦?这条路看上去好诱人,感觉前方风景很好呢!走!去看看!”我们不知道这条路通向哪里,更多的是好奇心驱使的在过程中发现问题和解决问题,它从问题出发,如我们的工作中,对于分类器的训练,标注的数据中有错误的怎么办?这些都是驱使我们进行噪音数据处理的问题导向。而工程问题则是“我知道我要去哪,但是眼前这么多条路,我该选择哪一条?又或者自己开条路?”是由实际需求和应用出发的,从选择道路到沿着路走在最终到达目的地,就像我们工作中我们想要从众多文献中将综述文献识别出来我们应该怎么做?这些都在今后的研究中给我提供了提出问题和解决问题的思路。也接触到了ensamble learning和active learning这两种学习方式,同时在进行资料学习的也同时学习到了监督学习、半监督学习、无监督学习等学习方式,是对机器学习知识的一种补充。

拿科学家的半生命的工作当例子

这是邓老师的回答:

  1. 为什么会提出这个问题?
    研究科学家的科研规律可以更好的来指导科学家的工作,不管是把科研当工作(痛苦不堪),还是把科研当人生(痛并快乐),搞科研的科学家,他应该会想知道,在进入学术领域N年之后,平均来说,还有多少年,他就可以退出学术领域了(开心,终于解脱),或者说,还有多少年,他就要离开学术领域了(遗憾,还没玩够)。具体来说,我们可以从发表文章,被引文章的角度,来定义科学家的学术生命和半生命。
  2. 如何提出的这个问题?
    在前人的基础之上提出问题,前人有研究期刊,知识,同龄人等的半生命,我们关注科学家个人的学术半生命。
  3. 这个问题确实还没有解决吗,没有人研究过或者说没有人用这种方法研究过吗?
    科学家个人学术半生命(发文和被引角度)的问题暂时没有人研究,不过前人用类似的方法研究过人的生物学生命问题。
  4. 这个问题可能的答案是什么,如果我们得到了某个答案,对于整个学科甚至整个科学和技术来说,意味着什么?
    我们可以计算出科学家当前年龄的淘汰率和预期剩余寿命,对于科学家个人而言,他可以大概知道,还有多长时间,他的学术生命就要结束了。
  5. 这个问题的解决大概需要什么知识和技能的基础,尤其要识别出来其中最关键的那一步,我从中能够学会什么?
    主要是利用统计学的知识进行数据的处理和结果的可视化,在某一个数据集上,统计个人的退出年龄,根据人口动力学方程计算出平均的预期寿命和淘汰率。
  6. 这个工作提出了新问题,发展了新方法、得到了新结论、提供了新案例新应用场景?
    一种新的从发文和被引的角度来定义个人的学术生命的方法,同时给出了个人平均预期学术生命和淘汰率的参考曲线。
  7. 这个问题以及现在的解决方式和答案,还有什么需要继续改进的,还可以怎样进一步发展和迁移?
    数据集的体量较小,需要更大规模的数据集,来计算得到更加普遍的结果。
  8. 我从中学会了什么,学会的东西可以如何帮助我成为一个研究者?
    • 了解了科研工作大概是一个什么样的过程,是提出一个可以计算和验证的模型(数学语言来描述),在数据上计算并验证模型,如果模型能够较好的符合现有的数据,则可以进行模型的迁移,当然,模型很有可能在其他数据上被推翻。
    • 以前做的工作都是各种工程类的项目,分析需求,寻找技术,完成功能,联调测试,进行维护,不断的循环,虽然也是在不断学习新的技术,但是,实际上,这些项目肯定是能完成的,只是时间投入的问题。并且,项目的结果好坏是有既定的评价标准,比如通过联调测试,用户反馈等。
    • 而科研的工作,是为了去回答一个前人没有回答过问题,不管是问题的提出,问题的解决方法,结果的评价方法,都有可能是全新的,此时,去寻找解决问题的方法,去寻找问题的答案已经比较困难,有可能找不到问题的答案,而在得到一个答案之后,怎么去评价它有时候可能会更难,这些都是和工程项目不一样的地方。
    • 在了解了以上的区别之后,我觉得最大的收获是,工程项目让人躺在舒适区里,而科研项目让人怀疑人生,痛并快乐。自己给自己打一针预防针,进入新的科研工作就没那么恐怖了。

拿替代力指数的工作当例子

这是邓老师的回答:

  1. 为什么会提出这个问题?
    因为引用某篇文献的后代会引用这篇文献的祖先,也许祖先对后代的贡献更大呢,因此,仅仅从被引数量来衡量文献的创新性,有失偏颇。一篇文献在引文网络中的作用是什么,它是否是不可替代的?如果仅从被引数量来衡量,那进入引文网络的文献都不可替代。但实际上,很多文献的后代,不仅仅引用了父亲,还引用了各个层级的祖先。如果扣除了祖先对后代的影响,文献对后代的实际影响是怎么样的,在引文网络中它的不可替代性会有怎样的变化?

  2. 如何提出的这个问题?
    在前人的基础上提出该问题,前人研究了文献扣除父亲对后代的影响后的情况,我们更进一步,把所有祖先对后代的影响全部扣除。

  3. 这个问题确实还没有解决吗,没有人研究过或者说没有人用这种方法研究过吗?
    考虑所有祖先对文献后代的影响暂时没有人研究过。

  4. 这个问题可能的答案是什么,如果我们得到了某个答案,对于整个学科甚至整个科学和技术来说,意味着什么?
    最可能的答案,扣除掉所有祖先的对后代的影响,文献的不可替代性会下降,某些文献甚至可能会出现反转,比如某些高被引文献的实际不可替代性很低,并且这些高被引文献实际上是灌水之作,如果真的是这样的话,那对文献特别是高被引文献的创新性的评估就需要采用和以前不一样的方法,也就是不能仅仅采用被引数量,还要考虑扣除祖先对后代的影响。也许可以发展出一种方法来识别真正有创新性的文章和灌水的文章。

  5. 这个问题的解决大概需要什么知识和技能的基础,尤其要识别出来其中最关键的那一步,我从中能够学会什么?
    主要是在数据集上对大型稀疏矩阵进行求逆操作,还有后续的数据分析可视化。大型稀疏矩阵的求逆操作通常转化成求解方程组问题,采用迭代法来完成。评价方面,可以选择公认的好文章和灌水文章来检验我们定义的替代力指数,好文章可以用诺奖和里程碑,而灌水文章也许可以把追热点的文章拿来试一下。

  6. 这个工作提出了新问题,发展了新方法、得到了新结论、提供了新案例新应用场景?
    是一种新的评估文章创新性的方法。

  7. 这个问题以及现在的解决方式和答案,还有什么需要继续改进的,还可以怎样进一步发展和迁移?
    • 如果在诺奖,里程碑文章上与实际符合较好,那在另一端,灌水文章上是否也符合较好,怎么识别灌水文章呢,需要其它的证据。
    • 可否迁移到其它知识网络,比如github的引用网络,来检验代码的创新性。(非常值得做,尤其是,可以考虑一个大项目,例如Linux操作系统,中各个程序的相对地位的问题
  8. 我从中学会了什么,学会的东西可以如何帮助我成为一个研究者?
    • 不能迷失在技术的深渊里,当某些技术无法解决问题时,需要考虑其它更合适的技术,比如求解线性方程组的scipy,petsc。
    • 在整个研究的过程中,一定要挂一盏灯在头上,就是,我要解决的问题是什么,我做的事情和我要解决的问题有关联吗?

拿概率条件下决策影响因素的工作当例子

天笑回答。以下是天笑的回答。

Q1:为什么会提出这个问题?如何提出的这个问题?

A1:在研究决策影响因素时,考虑个人风险态度可能是因素之一,因此需要引发个人风险态度的方法。通过文献阅读发现常用的引发风险偏好的“十项决定”已经成为很成熟的引发技术了,于是直接拿来使用。在使用的过程中发现,该量表提供的两项风险资产对比,既有均值的变化,又有方差的变化。效用函数框架下,风险资产的效用函数可以分解为各阶矩的函数(各阶矩被称为数字特征的原因)。那么从数学上,我们形式上就可以用包含均值(一阶矩)、方差(二阶矩)、偏度(三阶矩)、峰度(四阶矩)以及更高阶矩的函数来描述一项风险资产,作为风险资产的效用函数。显然,均值和方差一定在效用函数之中。那么,我们需要知道实际上人们的效用函数是否包含更高阶矩,即人们是否可以感知到各阶风险的变化呢?更高阶矩是否在决策过程中其作用呢?

如果人们不能识别高阶风险,那么效用函数就完全由均值和方差来刻画。
如果人们能够识别更高阶的风险,即对待更高阶的风险有不同的态度,反映在实验上,就是有不同的风险资产选择倾向,那么在测量人们的风险态度时,就要考量高阶风险的影响。
更进一步,我们需要考察有哪些高阶风险被包含在效用函数之中,以便进一步完善效用函数构建。举例来说,比如人们对于5阶以上的风险不识别,那么效用函数就只需要包含前四阶矩;再如人们只识别奇数的高阶风险,不识别偶数的高阶风险,那么效用函数就应该包含均值、方差以及之后所有奇数阶矩。即我们需要知道实际上哪些高阶矩进入效用函数之中。

技术上,我们可以保持其他阶数不变,只有被考察阶数不同的情况来构建实验需要的风险资产,通过风险资产之间的对比考察的该阶风险是否被识别。

总的来说,是因为我们需要引发被试的风险偏好,使用作为引发风险偏好的标准量表——“十项决定”量表时,逐渐深入了解发现,其并不能满足更精确的描述人们的风险偏好的要求,所以我们将研究的目光从前述工作转向了风险态度,尤其是高阶风险态度的测量。

Q2:这个问题确实还没有解决吗,没有人研究过或者说没有人用这种方法研究过吗?

A2:通过文献调研发现,对于高阶风险态度的研究主要集中在金融和实验经济学领域,金融领域中对三阶风险——偏度的研究比较早,在效用函数框架下,经济学家和金融学家天然的需要研究效用函数各阶导数的现实意义。他们将三阶风险厌恶称为“下行风险厌恶”,用效用函数三阶导数的凹凸性来解释了人们在预防性储蓄时的经济行为。在金融领域的资产定价和资产组合中起到了重要的作用。2006年,Eeckhoudt 和 Schlesinger脱离了期望效用框架,将高阶风险态度和特定的“彩票对”的选择偏好联系在一起,使得高阶风险态度的直接测量成为可能。 一些实验经济学家通过设定两个只有某一阶数不同,其他阶数都相同的两张彩票的对比实验,来引发人们的高阶风险偏好。这种方法正是本工作使用的方法。其理论依据是将高阶风险拆解成低阶风险的组合。

通过阅读文献我们发现,大多数研究者使用的“彩票对”,存在两个问题:
每个彩票的或有收益对应的概率不同,并且随着需要考察阶数的升高,或有收益的概率之间的差异越来越大。通过其理论基础——期望效用理论发展而来的前景理论我们知道,人们不仅会将或有收益看作主观收益,还会将其对应的概率看作主观概率(一个事实是,人们会夸大小概率事件的结果,举例:颤抖的手),那么我们考虑能不能将考察时的彩票的或有收益设置成等概率的,以便排除主观概率的影响。
另一个问题是,以三阶偏度为例,研究者选取的彩票对的偏度值都偏大,这样有助于使用小样本产生更明显的结果,但明显没有均匀的覆盖全部偏度值的取值范围,我们能不能通过彩票设定,使三阶偏度值在其取值范围内全都考察到?
针对以上两个问题,仍以三阶偏度为例,我们构建的彩票对需要三个等概率的或有收益,并且保证均值、方差都相同、偏度值正好是设定的相反值,比如±0.1,±0.2等。三个未知数(三项或有收益),三个约束条件构成方程(均值、方差、偏度),理论上存在非零解,因此我们可以解出需要的彩票的或有收益。

上述工作我们通过文献调研,并没有发现有研究者做过。高阶风险的经济学实验部分仍处在刚起步的阶段。

Q3:这个问题可能的答案是什么,如果我们得到了某个答案,对于整个学科甚至整个科学和技术来说,意味着什么?

A3:首先,我们需要在实验上证明我们对实验的改变是否影响被试的选择。如果仅仅是将或有收益的概率变为等概率的,就会改变实验结果,那么说明通过彩票对这种方法引发高阶风险根本没有稳定性可言。使用类似技术的高阶风险结论都将存疑。
如果我们将概率变为等概率,不影响主流结论,那么就说明我们带来的改变是无害的,我们的结果是可以和其他研究者进行对比的。
此时我们再将目光关注在其他研究者不曾关注的小偏度值之上,考察三阶偏度在小偏度值的时候,结果是否和大偏度值的一样。

总而言之,我们的结论将取决于我们对该实验带来的改变是否影响实验结果。通过只改变其中一个点来层层递进,如果直至最后,我们的结果和主流结果仍相同,那么至少我们完全研究了该阶风险的情况,证明了结果的稳定性。

Q4:这个问题的解决大概需要什么知识和技能的基础,尤其要识别出来其中最关键的那一步,我从中能够学会什么?

A4:需要的知识储备主要包括,理解效用函数框架所需的基础——期望效用理论及其发展,理解主观收益、主观概率,进而理解我们为什么要在构建彩票对时控制或有收益的概率都是相同的;经济学中效用函数函数的各阶导数,对应的数学上的各阶矩,明白为什么数字特征可以描述一个随机变量,从而理解我们可以使用包含各阶矩在内的效用函数描述人们的选择行为;高阶风险彩票对的构建,将高阶风险看作两个低阶风险的组合;解方程的技术——用来计算我们需要考察的彩票对;关键之处在于,通过控制变量,一步步将彩票对的设计演化为我们需要的格式,而其中一旦结论发生变化,那么彩票对引发高阶风险这一手段的稳定性就将存疑。

Q5:这个工作提出了新问题,发展了新方法、得到了新结论、提供了新案例新应用场景?

A5:最终这个工作完善了原有结论,证明了结果的稳定性。这部分工作主要研究三阶风险偏度,证明了被试倾向于选择“谨慎”的风险资产。

Q6:这个问题以及现在的解决方式和答案,还有什么需要继续改进的,还可以怎样进一步发展和迁移?

A6:关于引发风险偏好,乃至于引发高阶风险偏好,“彩票对”的方式提供了两个不同的风险资产进行对比,通过被试的选择行为考察高阶风险的作用。其实还有其他方式考察人们对不同风险资产的定价,比如发现确定性等价。在本工作中,我们并没有采用发现确定性等价的方法让被试给我们设计的每一个彩票“定价”,这可以来进行交叉验证实验结果,我们没采用确定性等价这个方法的原因是,没有彩票直接对比直观明显,需要被试有良好的计算能力。

目前我们只完成了三阶风险偏度的实验,在整个工作框架下,可以继续向更高阶风险推进,直至人们对于某一阶风险及其之后的更高阶风险不再识别,那么我们所构建的用于描述人们风险偏好选择行为的效用函数,就包含那些我们发现有用的那些阶数的风险。另外还可以使用其他方法,如确定性等价来和本结果交叉验证,证明高阶风险在不同引发方法下仍起作用。

Q7:我从中学会了什么,学会的东西可以如何帮助我成为一个研究者?可以从学科大图景的角度来思考,从知识和技能的角度来思考。

A7:这项工作在发现问题上,使我亲身体会到了在应用别人的成果时,并不能完全满足我们的需求,为此我们提出问题,从别人的工作中进一步发展。在实验设计上,主要是需要层层推进,一步步将我们的设定和改变加在原始设定之上。同样,这项工作我陷入技术细节陷入的更深,既想干这个,又想干那个,最终我是通过紧紧围绕核心问题,一步步消减冗余来走出泥潭的,比如完全舍弃了预实验与彩票直接对比同时使用的确定性等价这个方法。“抬头看路,低头向前”还是做的不好,知道和运用是有距离的,话说的好听,但学到的唯一教训就是人们不会从历史吸取任何教训。

拿最后通牒和概率理解的关系的工作当例子

下面是天笑的回答。

Q1:为什么会提出这个问题?如何提出的这个问题?

A1:从大的方面来说,可以帮助我们回答为什么要提出这个问题。

研究人们是如何做出决策的,始终是经济学、心理学等社会科学的核心问题。科学家们研究的目的有二:解释和预测。对于已经发生的行为,通过构建模型来解释人们在相应条件下为什么做出这样的决策,并外在表现为观察到的行为;更进一步,构建的描述人们决策的模型需要在相同条件或是不同条件下,预测人们会做出什么样的决策,产生什么样的行为。

决策问题是一个很庞大的问题,我们的关注点需要集中,这可以帮助我们回答如何提出这个问题。

在从我们关注的经济决策方面来说,博弈论为我们提供了很多研究框架,比如囚徒困境、公共品博弈、最后通牒博弈等博弈形式。本工作中,在这些前人的基础上,我们关注最后通牒博弈,试图找出最后通牒博弈框架下影响人们决策的因素。通过文献我们了解到,前人提出了各种影响决策的因素,包含公平、利他、信誉、文化、语境、性别、年龄、情绪、生理指标等等因素皆能影响最后通牒框架下人们的决策。在文献整理中,我们不乏看到通过实验设计来排除其他因素的影响,专注研究某一因素的思路经常出现在各文章中。因此,我们可以通过集中关注最后通牒博弈框架下人们的经济决策来缩小研究范围,通过构造实验排除其他因素影响,专注于我们需要考察的因素之上。

Q2:这个问题确实还没有解决吗,没有人研究过或者说没有人用这种方法研究过吗?

A2:考察这个问题是否被解决了,就需要考察构建出来的人类决策模型是不是能解释现有实验结果,并预测一定条件下人们的决策行为。

在最后通牒博弈中,即使我们排除了目前研究的影响因素,仍距离理论结果有着显著的差异。这代表着一定还有其他因素在人们决策过程中起作用,并进一步通过行为表现出来。

本工作的研究方法并不新颖,主要目的是试图继续深挖最后通牒博弈理论与实验之间的显著差异,试图在前人的探索上更进一步。

Q3:这个问题可能的答案是什么,如果我们得到了某个答案,对于整个学科甚至整个科学和技术来说,意味着什么?

A3:我们主要考察的是对概率的理解和被试的风险偏好是否是最后通牒博弈中的影响因素,更进一步,将已经发现的影响因素包含在一起,是否能使理论预测与实验结果相一致。

如果上面两点都达成了,那么我们就能够构建包含所有影响决策因素在内的模型,来描述人们的经济行为就更进一步了(至少在最后通牒博弈框架下)。

如果我们提出的印象因素确实在决策中起作用,但最终还是和理论值有显著差距,那么就说明除了前人提出的因素和我们提出的因素之外,人们的决策模型还包含其他我们目前未知的影响因素。此时我们至少距离完全描述决策行为更近了一步。

一旦我们提出的新影响因素被证实在决策过程中起作用,尤其是概率理解,这意味着其他框架下也需要考察这个因素是否影响人们决策,这个因素是否普遍适应各种决策框架。

如果我们提出的因素在决策过程中不起作用,在确定我们设计的实验没有问题的情况下,在各种努力尝试都改变不了结果的情况下,至少我们排除了两个影响决策因素的错误答案。至少个人风险偏好不影响最后通牒博弈框架某种条件下的个人决策,也是挺反直觉的一个结果。我们接受这个事实,总结经验教训,科研是未知答案的,甚至很多时候是未知问题的。

Q4:这个问题的解决大概需要什么知识和技能的基础,尤其要识别出来其中最关键的那一步,我从中能够学会什么?

A4:这个问题解决需要一些博弈论相关的知识,理解最后通牒博弈实验的结果和理论预测不一致冲击了经济学基本假设——理性人假设;另一方面需要博弈实验相关的知识,理解为了回答问题而设计实验,而不是反过来。需要的技能主要是依据目的设计实验的能力。在本工作中,最关键的一步是将被试的决策过程进一步分解,看作是先估计行为,再做出反应,而其中对概率的理解影响了人们做出反应这一部分。我们设计实验时,通过约束估计行为来考察我们提出的影响因素。

通过本工作,我学到了实验是为了某种目的设计的。在平时的课堂中,我们都是先接触囚徒困境、最后通牒博弈、公共品博弈、独裁者博弈等各种实验格式,更有甚者,比如最后通牒博弈,已然工具化成了引发公平的实验工具,广泛应用在各种经济学、心理学、社会科学场景中。而如果我们仔细阅读提出他们的原始文章,就能看出他们是出于何种目的构建出来的这个实验格式。更重要的是构建他们的思想,而非这些实验格式本身。

Q5:这个工作提出了新问题,发展了新方法、得到了新结论、提供了新案例新应用场景?

A5:这个工作得到了新结论,概率理解确实是最后通牒博弈框架下决策影响因素之一(同时风险偏好也是),但加入新的因素,仍不能完全抹平理论预测与实验结果的差异。
这提示我们两点:1、继续深挖。我们在解释决策问题上前进了一步,但仍存在其他我们未知的因素影响着决策过程;2、横向考察。在其他框架下,可能应该考虑概率理解因素是否起作用。

Q6:这个问题以及现在的解决方式和答案,还有什么需要继续改进的,还可以怎样进一步发展和迁移?

A6:这个问题现在的解决方式是“剥洋葱”式的,将对手替换成机器解决对手是人对提议者的影响,比如利他公平等,将机器的响应模式和概率直接展示给提议者解决提议者估计响应者行为这一学习过程。通过一步步去除其他因素,改变实验设计适应新的需求,控制变量得到答案的。我们还需要将我们找到的影响因素还原到最初的最后通牒博弈中,比如设计实验,在进行真实最后通牒博弈之前,先测试概率理解,看看那些未通过概率匹配测试的提议者,是不是真的分给响应者更多。除了最后通牒博弈框架,我们将眼光放远,概率理解在其他博弈框架是不是也是影响因素之一?

Q7:我从中学会了什么,学会的东西可以如何帮助我成为一个研究者?可以从学科大图景的角度来思考,从知识和技能的角度来思考。

A7:从帮助我成为一个研究者角度,除了为了回答问题设计实验之外,在具体工作中一定要保持“抬头看路,低头向前”。推进工作时,考虑太多会扰乱你的思路,尤其是经济学实验方面,你没办法完全预测被试的行为,所以不必要求自己一下子拿出完美的实验设计,通过预实验及其结果不断调整完善实验设计,会使整个研究过程更平滑。另外在研究过程中,当纠结于实验程序,陷入技术细节的时候,不妨抬头看看整个框架,保持核心问题,舍弃细枝末节,会帮助你走得更远。

拿量子输运的工作当例子

吴金闪回答

学科层次和本科专业选择

最近几个朋友的小孩正在选择本科专业或者大方向,问了一堆关于学科之间的关系的问题。有人就要求我把我的这些答案分享出来。那就分享一下。

首先,尽管很多人跟我的认识其实可能一样或者差不太多,但是,这个学科之间的层次关系,并且现在和大学本科的选择联系起来,是一个非常敏感的问题,因此,我得申明,这是我个人的学科的关系的理解。你要怎么参考,怎么用,你决定。好了结束了这个狗屎的逃避责任的申明,咱们进入正题。

在整个学科中,科学和术科是两大分类。术科就是创作类的、技巧展示类的,例如画画(不是画的赏析、历史、教育等)、表演(不是表演的赏析、历史、教育等)、体育运动(不是运动的赏析、历史、教育等)、写作(不是写作的赏析、历史、教育等)。不知道我列举全了没有。反正,明白这个意思就好。挖掘机操作、excel表格使用、做饭、电焊,这种纯技能性的,一般来说,连术科都是不算的,只能算职业技能培训。但是,你非要说,挖掘机操作的培训和画画的学习有啥本质的区别,我还真的不好界定。当然,电焊和挖掘机是很重要的,这些学科分层之间并没有优劣、高低级之区分。

那,科学通常分成自然科学和社会科学。自然科学就是研究自然界的对象的,社会科学是研究社会的对象的,主要表现为有人的思考、思想和决策的参与的那些对象和过程。所以,物理学、化学、生物学、地球科学、医学是自然科学,经济学、语言学、历史学、社会学、法学是社会科学。

注意,中文、英语、数学、教育、哲学、计算机科学,还有脑科学以及我们的系统科学竟然没有进入上面的分类体系。我们一会儿再回到这些个学科。

在自然科学之中,物理学是基础学科。基础性体现为知识和思维两个方面。知识就是很多其他学科的知识依赖于物理的知识。思维就是,物理很容易能够把什么是科学体现好,有了对什么是科学的理解之后,进入其他学科也会有帮助。

在社会科学中,经济学(还可以算上语言学和历史学,暂时先不算)是基础。基础性体现为,很多社会科学的问题都可以归结为人类决策,而人类决策目前主要由经济学研究。没准,将来,脑科学也会进入到研究人类决策的层面,那那时候,经济学的这个基础性地位会被脑科学取代。为什么要在一定程度上算上语言学(不是文学创作,不是文学赏析,尽管其没准可以用于创作和赏析)和历史学呢?人类的知识是由语言所描述的,不管是自然语言还是形式语言,因此,这个学科的作用将来会更加基础。历史学,按照钱穆的说法,是搞清楚历史以及用搞清楚的历史来提出、理解和解决现在的问题,那么,这是一个研究角度的问题,而且这个研究问题的角度无论对于哪个学科都非常重要。

好了,现在我们回到中文、英语等语言听说读写技能,以及数学、教育、哲学、计算机科学、系统科学等这些学科。中文、英语等语言听说读写技能应该算职业技能培训(再次强调,不表示其低级)。

数学是所有科学,无论自然科学还是社会科学,所用的语言。我们用数学来表达思想和思考,我们也从思想和思考中进一步提炼数学结构。因此,无论学哪个科学,你都避免不了数学。深入的思考不一定要借助数学,但是,借助了可以帮助你在代价很小的时候做的很深入——因为你多了一门语言。

计算机科学是对典型的、计算流程比较复杂的数学问题的计算机化解决的研究。因此,本质上,这算数学,除了计算机硬件,那算物理。当然,由于其把问题解决的方式限定为计算机算法,也就把计算机科学从数学中区别开来了。但是,学科意义类似,任何一个科学的研究,将来你总会遇到计算流程比较复杂的问题,不管是因为问题和数据的大小还是所牵涉到的计算过程,于是你就要学会教计算机干活。

教育是一个上层学科,你只有学会了一门甚至多门基础学科,有了足够深入的了解,才能成为一个好的老师和教育研究者。

哲学,按道理,是最最基础的学科,据说能够指导一切其他学科。但是,学科的分化导致了这个逻辑反过来:只有你对某个学科有了足够的理解之后,你才能从这个学科里面出来,提出来具有一般意义的深刻的问题,也就是有可能可以迁移到其他学科的哲学问题。并且,如果先学习,哲学内部的知识积累就导致你不可能同时做好哲学本身的好的理解以及对某个学科的理解。不如,等着将来没准有机会在某个学科的某些问题的研究的最顶尖最细的时候,回到最基本的问题。

说一点点关于系统科学在这个结构中的位置。首先,系统科学就是把数学和科学用于研究具体系统的研究,但是在那些个具体系统呢又还没有成长为独立的学科的时候。一旦那些具体系统的研究成长起来,就会独立出去成为一个个的学科。因此,这个意义上,系统科学像数学建模,像一般的科学。因此,这个学科必须依靠数学、计算机。另一方面,由于研究对象没有具体限定,其研究问题和研究方法上能够借鉴的东西有限,因此,这个学科必须依靠其他学科提供思维方式和分析方法,也就是说,如果没有物理学的基础,甚至其他学科的研究问题和方法的理解和借鉴,那就做不了系统科学。其次,系统科学确实也在形成自己的一点点典型思维方式,例如“从孤立到有联系,从直接联系到间接联系,从个体到整体”。因此,也算多少有点可以学习的东西。

有了这个之后,你就会大概看到下面的学科依赖关系图:
学科层次图

自然科学的大多数学科和社会科学的一部分科学化程度比较高的学科还会有相应的工程学科,例如探矿、冶金、汽车船舶飞机制造、金融工程。工程一方面是相应理论科学(这个理论科学包含实验研究啊,不仅仅是理论研究,这里的理论科学就是学科理论体系概念体系的意思)的运用,另一方面也通过不断地提出待解决的新问题促进相应的理论科学的发展,因此,可以看做属于相应的理论学科。工程之中也有一些属于科学和技术之间的,技术反过来给科学提出问题推动科学发展的成部分比较多但是又没有理论科学本身多,例如通信(背后通着信息科学)、软件(背后通着计算机科学)、空气动力学(背后通着物理学)。这一类不完全是应用性的工程学科,也有人,例如钱学森,把它们叫做技术科学。合起来就是,数学和计算机科学、(自然和社会)科学、技术科学、工程、教育、管理、哲学(先到头顶,然后又自己“觉得”或者“争取”成为最基础的底)。

顺便,分享罗素的话:科学是讲道理和经过(或者快要能够)实验验证的,哲学是讲道理的可实验验证的但是还远远没有能够实验验证的,宗教是不讲道理也不需要验证的;以及我补充的——数学是讲道理的但是不求实验验证的

再顺便贩卖点私货,系统科学是讲道理和要实验验证的但是所研究的问题还没有独立成为学科的,或者是具有研究方法和思维方式上的某些跨越具体问题具体学科的共性的,例如“从孤立到有联系,从直接联系到间接联系,从个体到整体,从具体系统中来到具体系统中去”。见下图中的我仿写的打油诗。有人说,我这个学科层次图还有这整个帖子,甚至整个理解型学习,都是系统科学思想和方法的体现。是的,就是如此:系统科学帮助我们看到联系,发现结构,融会贯通,洞彻世界。教材电子版在“吴金闪的书们”这里。

cover

我们也确实在尝试从教材和研究论文中提取概念和概念联系,构成概念网络(知识高速公路),然后通过做概念网络上的聚类来得到学科(多个不同层次的),进而得到学科之间的依赖关系,做学科的重要性(中心性和影响力)的度量。我们甚至在做这样来构建和分析网络的工具。不过,这些个工作都只有请大家稍微(可能很长)等等我们的进展了。如果你想看一下一两个例子以及整个设计,可以看吴金闪的“《教的更少,学得更多》”​。

本科的学科和方向的选择上,除非有非常明确的目标,尽量选择偏基础的学科,将来有更多的明确的方向可以选择。本科所学习的学科的大图景(典型对象、典型问题、典型思维方式、典型分析方法、和世界以及其他学科的关系)是进入一个学习者的基本思考方式的,一定要慎重选择。例如,选了会计学,将来你就可能会习惯在给定流程、规定、公式的条件下去套用,而不是去思考这些东西的含义、理由甚至改进。

进入研究生阶段的培养就不一样了,要尽量精细,尽量选择自己感兴趣的,做到专,之后再考虑贯通和联系。你说,万一研究生阶段还是没有目标没有感兴趣的领域和问题呢?那,就先去尝试工作和读书,找找方向。其实,甚至高中之后,也可以尝试工作和读书,来找找方向。不过,由于本科毕竟是打基础的时候,没目标就先选偏基础的学科。

批判四大发明就被停课,来我来举报我自己

今天看到有电子科技大学的老师,由于在学生群里面批判四大发明(没有真的形成生产力,也不见得领先),被学校停课,按照师德问题(唯一算得上师德问题的也就是把学生踢出群限制其提出反对意见这一条了。批判四大发明,而且有自己批判的理由,怎么成了师德问题?)处理。

现在,我来举报我自己。不仅对于四大发明我有疑问,对于中国为什么没有科学,我有更加深刻的批判。来吧,来停我的课吧。希望全中国有良知、独立思考能力、懂科学客观讲道理的老师,都来举报一下自己,都被停课吧。

首先,回到具体的四大发明的问题。造纸还比较可靠。直接用植物或者动物的一部分来当做书写的材料,例如羊皮、竹子、木头、石头、金属容器、树叶、压实的草杆,早就有。蔡伦纸不同的地方在于其把原材料中的纤维提取出来,然后重新帮助其凝聚成纸。这是一个很大的进步。不过,如果没有思想和知识来写在纸上,从而提高这个社会的生产力(科学)、思想性(思想解放、自由)、组织方式(社会制度),则纸基本上也就是用来擦屁股的。而非常神奇的是,后面这些在中国基本上都没有配合跟上。于是,我们的造纸术也没有使得我们的科学发展得比别人早。不过,无论如何,我们可以宣称,中国首先发明了纤维先打碎后凝聚这样的方式的造纸术(不一定是蔡伦第一个发明的,不过,算成中国人大概没错)。

火药看起来也还算相对可靠,是我们先从炼丹中偶然得之的。不过,后来我们就用它做了烟花。我不知道后来是不是也是中国人最早改进一下火药然后用来炸山洞(采石头、修桥铺路),但是,真正运用火药的枪炮肯定不是中国人先发明的。中国人也没有从火药发展出来化学纯的配方,以至于元素为基础的化学,更加没有从元素化学走向回答为什么这样的元素和化合物具有这样的性质的物理学。因此,无论从科学、技术、社会生活的角度,中国人对于火药,基本上只能宣称一个最先偶然发现,或者最多偶然发明。

至于活字印刷和指南针,就确实比较有问题了,尤其是指南针。活字印刷这个想法应该不难。有人就认为是受刻印章的启发。难度在于维持所有的活字在一个平面才能印刷,在于保证每一个活字比较牢固耐用。因此,如果想把活字印刷推广开来,其实是一个技术标准的问题(真正让活字印刷打败雕版的是很多年以后的Gutenberg)。也正是由于这个原因,实际上,从这个活字印刷的想法被提出来和初步实现之后很多年,我们中国流行的印刷方式仍然是雕版印刷。因此,我们仅仅能够宣称中国发明了活字印刷的这个想法,做了初步的实验实现。但是,鉴于这个想法相当普通,我们也就能够真的宣称,只不过首先实现了“活字印刷”的实验室原型。当然,这个已经是不错的成就了。指南针一方面没有在中国流行起来,发挥作用,另一方面,甚至实物证据也没有。其可靠性可能都比不上沈括说的那个细线悬挂一个小磁针。我们现在看到的司南的图片从哪里来的呢?有一个叫做王振铎的近代学者按照历史上只言片语的记载复原出来的。后来,现代科学重新再一次来企图复现的时候,发现 ,对于大多数自然磁性材料,地球磁场的作用都不足克服以勺子底部的摩擦力,所以不准。改用人工磁化材料是可以的。因此,对于司南,大概,我们只能宣称,中国人发现了磁性材料。

小结一下,我们发现,造纸确实可以看做中国人发明的,不过没怎么推动中国的文明的发展;火药也可以认为是我们偶然发现的,不过无论技术和社会的的角度,对中国的发展的贡献都非常有限;活字印刷我们基本上就是一个实验室原型机,没有推广开来的条件和技术;司南基本上是意淫,不过可以大概宣称我们先发现了磁性材料。这就是我们一直在自嗨的四大发明的大概的情况。

这四样东西当然对于人类文明的发展非常重要,各个国家也肯定在其发展的过程中做出了不同程度的贡献,但是,你要宣称都是中国人首先发明的,呵呵。其实,第一次提出来这个说法的不过就是一个搞科学史研究的李约瑟。当时,抗战时期确实需要民族自豪感,要不然,都快亡国了。钱穆的中国通史基本上收集和中国历史上的伟人和伟业,而特意忽略很多开倒车的人,也是这个目的和历史背景。可是,在今天,仍然要把我们的民族自豪感建立在这样的东西之上,就是悲哀,就是自欺自人。

当然,我不反对一定程度上,这四大发明进入教材:当做讨论和争论的对象,而不是当做圣经。

另外,你以为只有四大发明是这样吗?勾股定理、地动仪以及很多其他的被认为是中国人第一次提出来的也是如此。中国的数学的典型论著方式是:“勾三股四弦五”,也就是告诉你,如果一条边是3,一条边是4,则直角三角形的斜边是5。不要问我怎么来的,也不要问我万一不是3和4的时候,斜边是多少。当然,以案例为基本论述方式也有其自身的好处(可以看看吴文俊在这方面的论述)。但是,数学是有体系的科学:从一些最基本的假设和定义开始,构建整个数学的概念大厦,构建的主要方式是逻辑论证和计算(其本身也可以看做是逻辑论证)。至于地动仪这东西,现在,我们在地球表面设立了大量的震动记录站都做不到,更何况当时的科技水平(有人说,可能地球上之前有文明,那有相关证据的时候再说,目前,我们假设一代代的研究者是在正面推动科学的发展,而不是藏起来和阻碍)。你想想,国家和民族的自豪感,能够以这样的东西为基础?

当然,我也一定程度上同意把勾股定理的故事放入教材,但是,是供讨论的材料。一方面,确实我们发现了例子,另一方面,证明和系统化确实是另一个问题。

接着,回到我要举报我自己的地方:不仅仅在这些技术发明上,我用批判性思维和我的科学知识来做批判性的思考和认知,甚至对于更加基本的中国人在科学认知上的国民性的问题,我持有更加批判性的意见。来呀,来北京师范大学停我(吴金闪)的课啊。

真正的值得思考的问题或者说悲哀,在于,为什么,在中国历史上,一直没有发展出来数学、科学(支离破碎的一个个的技术不算,有系统的技术、追问为什么并且有模型世界的才算)和哲学(哲理不算、政治伦理经验总结不算,有系统的哲理和有系统的政治伦理才算)。

这个问题很深刻,但是我认为其答案一点也不复杂:由于中国人一直太穷苦了,导致我们的大众和绝大多数精英从来不关心吃饱饭之外的问题,也就是没有抽象思维;同样由于中国人一直太穷苦,中国文化把农业(保证有饭吃)和官僚(原则上,是为了帮助其他人更有饭吃,或者说自己吃更好的饭)当做了最高地位的东西,从而鄙视奇技淫巧,也就抑制了技术和科学的发展;同时,中国文化没有实证性思维,一个模模糊糊说得过去甚至逻辑上同时包含了命题和否命题的阴阳五行学说就统治了中国的世界观和科学

回到现在科学的发展。

首先,古希腊的传统使得对没有实际意义和作用的问题的追问保留了下来。例如,物质到底不断地分下去会是什么,宇宙到底从哪里来,我能够在辩论上战胜你到底是因为我聪明嘴皮子厉害还是逻辑和事实,你如果要学习一个东西到底我是应该灌输给你还是帮你自己认识到,等等等等。这些问题(关于世界本源、批判性思维、逻辑)没有一个是帮助解决吃饭问题的。可是你看,泰勒斯、德谟克利特、苏格拉底、帕拉图、亚里士多德,等等,都是在追问这样的问题。其中,亚里士多德值得单独提一下:其第一次把物理学(自然科学)从哲学(那时候不分家,任何思考都算哲学)分出来,成为关注世界怎么回事的一个学科。顺便,这个批判性思维的传统到了后来的笛卡尔的手上,就被明确地提出来,并且在实际数学研究中运用了。

其次,欧几里得在人类文明史上有特殊的地位,其建立起来的从很少的定义和公理出发,通过逻辑论证,来构建整个几何学(甚至整个科学和数学)的方式,我这里称之为系统性思维,是迄今为止,人类构建科学理论思维典范。

接着,伽利略使得这些科学从这些思辨的层面,走向了实验、实验和思辨对比的层面。说,你想看看是不是不推就不走了,那么,咱们就把你放到冰面以及其他光滑程度不同的面上试试,并且做好时间和距离的测量。在这里,实验主要起到检验的作用。

最后,终于差不多到了第谷、开普勒、牛顿出来转一圈的时候了。在第谷的大量的准确的天体观测数据的基础上,开普勒用数学发现了运动规律,而牛顿呢把天体运动和地面上的运动联系起来从而建立了运动定律(把物体的运动用位置和时间来描述,并且联系着一个叫做力的东西,是一个心智模型)和万有引力定律(把天体看做是靠引力相互联系在一起的,是一个心智模型),并且为了这个目的发展了数学(微积分)。之后,很快基于这些模型得到的进一步结论得到了验证。这才形成了现代科学的体系。在这里,实验数据除了检验模型还起到了启发模型的作用。同时,数学和模型(往往表现为数学结构和物理概念)、数学计算和论证开始成为科学的基本语言。

因此,对于现代科学的发展来说,关注抽象的不解决吃饭问题的问题、依靠数学的证明和计算来思考、运用数学来建立世界如何运转的的模型并且依靠实验数据来启发和检验模型、批判性思维、系统化思维,这是非常重要的。

现在,再一次回到中国的科学、技术、思想,除了当官和为人处世的经验总结,优美的诗词歌赋,少量没有系统性的支离破碎的数学结论、不太少的技术,我们有什么?有对基本问题的追问吗?有批判性思维吗?有系统性的数学吗?有从技术变成模型,变成系统性的模型吗?有用实验来检验一下这些模型的想法吗?

如果不能直面我们的问题,把头埋在沙堆里,我们如何取得真正的进步?

这个帖子在微信公众号“为了理解而教和学”被举报了,说,这是在挖祖坟、灭自己威风(民族自豪感),只要是祖坟和国家民族的自豪感,就不应该挖。这是什么逻辑?只有直面自己的问题,才能取得更大的进步。如果我的祖坟里面藏着汪精卫和汪精卫的精神、吸血鬼或者某种将来可能阻碍社会发展的病毒,请大家帮我一起挖掉它!另外,前半部分关于四大发明的是在目前能够找到的材料上的总结,没有任何东西是我自己的。没有补充参考文献,就多多迁就了。没写成任何论文的打算。我本身是搞科学的,不是科技史,也不是哲学。但是,从对比中,看到为什么中国没有科学,挖一挖自己的祖坟,还是能够完成的。

关于为了维持民族和国家自豪感就不应该挖自己祖坟的评论,我在回复里面举了一个例子,也分享在这里。有一个家出了一个特别能够赚钱的女儿。并且由此全家人在村里的地位和声誉都特别高,甚至这个村也由于这个家在所在的地区地位和声誉特别高。现在,这个家的自己人和其他人都(有证据地)发现,其实是因为这个女儿出卖色相得来的。现在,这个家的其他人和这个村的其他人,都说为了维持家和村的自豪感,不能把这个真想公布出来。你看看,这是什么逻辑?这样能够培养出来真正值得这个家和这个村自豪的人出来吗?中国的国家自豪感如果建立在这样的东西之上,还真的可悲。顺便,我不鄙视靠色相赚钱啊,这里只用来举例。可以改成贩毒、黑社会等等其他没有这个隐藏性这么好的例子。

回到这个帖子的主要结论:在四大发明上,中国人起到了启发性的作用,应该是还算客观的,尤其是火药和造纸。但是,说这启发性作用就表示这四大发明属于中国,或者说,在中国取到了很大的作用,就非常勉强了。既然在已经很早就启发了的地方(发源地)都没有在技术上发扬光大,在科学上促进现代科学的发展,我们如何好意思说,四大发明在世界的发扬光大,也是我们促进的呢?不过,再一次强调,这个结论本身是否认同不是最重要的,最重要的事情是,是否允许质疑和讨论这个结论,质疑可讨论这个结论为什么就成了师德问题!

顺便,这个帖子的关于四大发明的前半部分,基本上是我整理的前人的话,基本没有我自己发明的说法或者提供的证据。至于参考文献,我也不是这个专业的,也没想过写成论文,就暂时允许我不列出来了。要回头去找起来还挺麻烦的。我自己要说的话在关于现代科学的第二部分,没有批判性思维、没有系统性思维、没有实验和测量的启发和检验、没有用数学来计算和建立抽象模型,就没有科学;而且这些东西在中国古代固然没有,现代中国也不见得很多人就有。

你看,我对中国人的批判可不仅仅在古代中国,也不仅仅在四大发明,甚至涉及了现代中国,以及中国对整个人类的科学、数学、哲学的贡献这个层面。我举报我自己,要不要来停我的课啊!