理解型学习名词解释

理解型学习的全称是:以成长型思维和学科大图景为目标的以批判性思维和系联性思考为指导的以概念地图为技术基础的理解型学习,或者人类知识高速公路上以高层知识生成器为目标的理解型学习。

其中人类知识高速公路对应着各个学科的知识所构成的概念地图。高层知识生成器指的就是成长型思维、批判性思维、系联性思考、学科大图景。因此,两个说法的含义相同。那,为什么又要“发明”人类知识高速公路、高层知识生成器这两个新词呢?

这里,先来解释一下高层知识生成器,然后再来解释人类知识高速公路。

我们把知识分成四个层次:

  • 第一层,事实性程序性知识
  • 第二层,学科概念
  • 第三层,学科大图景(进一步解释在下面)
  • 第四层,批判性思维、系联性思考、成长型思维等一般性人类思维,以及教和学的方法

然后,我们把其中的第三层和第四层成为高层知识生成器,由于其具有生成相对低层知识的能力,也就是说,当我们把第三四层的知识用于具体问题的解决的时候,我们可以得到第一二层知识。

当然,反过来,其实第三四层知识也是从第一二层知识的创造过程中总结抽象提炼出来的。在这个意义上学习一个学科需要做好第一二层知识和第三四层知识之间的上下贯通。并且,一旦将来在某个学科达到了上下贯通,走到了超越具体学科的第四层,则很有可能可以达到左右贯通,也就是一个领域的问题,可以通过另一个领域的思维方式和分析方法来提出和解决,从而真正实现学科融合,以问题为导向的学习和研究。

人类知识高速公路是对学科概念地图(具体解释在下面)的精炼,也就是在所有的概念和联系中,尽量只保留对三四层知识来说最关键的那些概念和联系,也就是留下来高速公路(联系)和高速公路上的站点(概念)。

以下是其中每一个关键词的解释:

成长型思维:做中学、教中学、挑战着学、创造中学、任何时候都可以再进步。

学科大图景:一个学科的典型研究对象、典型研究问题、典型思维方式、典型分析方法、和世界还有其他学科的关系。学会知识还是创造学会知识的思想和方法(尽管,是不是其实这些思想和方法还是知识?),以科学为例——用具体例子体现科学是给世界构建一个可计算的心智模型并且这个模型给出来的结果和实验以及观测结果相符。如果是为了学会创造知识的方法,而不仅仅是知识,那么,学科大图景比知识本身重要。当然,不学习知识和知识的创造过程,体会不到学科大图景。

批判性思维:没有经过我自己的理性检验(观察实验或者计算推理)的东西不能成为我下一步思考和认识世界的基础。例如伽利略运用斜塔实验和纯思辨的理想实验对重物落得更快的批判以及我们对后者的批判、冰上运动和力是维持运动的原因。

系联性思考:未知联系已知就是理解,构建理解的基础和框架,具有系统性(核心和成长),和逐条记忆检索相反。注意,把联系表达成网络和矩阵之后,还可以分析和计算联系:\(系联=联系^{1}+联系^{2}+联系^{3}+\cdots\),从孤立到有联系,从直接联系到间接联系,从个体到整体。

概念地图:概念,通过联系,构成的网络。也称为知识图谱、概念网络。其中学科概念地图指的是把一个学科的主要概念、概念之间的关系、概念和学科大图景之间的关系,整理之后,制作出来的概念地图

创造体验式学习,也称为创造中学、挑战着学:在学习新概念的时候,老师创设一个接近概念提出的当时的背景的问题,不管是从理论本身出发,还是从具体要解决的实际现象出发,启发学生把这个新概念自己创造出来,体验一下其创造过程,希望不仅能够帮助学生学会这个概念,还能迁移到如何创造其他类似概念。

以项目为基础的学习,也称为做中学:设计一个能够把之前学过的知识和思维方式用上的问题,或者选择一个类似的实际问题,来解决,从而帮助学生更好地理解学过的知识和思维方式。当这个项目用于启发学生“创造”新知识或者思维的时候,这就是创造体验式学习。

讲给别人听,或者叫同伴教学法,教中学:把一个问题给别人讲清楚,接受别人的提问和挑战,可以使得自己理解的更深刻更清楚。

教的更少,学得更多:在老师指导下,通过理解型学习、创造体验式学习等方式来学习尽可能少的核心概念和基本概念,以及依靠这些概念提出和运用过程来增加对一个学科的大图景的认知,从而自己学会创造知识、创造性地运用知识和进一步学习这个学科的知识,就实现了“教的更少,学得更多”的目的。

学的更少,学得更多:从学生的角度,可以在老师的指导下,也可以在合适的学习资料的帮助下自学,通过理解型学习、创造体验式学习等方式来学习尽可能少的核心概念和基本概念,以及依靠这些概念提出和运用过程来增加对一个学科的大图景的认知,从而自己学会创造知识、创造性地运用知识和进一步学习这个学科的知识,就实现了“学的更少,学得更多”的目的。

痛快教育:理解型学习、创造体验式学习的实践很多时候,会比主要依靠记忆和重复刷题的机械式学习更需要时间和思考的投入,这通常本身并不一定愉快,往往不轻松,但是学习以后的效果却往往会更快乐——学会了创造知识的方法、体验了创造的过程。把这个过程的痛和结果的快合起来称为“痛快教育”。专门选择了这样一个词来和“快乐教育”、“减负”对比起来。追求短期快乐,减掉思维负担的教育,长期来看,只能增加负担,增加痛苦。当然,如果减掉的不是思维负担,而是那些可有可无的知识点,可以被其他更好的知识点代替来体现学科大图景的知识点,那这个负是该减的。这样减掉之后就正好达到了“教的更少,学得更多”。然而,如果一位老师没有这些理念,或者对学科认识不够深刻,则减掉的往往就是思维负担,就是最重要的学科大图景,只留下一个个孤立的需要通过刷题来学习的知识点。

为了理解自己和世界而学习:看看世界到底怎么回事,这世界的哪些地方“我”自己竟然可以理解,看看我自己最善于做的是什么,为此而思考而学习而创造,是一件快乐而有意义的事情。

硬核本科人才培养

学习的根本目的是创造知识、创造性地使用知识,以及欣赏知识的创造和创造性的使用,对于这些目的,最重要的是对知识的理解。这就需要通过“以成长型思维和学科大图景为目标的以批判性思维和系联性思考为指导的以概念地图为基础基础的理解型学习”,搞清楚学什么、怎么学、为什么学这个。除了学习方法的基础,当然,创造和创造性地使用以及欣赏,还需要学会一些前人的知识和前人解决问题的方法以及其中体现的思想。那么,这样的知识和思想,以及解决问题的过程和经验的体验,包含哪一些呢?

首先,本科所学习的东西,要比较基础,比较普适,将来可以专门化到多个领域。在“学科层次和本科专业选择”这个帖子里面我讨论了学科的层次结构。从中可以看到,做为科学的语言的数学以及最体现科学的精神的物理,正好就是满足上面的要求的要学习的东西。

其次,一定要在一定量(越少越好)的学会具体知识的基础上,体会好每一个学科的大图景,也就是典型研究对象、典型研究问题、典型思维方式、典型分析方法、和世界还有其他学科的关系。

最后,还要进一步从具体学科的学习升华到上面的理解型学习的目标——学会学习和思考:“以成长型思维和学科大图景为目标的以批判性思维和系联性思考为指导的以概念地图为基础基础的理解型学习”。

当然,补充一下,创造体验式学习和以项目为基础的学习,是非常重要的教和学的方式,“做中学”、“学以致用”能够帮助学习者更好地实现上面的几个学习目标。

顺便,最近学院在讨论系统科学本科人才培养。在这个帖子里面,我来分享我对本科人才培养的思考。我先设计一个硬核版本的,将来再设计一个更软一点的。在“工具、课程与学习资料”这个帖子里面有一部分课程的学习资源。

硬核版本本科培养目标:具有扎实数学物理知识和思维方式(批判性思维、系统性的知识体系、数学和科学的关系等)的基础,具有对一两个专门领域的一定理解,具有一定创新精神和成长型思维,具有系统思维(系联性思考)的多学科复合型人才。

核心课程

  • 学习方法部分:学会学习和思考(理解型学习、创造体验式学习、以项目为基础的学习、讲给别人听、分解和综合、系联性思考、知识的系统性)
  • 数学部分:数学分析(或者微积分)、高等代数(或者线性代数)、概率论、统计学、复变函数(选修)、拓扑学(选修)、群论(选修)、微分几何(选修)、泛函分析(选修)、优化理论(运筹学、控制论)、微分方程定性理论(选修)
  • 物理部分:力学、分析力学、统计物理学(压缩热力学部分)、电磁学电动力学狭义相对论结合(压缩内容,主要学会对称性、电磁学中的数学、狭义相对论的提出等)、高等统计物理学(选修),量子力学(选修)
  • 计算机科学部分:算法导论、编程语言(做中学)和编程方法(面向过程、面向对象)的结合、科学计算(微分方程数值求解、数值积分、数值线性代数、插值、作图),机器学习基础(选修)
  • 系统科学部分(夹带私货):系统科学概论(有整理出来的具体研究工作案例支撑,有听一听的,还有做一做的,或者分为系统思维1和2)、数学建模(最重要提升用数学结构描述世界的能力,也学习一些典型现象和对应的模型,不过最重要的是这个构建对应的过程以及其中体现的思维。例如,可以结合以具体领域的例子支撑的非线性动力学,可以把量子系统的行为到量子状态的矢量描述当做例子)、数据科学(从数据中获取信息的能力和技术)、网络科学(系联、和矩阵分析的关系)、复杂适应性系统
  • 经济学部分:微观经济学、博弈论、计量经济学(选修)
  • 领域方向课部分:经济学导论(选修)、生物学导论(选修)、神经科学导论(选修)、地球科学导论(选修)、环境科学导论(选修)、教育学导论(选修)、历史学导论(选修)、人工智能导论(选修)、语言学导论(选修)

具体课程目标

  • 学会学习和思考:以成长型思维和学科大图景为目标的以批判性思维和系联性思考为指导的以概念地图为基础基础的理解型学习、创造体验式学习、以项目为基础的学习、讲给别人听(同伴教学法)、分解和综合、系联性思考、知识的系统性。以具体学科的学习为例,从知识的学习中提炼出来学科大图景,解决学什么、怎么学、为什么的问题。直接先修课(间接依赖的忽略):无,实际上需要学习者对一两门课程具有比较深刻的认识。
  • 力学:力学世界观(系统的状态,状态描述,状态变化的原因)、一个学科的系统化的概念体系(用最少的基本概念和假设来通过逻辑构建整个理论)、数学是科学的语言(描述世界,开展思考)、科学和现实的关系(科学是世界的可计算的可证伪但是迄今为止尚未被证伪的心智模型),用具体的力学的知识来体现好上面这些目标,力学是物理学的导论课,甚至是整个科学的导论课。直接先修课(间接依赖的忽略):数学分析(最好能够在课程之间例如和数学分析或者微积分协调一下,帮助力学的学生能够具有学习力学的基础,力学的老师呢可以把需要微积分的地方稍微往后一点等等微积分的进度),如果没有数学分析的基础,则需要增开一个实用微积分短训。
  • 分析力学:从最小作用量原理得到整个力学理论、变分方程的运用、乐朗德变换的运用、力学系统的完整描述(拉氏量、哈密顿量),做到能够从一个系统的完整描述开始得到所有的力学信息。直接先修课(间接依赖的忽略):数学分析、力学。
  • 统计物理学:从力学到统计物理学的推导的尝试、平衡态统计的系综理论(理想气体、Ising模型)、关联函数、相变、平均场理论、布朗运动和随机过程、统计物理学在其他系统中的运用,做到能够用分布函数及其演化方程的方式来描述物理的以及其他的多体系统以及在这中间的例如关联函数和平均场理论等一些方法。直接先修课(间接依赖的忽略):数学分析、线性代数、概率论、分析力学。
  • 电磁学电动力学狭义相对论结合:从电磁学的现象到积分形式的基本方程、从积分形式的基本方程到微分形式的基本方程、用格林函数和对称性来在一些具体系统上求解这些方程、位移电流的引入、光速不变的发现,实验和理论上的困境导致狭义相对论的出现、狭义相对论的基本内容(时空、距离),做到从实验和理论上的困境出发来找到突破口找到更加统一的理论,同时也学习一点场的数学。直接先修课(间接依赖的忽略):数学分析、力学,推荐具有分析力学的基础。
  • 高等统计物理学:关联函数临界现象和相变、平均场理论的更多表现形式、随机微分方程和统计物理学中的随机过程、Kubo的非平衡统计力学框架(投影算符、有效方程)、统计物理学的研究实例。这门课是在眼界和具体方法上对《统计物理学》的补充。直接先修课(间接依赖的忽略):数学分析、线性代数、概率论、分析力学、统计物理学。
  • 量子力学:量子系统的行为、量子状态的数学模型、量子状态变化的数学描述、对其他可能的理论形式的探索。这门课能够非常好地体现科学和现实的关系,科学和数学的关系,从知识都到科学研究的过程、困难、创造和逻辑,同时也对矢量的一般威力有一定的认识。直接先修课(间接依赖的忽略):线性代数、分析力学。
  • 数学分析:集合、映射、极限、微分等概念体系为主,具体计算为辅,主要启发学生做深入和严密的思考,面对当年数学基础的挑战,顺便也学点无穷小、微积分等知识。直接先修课(间接依赖的忽略):中学数学。
  • 线性代数:集合、映射、矢量空间,矩阵论,做到善于把实际对象变成矢量和矩阵。直接先修课(间接依赖的忽略):中学数学。
  • 概率论:古典概型、现代概率论、随机事件和随机变量、中心极限定理、大数定律、贝叶斯公式,做到对概率论的基本概念和重要结果心里有数,能够把问题变成概率论问题。直接先修课(间接依赖的忽略):数学分析、线性代数。
  • 统计学:经验分布函数(empirical distribution function)、样本、置信区间、统计学基本问题(从给定样本中得到经验分布以及这个经验分布的接近程度)、非参数估计、参数估计、p值的含义和问题、贝叶斯推断,做到对统计学的基本问题心里有数,能够把问题变成一个统计学问题。直接先修课(间接依赖的忽略):概率论。
  • 数学建模:用具体的建模过程、学科发展过程的例子,来展示什么是数学建模——也就是把实际问题变成一个数学问题然后解决问题的过程。做到把实际现象和问题变成数学物理学问题,用合适的数学结构和物理概念来描述世界,了解科学研究的基本过程(从现象或者理论中提出问题、把问题数学化、求解问题、检验和推广答案)。这是整个科学课程的核心之一。直接先修课(间接依赖的忽略):数学分析、线性代数、概率论、力学、统计学。
  • 数据科学:给数据建模挖掘出信息的思维习惯和能力,时间序列处理、统计模型、关系数据的处理。直接先修课(间接依赖的忽略):数学分析、线性代数、概率论、统计学、编程语言和编程方法、机器学习,推荐具有数学建模的基础。
  • 系统思维1,2:用具体的研究工作的例子来展示系统科学都能够做什么,系统思想在里面起到了什么作用。一定要把(目前阶段看到的)系统思想提炼好,体现这些思想的例子分类分层次整理好。其中第一门课不太需要学生动手算,能欣赏,看出来哪里系统科学了,了解点什么是系统科学就行。直接先修课(间接依赖的忽略):高中数学、高中物理。第二门课,要求学生能够算,甚至能够主动提出和解决问题。直接先修课(间接依赖的忽略):数学分析、线性代数、概率论、力学、统计学、统计物理学。
  • 网络科学:用网络——相互联系起来的事物——来描述世界,解决问题的思维习惯和能力、典型网络分析方法和软件包、网络谱理论(矩阵、张量)、网络上的过程、网络的演化、网络的典型应用。直接先修课(间接依赖的忽略):线性代数、概率论、编程语言和编程方法。
  • 复杂适应性系统:内部状态和外部驱动互动更新的系统的典型例子和应用,也可以放到数学模型里面讲授。直接先修课(间接依赖的忽略):数学分析、线性代数、概率论、力学、编程语言和编程方法。
  • 优化理论:运筹学、控制论,现代视角:静态和动态过程的给定目标和约束的优化问题,和网络等学科的结合,和实际应用结合。直接先修课(间接依赖的忽略):数学分析、线性代数、分析力学、科学计算。
  • 编程语言和编程方法:编程的基本逻辑(教计算机干明确地的活)、变量、状态、操作、逻辑门、图灵机,顺便学会一门语言,了解和运用面向过程编程、面向对象编程。直接先修课(间接依赖的忽略):无。
  • 算法导论:典型优秀算法的思想、编程、应用和算法复杂度分析、可计算性。直接先修课(间接依赖的忽略):数学分析、线性代数、编程语言和编程方法。
  • 科学计算:数值微积分、插值、Monto Carlo、数值线性代数,科学计算软件包、并行计算、Linux操作,具有较强通用性的科学计算的算法和算法的运用,结合以项目为基础的学习。直接先修课(间接依赖的忽略):算法导论、编程语言和编程方法。
  • 机器学习基础:神经网络模型、优化算法、典型机器学习问题和算法、自然语言处理、知识图谱、自动机器学习,帮助学生准备进一步学习和发展更加专门的机器学习算法的基础。直接先修课(间接依赖的忽略):数学分析、线性代数、概率论、算法导论、编程语言和编程方法,推荐具有网络科学的基础。
  • 微观经济学:理性人假设、给定共同约束和共同目标的优化问题在经济学上的应用,结合经济学导引介绍一般均衡理论等整个经济学的大厦如何依赖于微观经济学,理论框架的问题。直接先修课(间接依赖的忽略):数学分析,推荐具有优化理论的基础。
  • 博弈论:多方可能有冲突的约束和目标的优化问题在经济学上的应用、多方的理性人假设,结合经济学导引介绍一般均衡理论等整个经济学的大厦如何依赖于博弈论,博弈实验研究和理论框架的问题。直接先修课(间接依赖的忽略):数学分析,线性代数,推荐具有优化理论的基础。
  • 计量经济学:截面数据的处理、时间序列数据的处理,回归、结构方程模型等统计模型,典型随机过程及其在经济数据和经济问题中的应用。也可以把内容拆分以后放到数学建模和数据科学里面。直接先修课(间接依赖的忽略):微观经济学、统计学,推荐具有数据科学、数学建模的基础。
  • 各学科导论课:用具体例子,体现好每一门学科的大图景:典型研究对象、典型研究问题、典型分析方法、典型思维方式、和世界还有其他学科的关系,精炼、清晰、深入,低起点、高终点。尽量做到除了大学基础数学(数学分析、线性代数、概率论)和物理(力学)之外,不需要其他先修课。

104536355

后续待补充

什么是研究工作,什么是一个博士生的研究工作

学习的根本目的是为了创造知识、创造性地运用知识、欣赏知识和知识的创造过程。当然,顺便,为了实现这些目的,最重要的是理解知识,也就是看到概念之间的联系、看到概念和它诞生的时候的问题的联系、看到概念和学科大图景(一个学科的典型研究对象、典型研究问题、典型思维方式、典型分析方法、和世界还与其他学科的关系)之间的联系。只有在学习的时候得到了深刻的理解、用了研究性学习(创造体验式学习,把一个概念的典型场景从原始论文或者其他地方提炼出来,设计好一个问题,让学生通过解决这个场景问题来自己提出概念),才能帮助我们做好的研究。不过,这个理解知识不是我们今天要说的重点。我们今天来说说,既然研究是学习的根本目的之一,甚至也是学习的重要方法之一,那什么才是研究,尤其对于一个博士生来说。

首先,研究是大概来说这样的一个过程:提出问题之前的准备(包括学科知识和大图景的研究性学习、论文阅读,论文阅读要看到论文之间的联系,形成概念地图,得到所研究问题的来龙去脉和现状的整体认知)、提出问题、把问题形式化(例如变成一个数学问题、变成一个实验)、求解问题、检验答案(先假设形式化准确,用其他方法或者极端情况来对比一下一般的答案,设置对比实验组;如果过了这一关,回到形式化这一步,看一看假设是否可以接受,如果修改其中某些假设会怎样;最后,可能还要做实验和实践的检验),以及之后的撰写和投稿论文(这里也有很多技能要学习,例如结构化写作)。一个希望做研究工作的人,毫无疑问,要通过一两个工作来对这个研究过程形成一定的认识。尤其是提出问题这一步,就算在导师已经提好问题的情况下,也要回到场景去体会一下,问

  1. 为什么会提出这个问题?
  2. 如何提出的这个问题?

当然,熟悉过程,学会一些技能,理解好学科,这些都是训练。基本上是硕士阶段应该完成的事情。当然,随着研究工作的开展,你对学科可能会有更好的理解。如果是博士,则还有更高的要求:你得是某个方面的专家,以及有一两把善于使用的刀子,以及对某个领域的兴趣和对磨刀子甚至发明刀子的兴趣

其次,研究不仅仅是上面的那个过程而已,研究是通过找到和解决一个学科当前还不能解决的问题(可能是形式化之前的偏实际场景的问题或者形式化之后的偏理论体系的问题)来补充甚至重构这个学科当前的知识体系和大图景。对于后者,有的研究工作会给这个学科提供新的思维方式分析方法,因此,不仅仅是解决了某个问题而已。因此,对于任何一个研究工作,都要问类似这样的问题(对于欣赏他人的研究工作,也要问类似的问题):

  1. 在我自己要做的这个研究之前,
    1. 这个问题确实还没有解决吗,没有人研究过或者说没有人用这种方法研究过吗?
    2. 这个问题可能的答案是什么,如果我们得到了某个答案,对于整个学科甚至整个科学和技术来说,意味着什么?
    3. 这个问题的解决大概需要什么知识和技能的基础,尤其要识别出来其中最关键的那一步,我从中能够学会什么?
  2. 在我解决这个问题之后,
    1. 这个工作提出了新问题,发展了新方法、得到了新结论、提供了新案例新应用场景?
    2. 这个问题以及现在的解决方式和答案,还有什么需要继续改进的,还可以怎样进一步发展和迁移?
    3. 我从中学会了什么,学会的东西可以如何帮助我成为一个研究者?可以从学科大图景的角度来思考,从知识和技能的角度来思考。

经过这些思考,你除了了解了研究的流程,还对某个学科分支的研究现状——已经解决的没有解决的问题、问题的理论和实践价值、典型思维方式和分析方法,以及这个现状的来龙去脉——有了比较好的认知,还有一两把善于使用的刀子(思维方式、分析方法、提出问题、问题的形式化等等,任何一步任何一个方向比较强,都行)。这时候就差不多可以成为博士了:在你所研究的问题的方面,你已经和这个领域的最前沿的研究者在思考和面对类似的问题了(尽管你可能没有人家快、深入、可靠等等),你已经超过你的导师了,如果这个导师不是也正好做这个问题的直接研究的话。

拿论文追热点的工作当例子

我们来问和回答上面的问题。

为什么会提出这个问题?如何提出的这个问题?
论文的创新性的度量是一个很重要的问题,论文的评价、推荐、甚至将来是否选择把这个论文加入学科核心知识结构,都需要依靠这个创新性。但是,人类是通过阅读论文,把这个论文的核心内容提炼出来,在其他研究工作的背景上,来做这个创新性的评价的。也就是说,如果算法要能做的话,要先解决本论文的核心内容提取、其他研究论文的核心内容提取、作对比的技术,这些问题。在那之前呢?我们是不是可以通过引用行为来衡量追热点程度,也就是一定程度上创新性的反面呢?例如有的人引用一篇论文,真的是因为看到很多其他人也在引用这篇论文。

这个问题确实还没有解决吗,没有人研究过或者说没有人用这种方法研究过吗?
创新性的问题有人研究但是进展有限(这句话背后是大量的论文),领域层面的平均追热点程度有人研究,论文个体层面没有。更进一步,暂时没有发现用追热点程度传递的方式来衡量论文追热点程度。

这个问题可能的答案是什么,如果我们得到了某个答案,对于整个学科甚至整个科学和技术来说,意味着什么?
有可能可以找到一个能够描述论文追热点程度,也就是创新性的反面,的指标。不过,这个需要检验,而且这样的检验不是很容易。如果做出来了,第一确实就可以帮助做论文的评价和推荐等任务,多了一个维度;第二,可能可以在科学学领域进一步推广影响力扩散(从直接到间接)这个思维方式和分析方法。

这个问题的解决大概需要什么知识和技能的基础,尤其要识别出来其中最关键的那一步,我从中能够学会什么?
从中可以学会影响力扩散的思维方式和分析方法,也能够进一步了解科学学这个领域。

这个工作提出了新问题,发展了新方法、得到了新结论、提供了新案例新应用场景?
新方法,可以用于论文评价等场景。

这个问题以及现在的解决方式和答案,还有什么需要继续改进的,还可以怎样进一步发展和迁移?
还没有实现真正的论文创新性度量,这个论文追热点指标本身也还需要进一步的验证。

我从中学会了什么,学会的东西可以如何帮助我成为一个研究者?可以从学科大图景的角度来思考,从知识和技能的角度来思考。
这个留给建林回答。以下是建林的回答。

类似用户画像,对一篇论文我们也可以从多个角度或维度来描述,比如论文的学科交叉性、创新性、影响力、作者特征、期刊特征等等。在本研究中我们主要试图通过刻画一篇论文追踪热点的程度来间接刻画一篇论文的创新性。通过这个研究,我不仅加深了对论文间“引用”关系的认识,主要还学会了更深入地思考问题,用系统思维或是“联系”的视角去看待和解决问题。“论文追热点”是个很有意思的研究主题,在开展研究的过程中我有一系列的思考和疑问,比如:论文是否存在追热点这种现象?如果存在,我们如何来度量论文追热点的程度?当我们提出了量化指标,又该如何验证?这种指标的设计思想是否可拓展?根据指标得分来判断追热点程度高或低的论文有什么特征(在发表时间上、学科分布上、国家分布上)?哪些因素又会影响这些特征?对于这些疑问,我需要通过查文献、实证研究、反复调整算法指标来解决,也需要多思考这些问题之间的逻辑,不至于使自己偏离研究主线。通过这项工作培养了我自己独立思考的习惯以及严谨的科研态度,有助于日后书写项目申请书时理清研究思路以及学会独立开展一项研究工作。在本研究中,除了学会思考问题,还需要补充很多相关的背景知识,而这些知识主要是从相关文献中获得,学会如何整理这些相关文献也是必备的一项技能,主要是理清这些文献与当前研究的联系。

拿综述文献识别的工作当例子

为什么会提出这个问题?如何提出的这个问题?
实际工作中,我们需要把总数文献识别出来,单独做处理,不管是评价还是用来构建学科概念地图的基础帮助学生进入一个领域(总数文献在这方面无与伦比)。

这个问题确实还没有解决吗,没有人研究过或者说没有人用这种方法研究过吗?
前人提出了多个经验指标,例如参考文献的数量、看期刊。但是,还没有真正解决识别的问题,尽管已经可用。我们打算构建一个机器学习分类器来做这件事情。

这个问题可能的答案是什么,如果我们得到了某个答案,对于整个学科甚至整个科学和技术来说,意味着什么?
对于这个问题,有一个综述文献分类器的作用就是可以区分综述文献了。

这个问题的解决大概需要什么知识和技能的基础,尤其要识别出来其中最关键的那一步,我从中能够学会什么?
需要学会机器学习,尤其是其中的自然语言处理和分类器。由于实际标注数据中有噪声,因此,这个工作除了实现一下分类器之外,还需要考虑噪声的解决。后者是一个科学问题,前者基本上就是工程问题。从中,我还能学会如何区分工程和科学问题,以及从研究工作中提出和解决科学问题。

这个工作提出了新问题,发展了新方法、得到了新结论、提供了新案例新应用场景?
新工具(分类器)、新方法(噪声问题,不过后来发现这个方法的精神已经有前人的工作,尽管细节不同)。

这个问题以及现在的解决方式和答案,还有什么需要继续改进的,还可以怎样进一步发展和迁移?
分类结果还需要进一步的验证。可以把噪声处理的方式作进一步的研究和应用。

我从中学会了什么,学会的东西可以如何帮助我成为一个研究者?可以从学科大图景的角度来思考,从知识和技能的角度来思考。
这个留给骆慧颖回答。以下是骆慧颖的回答。

首先是在整个工作过程中将数据处理、构建模型、训练模型等技术运用于实践的过程中掌握了这项技术,编程能力也得到了提升。这对于我来说是一种知识和技能的积累,也是研究nlp的基础。其次是学会了如何去区分问题和工程问题,也学会了面对科学和工程问题怎么去思考。如老师所说的,构建分类器是一个工程问题,而处理噪声数据就是一个科学问题了。科学问题就像是“咦?这条路看上去好诱人,感觉前方风景很好呢!走!去看看!”我们不知道这条路通向哪里,更多的是好奇心驱使的在过程中发现问题和解决问题,它从问题出发,如我们的工作中,对于分类器的训练,标注的数据中有错误的怎么办?这些都是驱使我们进行噪音数据处理的问题导向。而工程问题则是“我知道我要去哪,但是眼前这么多条路,我该选择哪一条?又或者自己开条路?”是由实际需求和应用出发的,从选择道路到沿着路走在最终到达目的地,就像我们工作中我们想要从众多文献中将综述文献识别出来我们应该怎么做?这些都在今后的研究中给我提供了提出问题和解决问题的思路。也接触到了ensamble learning和active learning这两种学习方式,同时在进行资料学习的也同时学习到了监督学习、半监督学习、无监督学习等学习方式,是对机器学习知识的一种补充。

拿科学家的半生命的工作当例子

这是邓老师的回答:

  1. 为什么会提出这个问题?
    研究科学家的科研规律可以更好的来指导科学家的工作,不管是把科研当工作(痛苦不堪),还是把科研当人生(痛并快乐),搞科研的科学家,他应该会想知道,在进入学术领域N年之后,平均来说,还有多少年,他就可以退出学术领域了(开心,终于解脱),或者说,还有多少年,他就要离开学术领域了(遗憾,还没玩够)。具体来说,我们可以从发表文章,被引文章的角度,来定义科学家的学术生命和半生命。
  2. 如何提出的这个问题?
    在前人的基础之上提出问题,前人有研究期刊,知识,同龄人等的半生命,我们关注科学家个人的学术半生命。
  3. 这个问题确实还没有解决吗,没有人研究过或者说没有人用这种方法研究过吗?
    科学家个人学术半生命(发文和被引角度)的问题暂时没有人研究,不过前人用类似的方法研究过人的生物学生命问题。
  4. 这个问题可能的答案是什么,如果我们得到了某个答案,对于整个学科甚至整个科学和技术来说,意味着什么?
    我们可以计算出科学家当前年龄的淘汰率和预期剩余寿命,对于科学家个人而言,他可以大概知道,还有多长时间,他的学术生命就要结束了。
  5. 这个问题的解决大概需要什么知识和技能的基础,尤其要识别出来其中最关键的那一步,我从中能够学会什么?
    主要是利用统计学的知识进行数据的处理和结果的可视化,在某一个数据集上,统计个人的退出年龄,根据人口动力学方程计算出平均的预期寿命和淘汰率。
  6. 这个工作提出了新问题,发展了新方法、得到了新结论、提供了新案例新应用场景?
    一种新的从发文和被引的角度来定义个人的学术生命的方法,同时给出了个人平均预期学术生命和淘汰率的参考曲线。
  7. 这个问题以及现在的解决方式和答案,还有什么需要继续改进的,还可以怎样进一步发展和迁移?
    数据集的体量较小,需要更大规模的数据集,来计算得到更加普遍的结果。
  8. 我从中学会了什么,学会的东西可以如何帮助我成为一个研究者?
    • 了解了科研工作大概是一个什么样的过程,是提出一个可以计算和验证的模型(数学语言来描述),在数据上计算并验证模型,如果模型能够较好的符合现有的数据,则可以进行模型的迁移,当然,模型很有可能在其他数据上被推翻。
    • 以前做的工作都是各种工程类的项目,分析需求,寻找技术,完成功能,联调测试,进行维护,不断的循环,虽然也是在不断学习新的技术,但是,实际上,这些项目肯定是能完成的,只是时间投入的问题。并且,项目的结果好坏是有既定的评价标准,比如通过联调测试,用户反馈等。
    • 而科研的工作,是为了去回答一个前人没有回答过问题,不管是问题的提出,问题的解决方法,结果的评价方法,都有可能是全新的,此时,去寻找解决问题的方法,去寻找问题的答案已经比较困难,有可能找不到问题的答案,而在得到一个答案之后,怎么去评价它有时候可能会更难,这些都是和工程项目不一样的地方。
    • 在了解了以上的区别之后,我觉得最大的收获是,工程项目让人躺在舒适区里,而科研项目让人怀疑人生,痛并快乐。自己给自己打一针预防针,进入新的科研工作就没那么恐怖了。

拿替代力指数的工作当例子

这是邓老师的回答:

  1. 为什么会提出这个问题?
    因为引用某篇文献的后代会引用这篇文献的祖先,也许祖先对后代的贡献更大呢,因此,仅仅从被引数量来衡量文献的创新性,有失偏颇。一篇文献在引文网络中的作用是什么,它是否是不可替代的?如果仅从被引数量来衡量,那进入引文网络的文献都不可替代。但实际上,很多文献的后代,不仅仅引用了父亲,还引用了各个层级的祖先。如果扣除了祖先对后代的影响,文献对后代的实际影响是怎么样的,在引文网络中它的不可替代性会有怎样的变化?

  2. 如何提出的这个问题?
    在前人的基础上提出该问题,前人研究了文献扣除父亲对后代的影响后的情况,我们更进一步,把所有祖先对后代的影响全部扣除。

  3. 这个问题确实还没有解决吗,没有人研究过或者说没有人用这种方法研究过吗?
    考虑所有祖先对文献后代的影响暂时没有人研究过。

  4. 这个问题可能的答案是什么,如果我们得到了某个答案,对于整个学科甚至整个科学和技术来说,意味着什么?
    最可能的答案,扣除掉所有祖先的对后代的影响,文献的不可替代性会下降,某些文献甚至可能会出现反转,比如某些高被引文献的实际不可替代性很低,并且这些高被引文献实际上是灌水之作,如果真的是这样的话,那对文献特别是高被引文献的创新性的评估就需要采用和以前不一样的方法,也就是不能仅仅采用被引数量,还要考虑扣除祖先对后代的影响。也许可以发展出一种方法来识别真正有创新性的文章和灌水的文章。

  5. 这个问题的解决大概需要什么知识和技能的基础,尤其要识别出来其中最关键的那一步,我从中能够学会什么?
    主要是在数据集上对大型稀疏矩阵进行求逆操作,还有后续的数据分析可视化。大型稀疏矩阵的求逆操作通常转化成求解方程组问题,采用迭代法来完成。评价方面,可以选择公认的好文章和灌水文章来检验我们定义的替代力指数,好文章可以用诺奖和里程碑,而灌水文章也许可以把追热点的文章拿来试一下。

  6. 这个工作提出了新问题,发展了新方法、得到了新结论、提供了新案例新应用场景?
    是一种新的评估文章创新性的方法。

  7. 这个问题以及现在的解决方式和答案,还有什么需要继续改进的,还可以怎样进一步发展和迁移?
    • 如果在诺奖,里程碑文章上与实际符合较好,那在另一端,灌水文章上是否也符合较好,怎么识别灌水文章呢,需要其它的证据。
    • 可否迁移到其它知识网络,比如github的引用网络,来检验代码的创新性。(非常值得做,尤其是,可以考虑一个大项目,例如Linux操作系统,中各个程序的相对地位的问题
  8. 我从中学会了什么,学会的东西可以如何帮助我成为一个研究者?
    • 不能迷失在技术的深渊里,当某些技术无法解决问题时,需要考虑其它更合适的技术,比如求解线性方程组的scipy,petsc。
    • 在整个研究的过程中,一定要挂一盏灯在头上,就是,我要解决的问题是什么,我做的事情和我要解决的问题有关联吗?

拿概率条件下决策影响因素的工作当例子

天笑回答。以下是天笑的回答。

Q1:为什么会提出这个问题?如何提出的这个问题?

A1:在研究决策影响因素时,考虑个人风险态度可能是因素之一,因此需要引发个人风险态度的方法。通过文献阅读发现常用的引发风险偏好的“十项决定”已经成为很成熟的引发技术了,于是直接拿来使用。在使用的过程中发现,该量表提供的两项风险资产对比,既有均值的变化,又有方差的变化。效用函数框架下,风险资产的效用函数可以分解为各阶矩的函数(各阶矩被称为数字特征的原因)。那么从数学上,我们形式上就可以用包含均值(一阶矩)、方差(二阶矩)、偏度(三阶矩)、峰度(四阶矩)以及更高阶矩的函数来描述一项风险资产,作为风险资产的效用函数。显然,均值和方差一定在效用函数之中。那么,我们需要知道实际上人们的效用函数是否包含更高阶矩,即人们是否可以感知到各阶风险的变化呢?更高阶矩是否在决策过程中其作用呢?

如果人们不能识别高阶风险,那么效用函数就完全由均值和方差来刻画。
如果人们能够识别更高阶的风险,即对待更高阶的风险有不同的态度,反映在实验上,就是有不同的风险资产选择倾向,那么在测量人们的风险态度时,就要考量高阶风险的影响。
更进一步,我们需要考察有哪些高阶风险被包含在效用函数之中,以便进一步完善效用函数构建。举例来说,比如人们对于5阶以上的风险不识别,那么效用函数就只需要包含前四阶矩;再如人们只识别奇数的高阶风险,不识别偶数的高阶风险,那么效用函数就应该包含均值、方差以及之后所有奇数阶矩。即我们需要知道实际上哪些高阶矩进入效用函数之中。

技术上,我们可以保持其他阶数不变,只有被考察阶数不同的情况来构建实验需要的风险资产,通过风险资产之间的对比考察的该阶风险是否被识别。

总的来说,是因为我们需要引发被试的风险偏好,使用作为引发风险偏好的标准量表——“十项决定”量表时,逐渐深入了解发现,其并不能满足更精确的描述人们的风险偏好的要求,所以我们将研究的目光从前述工作转向了风险态度,尤其是高阶风险态度的测量。

Q2:这个问题确实还没有解决吗,没有人研究过或者说没有人用这种方法研究过吗?

A2:通过文献调研发现,对于高阶风险态度的研究主要集中在金融和实验经济学领域,金融领域中对三阶风险——偏度的研究比较早,在效用函数框架下,经济学家和金融学家天然的需要研究效用函数各阶导数的现实意义。他们将三阶风险厌恶称为“下行风险厌恶”,用效用函数三阶导数的凹凸性来解释了人们在预防性储蓄时的经济行为。在金融领域的资产定价和资产组合中起到了重要的作用。2006年,Eeckhoudt 和 Schlesinger脱离了期望效用框架,将高阶风险态度和特定的“彩票对”的选择偏好联系在一起,使得高阶风险态度的直接测量成为可能。 一些实验经济学家通过设定两个只有某一阶数不同,其他阶数都相同的两张彩票的对比实验,来引发人们的高阶风险偏好。这种方法正是本工作使用的方法。其理论依据是将高阶风险拆解成低阶风险的组合。

通过阅读文献我们发现,大多数研究者使用的“彩票对”,存在两个问题:
每个彩票的或有收益对应的概率不同,并且随着需要考察阶数的升高,或有收益的概率之间的差异越来越大。通过其理论基础——期望效用理论发展而来的前景理论我们知道,人们不仅会将或有收益看作主观收益,还会将其对应的概率看作主观概率(一个事实是,人们会夸大小概率事件的结果,举例:颤抖的手),那么我们考虑能不能将考察时的彩票的或有收益设置成等概率的,以便排除主观概率的影响。
另一个问题是,以三阶偏度为例,研究者选取的彩票对的偏度值都偏大,这样有助于使用小样本产生更明显的结果,但明显没有均匀的覆盖全部偏度值的取值范围,我们能不能通过彩票设定,使三阶偏度值在其取值范围内全都考察到?
针对以上两个问题,仍以三阶偏度为例,我们构建的彩票对需要三个等概率的或有收益,并且保证均值、方差都相同、偏度值正好是设定的相反值,比如±0.1,±0.2等。三个未知数(三项或有收益),三个约束条件构成方程(均值、方差、偏度),理论上存在非零解,因此我们可以解出需要的彩票的或有收益。

上述工作我们通过文献调研,并没有发现有研究者做过。高阶风险的经济学实验部分仍处在刚起步的阶段。

Q3:这个问题可能的答案是什么,如果我们得到了某个答案,对于整个学科甚至整个科学和技术来说,意味着什么?

A3:首先,我们需要在实验上证明我们对实验的改变是否影响被试的选择。如果仅仅是将或有收益的概率变为等概率的,就会改变实验结果,那么说明通过彩票对这种方法引发高阶风险根本没有稳定性可言。使用类似技术的高阶风险结论都将存疑。
如果我们将概率变为等概率,不影响主流结论,那么就说明我们带来的改变是无害的,我们的结果是可以和其他研究者进行对比的。
此时我们再将目光关注在其他研究者不曾关注的小偏度值之上,考察三阶偏度在小偏度值的时候,结果是否和大偏度值的一样。

总而言之,我们的结论将取决于我们对该实验带来的改变是否影响实验结果。通过只改变其中一个点来层层递进,如果直至最后,我们的结果和主流结果仍相同,那么至少我们完全研究了该阶风险的情况,证明了结果的稳定性。

Q4:这个问题的解决大概需要什么知识和技能的基础,尤其要识别出来其中最关键的那一步,我从中能够学会什么?

A4:需要的知识储备主要包括,理解效用函数框架所需的基础——期望效用理论及其发展,理解主观收益、主观概率,进而理解我们为什么要在构建彩票对时控制或有收益的概率都是相同的;经济学中效用函数函数的各阶导数,对应的数学上的各阶矩,明白为什么数字特征可以描述一个随机变量,从而理解我们可以使用包含各阶矩在内的效用函数描述人们的选择行为;高阶风险彩票对的构建,将高阶风险看作两个低阶风险的组合;解方程的技术——用来计算我们需要考察的彩票对;关键之处在于,通过控制变量,一步步将彩票对的设计演化为我们需要的格式,而其中一旦结论发生变化,那么彩票对引发高阶风险这一手段的稳定性就将存疑。

Q5:这个工作提出了新问题,发展了新方法、得到了新结论、提供了新案例新应用场景?

A5:最终这个工作完善了原有结论,证明了结果的稳定性。这部分工作主要研究三阶风险偏度,证明了被试倾向于选择“谨慎”的风险资产。

Q6:这个问题以及现在的解决方式和答案,还有什么需要继续改进的,还可以怎样进一步发展和迁移?

A6:关于引发风险偏好,乃至于引发高阶风险偏好,“彩票对”的方式提供了两个不同的风险资产进行对比,通过被试的选择行为考察高阶风险的作用。其实还有其他方式考察人们对不同风险资产的定价,比如发现确定性等价。在本工作中,我们并没有采用发现确定性等价的方法让被试给我们设计的每一个彩票“定价”,这可以来进行交叉验证实验结果,我们没采用确定性等价这个方法的原因是,没有彩票直接对比直观明显,需要被试有良好的计算能力。

目前我们只完成了三阶风险偏度的实验,在整个工作框架下,可以继续向更高阶风险推进,直至人们对于某一阶风险及其之后的更高阶风险不再识别,那么我们所构建的用于描述人们风险偏好选择行为的效用函数,就包含那些我们发现有用的那些阶数的风险。另外还可以使用其他方法,如确定性等价来和本结果交叉验证,证明高阶风险在不同引发方法下仍起作用。

Q7:我从中学会了什么,学会的东西可以如何帮助我成为一个研究者?可以从学科大图景的角度来思考,从知识和技能的角度来思考。

A7:这项工作在发现问题上,使我亲身体会到了在应用别人的成果时,并不能完全满足我们的需求,为此我们提出问题,从别人的工作中进一步发展。在实验设计上,主要是需要层层推进,一步步将我们的设定和改变加在原始设定之上。同样,这项工作我陷入技术细节陷入的更深,既想干这个,又想干那个,最终我是通过紧紧围绕核心问题,一步步消减冗余来走出泥潭的,比如完全舍弃了预实验与彩票直接对比同时使用的确定性等价这个方法。“抬头看路,低头向前”还是做的不好,知道和运用是有距离的,话说的好听,但学到的唯一教训就是人们不会从历史吸取任何教训。

拿最后通牒和概率理解的关系的工作当例子

下面是天笑的回答。

Q1:为什么会提出这个问题?如何提出的这个问题?

A1:从大的方面来说,可以帮助我们回答为什么要提出这个问题。

研究人们是如何做出决策的,始终是经济学、心理学等社会科学的核心问题。科学家们研究的目的有二:解释和预测。对于已经发生的行为,通过构建模型来解释人们在相应条件下为什么做出这样的决策,并外在表现为观察到的行为;更进一步,构建的描述人们决策的模型需要在相同条件或是不同条件下,预测人们会做出什么样的决策,产生什么样的行为。

决策问题是一个很庞大的问题,我们的关注点需要集中,这可以帮助我们回答如何提出这个问题。

在从我们关注的经济决策方面来说,博弈论为我们提供了很多研究框架,比如囚徒困境、公共品博弈、最后通牒博弈等博弈形式。本工作中,在这些前人的基础上,我们关注最后通牒博弈,试图找出最后通牒博弈框架下影响人们决策的因素。通过文献我们了解到,前人提出了各种影响决策的因素,包含公平、利他、信誉、文化、语境、性别、年龄、情绪、生理指标等等因素皆能影响最后通牒框架下人们的决策。在文献整理中,我们不乏看到通过实验设计来排除其他因素的影响,专注研究某一因素的思路经常出现在各文章中。因此,我们可以通过集中关注最后通牒博弈框架下人们的经济决策来缩小研究范围,通过构造实验排除其他因素影响,专注于我们需要考察的因素之上。

Q2:这个问题确实还没有解决吗,没有人研究过或者说没有人用这种方法研究过吗?

A2:考察这个问题是否被解决了,就需要考察构建出来的人类决策模型是不是能解释现有实验结果,并预测一定条件下人们的决策行为。

在最后通牒博弈中,即使我们排除了目前研究的影响因素,仍距离理论结果有着显著的差异。这代表着一定还有其他因素在人们决策过程中起作用,并进一步通过行为表现出来。

本工作的研究方法并不新颖,主要目的是试图继续深挖最后通牒博弈理论与实验之间的显著差异,试图在前人的探索上更进一步。

Q3:这个问题可能的答案是什么,如果我们得到了某个答案,对于整个学科甚至整个科学和技术来说,意味着什么?

A3:我们主要考察的是对概率的理解和被试的风险偏好是否是最后通牒博弈中的影响因素,更进一步,将已经发现的影响因素包含在一起,是否能使理论预测与实验结果相一致。

如果上面两点都达成了,那么我们就能够构建包含所有影响决策因素在内的模型,来描述人们的经济行为就更进一步了(至少在最后通牒博弈框架下)。

如果我们提出的印象因素确实在决策中起作用,但最终还是和理论值有显著差距,那么就说明除了前人提出的因素和我们提出的因素之外,人们的决策模型还包含其他我们目前未知的影响因素。此时我们至少距离完全描述决策行为更近了一步。

一旦我们提出的新影响因素被证实在决策过程中起作用,尤其是概率理解,这意味着其他框架下也需要考察这个因素是否影响人们决策,这个因素是否普遍适应各种决策框架。

如果我们提出的因素在决策过程中不起作用,在确定我们设计的实验没有问题的情况下,在各种努力尝试都改变不了结果的情况下,至少我们排除了两个影响决策因素的错误答案。至少个人风险偏好不影响最后通牒博弈框架某种条件下的个人决策,也是挺反直觉的一个结果。我们接受这个事实,总结经验教训,科研是未知答案的,甚至很多时候是未知问题的。

Q4:这个问题的解决大概需要什么知识和技能的基础,尤其要识别出来其中最关键的那一步,我从中能够学会什么?

A4:这个问题解决需要一些博弈论相关的知识,理解最后通牒博弈实验的结果和理论预测不一致冲击了经济学基本假设——理性人假设;另一方面需要博弈实验相关的知识,理解为了回答问题而设计实验,而不是反过来。需要的技能主要是依据目的设计实验的能力。在本工作中,最关键的一步是将被试的决策过程进一步分解,看作是先估计行为,再做出反应,而其中对概率的理解影响了人们做出反应这一部分。我们设计实验时,通过约束估计行为来考察我们提出的影响因素。

通过本工作,我学到了实验是为了某种目的设计的。在平时的课堂中,我们都是先接触囚徒困境、最后通牒博弈、公共品博弈、独裁者博弈等各种实验格式,更有甚者,比如最后通牒博弈,已然工具化成了引发公平的实验工具,广泛应用在各种经济学、心理学、社会科学场景中。而如果我们仔细阅读提出他们的原始文章,就能看出他们是出于何种目的构建出来的这个实验格式。更重要的是构建他们的思想,而非这些实验格式本身。

Q5:这个工作提出了新问题,发展了新方法、得到了新结论、提供了新案例新应用场景?

A5:这个工作得到了新结论,概率理解确实是最后通牒博弈框架下决策影响因素之一(同时风险偏好也是),但加入新的因素,仍不能完全抹平理论预测与实验结果的差异。
这提示我们两点:1、继续深挖。我们在解释决策问题上前进了一步,但仍存在其他我们未知的因素影响着决策过程;2、横向考察。在其他框架下,可能应该考虑概率理解因素是否起作用。

Q6:这个问题以及现在的解决方式和答案,还有什么需要继续改进的,还可以怎样进一步发展和迁移?

A6:这个问题现在的解决方式是“剥洋葱”式的,将对手替换成机器解决对手是人对提议者的影响,比如利他公平等,将机器的响应模式和概率直接展示给提议者解决提议者估计响应者行为这一学习过程。通过一步步去除其他因素,改变实验设计适应新的需求,控制变量得到答案的。我们还需要将我们找到的影响因素还原到最初的最后通牒博弈中,比如设计实验,在进行真实最后通牒博弈之前,先测试概率理解,看看那些未通过概率匹配测试的提议者,是不是真的分给响应者更多。除了最后通牒博弈框架,我们将眼光放远,概率理解在其他博弈框架是不是也是影响因素之一?

Q7:我从中学会了什么,学会的东西可以如何帮助我成为一个研究者?可以从学科大图景的角度来思考,从知识和技能的角度来思考。

A7:从帮助我成为一个研究者角度,除了为了回答问题设计实验之外,在具体工作中一定要保持“抬头看路,低头向前”。推进工作时,考虑太多会扰乱你的思路,尤其是经济学实验方面,你没办法完全预测被试的行为,所以不必要求自己一下子拿出完美的实验设计,通过预实验及其结果不断调整完善实验设计,会使整个研究过程更平滑。另外在研究过程中,当纠结于实验程序,陷入技术细节的时候,不妨抬头看看整个框架,保持核心问题,舍弃细枝末节,会帮助你走得更远。

拿量子输运的工作当例子

吴金闪回答

学科层次和本科专业选择

最近几个朋友的小孩正在选择本科专业或者大方向,问了一堆关于学科之间的关系的问题。有人就要求我把我的这些答案分享出来。那就分享一下。

首先,尽管很多人跟我的认识其实可能一样或者差不太多,但是,这个学科之间的层次关系,并且现在和大学本科的选择联系起来,是一个非常敏感的问题,因此,我得申明,这是我个人的学科的关系的理解。你要怎么参考,怎么用,你决定。好了结束了这个狗屎的逃避责任的申明,咱们进入正题。

在整个学科中,科学和术科是两大分类。术科就是创作类的、技巧展示类的,例如画画(不是画的赏析、历史、教育等)、表演(不是表演的赏析、历史、教育等)、体育运动(不是运动的赏析、历史、教育等)、写作(不是写作的赏析、历史、教育等)。不知道我列举全了没有。反正,明白这个意思就好。挖掘机操作、excel表格使用、做饭、电焊,这种纯技能性的,一般来说,连术科都是不算的,只能算职业技能培训。但是,你非要说,挖掘机操作的培训和画画的学习有啥本质的区别,我还真的不好界定。当然,电焊和挖掘机是很重要的,这些学科分层之间并没有优劣、高低级之区分。

那,科学通常分成自然科学和社会科学。自然科学就是研究自然界的对象的,社会科学是研究社会的对象的,主要表现为有人的思考、思想和决策的参与的那些对象和过程。所以,物理学、化学、生物学、地球科学、医学是自然科学,经济学、语言学、历史学、社会学、法学是社会科学。

注意,中文、英语、数学、教育、哲学、计算机科学,还有脑科学以及我们的系统科学竟然没有进入上面的分类体系。我们一会儿再回到这些个学科。

在自然科学之中,物理学是基础学科。基础性体现为知识和思维两个方面。知识就是很多其他学科的知识依赖于物理的知识。思维就是,物理很容易能够把什么是科学体现好,有了对什么是科学的理解之后,进入其他学科也会有帮助。

在社会科学中,经济学(还可以算上语言学和历史学,暂时先不算)是基础。基础性体现为,很多社会科学的问题都可以归结为人类决策,而人类决策目前主要由经济学研究。没准,将来,脑科学也会进入到研究人类决策的层面,那那时候,经济学的这个基础性地位会被脑科学取代。为什么要在一定程度上算上语言学(不是文学创作,不是文学赏析,尽管其没准可以用于创作和赏析)和历史学呢?人类的知识是由语言所描述的,不管是自然语言还是形式语言,因此,这个学科的作用将来会更加基础。历史学,按照钱穆的说法,是搞清楚历史以及用搞清楚的历史来提出、理解和解决现在的问题,那么,这是一个研究角度的问题,而且这个研究问题的角度无论对于哪个学科都非常重要。

好了,现在我们回到中文、英语等语言听说读写技能,以及数学、教育、哲学、计算机科学、系统科学等这些学科。中文、英语等语言听说读写技能应该算职业技能培训(再次强调,不表示其低级)。

数学是所有科学,无论自然科学还是社会科学,所用的语言。我们用数学来表达思想和思考,我们也从思想和思考中进一步提炼数学结构。因此,无论学哪个科学,你都避免不了数学。深入的思考不一定要借助数学,但是,借助了可以帮助你在代价很小的时候做的很深入——因为你多了一门语言。

计算机科学是对典型的、计算流程比较复杂的数学问题的计算机化解决的研究。因此,本质上,这算数学,除了计算机硬件,那算物理。当然,由于其把问题解决的方式限定为计算机算法,也就把计算机科学从数学中区别开来了。但是,学科意义类似,任何一个科学的研究,将来你总会遇到计算流程比较复杂的问题,不管是因为问题和数据的大小还是所牵涉到的计算过程,于是你就要学会教计算机干活。

教育是一个上层学科,你只有学会了一门甚至多门基础学科,有了足够深入的了解,才能成为一个好的老师和教育研究者。

哲学,按道理,是最最基础的学科,据说能够指导一切其他学科。但是,学科的分化导致了这个逻辑反过来:只有你对某个学科有了足够的理解之后,你才能从这个学科里面出来,提出来具有一般意义的深刻的问题,也就是有可能可以迁移到其他学科的哲学问题。并且,如果先学习,哲学内部的知识积累就导致你不可能同时做好哲学本身的好的理解以及对某个学科的理解。不如,等着将来没准有机会在某个学科的某些问题的研究的最顶尖最细的时候,回到最基本的问题。

说一点点关于系统科学在这个结构中的位置。首先,系统科学就是把数学和科学用于研究具体系统的研究,但是在那些个具体系统呢又还没有成长为独立的学科的时候。一旦那些具体系统的研究成长起来,就会独立出去成为一个个的学科。因此,这个意义上,系统科学像数学建模,像一般的科学。因此,这个学科必须依靠数学、计算机。另一方面,由于研究对象没有具体限定,其研究问题和研究方法上能够借鉴的东西有限,因此,这个学科必须依靠其他学科提供思维方式和分析方法,也就是说,如果没有物理学的基础,甚至其他学科的研究问题和方法的理解和借鉴,那就做不了系统科学。其次,系统科学确实也在形成自己的一点点典型思维方式,例如“从孤立到有联系,从直接联系到间接联系,从个体到整体”。因此,也算多少有点可以学习的东西。

有了这个之后,你就会大概看到下面的学科依赖关系图:
学科层次图

自然科学的大多数学科和社会科学的一部分科学化程度比较高的学科还会有相应的工程学科,例如探矿、冶金、汽车船舶飞机制造、金融工程。工程一方面是相应理论科学(这个理论科学包含实验研究啊,不仅仅是理论研究,这里的理论科学就是学科理论体系概念体系的意思)的运用,另一方面也通过不断地提出待解决的新问题促进相应的理论科学的发展,因此,可以看做属于相应的理论学科。工程之中也有一些属于科学和技术之间的,技术反过来给科学提出问题推动科学发展的成部分比较多但是又没有理论科学本身多,例如通信(背后通着信息科学)、软件(背后通着计算机科学)、空气动力学(背后通着物理学)。这一类不完全是应用性的工程学科,也有人,例如钱学森,把它们叫做技术科学。合起来就是,数学和计算机科学、(自然和社会)科学、技术科学、工程、教育、管理、哲学(先到头顶,然后又自己“觉得”或者“争取”成为最基础的底)。

顺便,分享罗素的话:科学是讲道理和经过(或者快要能够)实验验证的,哲学是讲道理的可实验验证的但是还远远没有能够实验验证的,宗教是不讲道理也不需要验证的;以及我补充的——数学是讲道理的但是不求实验验证的

再顺便贩卖点私货,系统科学是讲道理和要实验验证的但是所研究的问题还没有独立成为学科的,或者是具有研究方法和思维方式上的某些跨越具体问题具体学科的共性的,例如“从孤立到有联系,从直接联系到间接联系,从个体到整体,从具体系统中来到具体系统中去”。见下图中的我仿写的打油诗。有人说,我这个学科层次图还有这整个帖子,甚至整个理解型学习,都是系统科学思想和方法的体现。是的,就是如此:系统科学帮助我们看到联系,发现结构,融会贯通,洞彻世界。教材电子版在“吴金闪的书们”这里。

cover

我们也确实在尝试从教材和研究论文中提取概念和概念联系,构成概念网络(知识高速公路),然后通过做概念网络上的聚类来得到学科(多个不同层次的),进而得到学科之间的依赖关系,做学科的重要性(中心性和影响力)的度量。我们甚至在做这样来构建和分析网络的工具。不过,这些个工作都只有请大家稍微(可能很长)等等我们的进展了。如果你想看一下一两个例子以及整个设计,可以看吴金闪的“《教的更少,学得更多》”​。

本科的学科和方向的选择上,除非有非常明确的目标,尽量选择偏基础的学科,将来有更多的明确的方向可以选择。本科所学习的学科的大图景(典型对象、典型问题、典型思维方式、典型分析方法、和世界以及其他学科的关系)是进入一个学习者的基本思考方式的,一定要慎重选择。例如,选了会计学,将来你就可能会习惯在给定流程、规定、公式的条件下去套用,而不是去思考这些东西的含义、理由甚至改进。

进入研究生阶段的培养就不一样了,要尽量精细,尽量选择自己感兴趣的,做到专,之后再考虑贯通和联系。你说,万一研究生阶段还是没有目标没有感兴趣的领域和问题呢?那,就先去尝试工作和读书,找找方向。其实,甚至高中之后,也可以尝试工作和读书,来找找方向。不过,由于本科毕竟是打基础的时候,没目标就先选偏基础的学科。

本地wikipedia访问

没有wikipedia的日子太难了。kiwix(https://www.kiwix.org)是一个能够提供本地和局域网wikipedia服务的神奇软件。这个软件需要一个wikidpedia的内容包(zim包,其不仅仅可以用于wikipedia,例如非常有用的TED talks也有相应的zim包)和一套访问服务软件,就可以直接在本机上成为一个服务器供本地访问。

另外,还可以做一个本地sci-hub镜像。sci-hub(和LibGen一起)收集了前人通过sci-hub下载的所有文章,形成一个metadata数据库和一个论文数据库。同时,LibGen还提供了整套本地建立网站来使用这两个数据库的code。我们可以把这两个数据库和code下载回来,建立自己的本地镜像。