博弈研究大体思路和几个项目

作为物理学家,对于博弈论的理解,可能和经济学家和数学家不太一样。最近在博弈研究上的进展还不错,也有不少的问题需要进一步研究。在这里做个小小的总结。

首先,博弈论是科学,科学就要解释实际现象。然而,博弈的理论部分——例如非合作博弈的Nash均衡、均衡的求解、均衡的选择(精炼、演化博弈)——和博弈的实验结果存在很大的差异。对于物理学家,这个意味着理论进一步修改和进步的机会,激动人心的机会。对于数学家可能会觉得不可能不相符啊,我们的假设多美美妙啊。对于经济学家,他们会说这样的不相符是经常出现的,那是因为现实太脏了,离我们的理想模型太远了。在物理学里面,如果你去做一下自由落体实验,理论计算的结果和实验的差别也是很大的,尤其是对于羽毛之类的东西。那物理学怎么办呢?第一,要(最好通过实验)验证,如果现实可以很干净(把其他因素都去掉),例如放到真空管子里面,那么,实验确实和理论相符。第二,通过计算可以把脏的其他因素一个一个加回来的,直到和实验基本符合。例如,考虑空气阻力,考虑空气阻力和落体形状的关系,考虑由于地球自转形成的Coriolis力等等。因此,实验和理论做到了相符。因此,在博弈这个问题上,我们要关心这些理论和实验不相符的地方,企图构建能够和实验相符的理论。这是最主要的思路

其次,具体哪些现象集中体现了理论和实验的差别,并且具有一定的实际意义呢——例如对于机制设计?合作是一个重要的点。在囚徒困境中,理论上大家都应该相互背叛,但是实际上连单次博弈中都存在不少合作者。在最后通牒中,理论上提议者应该给出最小值,接受者应该接受这个最小值,但是实际上,经常给出来\(30\%-50\%\),同时低于\(30\%\)的拒绝的人的比例挺高。在公用品中,在某些合适的投资回报比\(R\)的情况下,大家都应该搭便车,而不是相互合作来提高整体收益。同时,合作又是人类社会中非常普遍和重要的现象。很多时候,有的人宁愿为了某个目标而做出牺牲。当然,也有这么解释合作或者说牺牲的,说如果不合作长远来看自己的利益受损。也就是说有声誉、折现等等其他考虑。也就是自己的收益中不仅仅包含当前的货币收益。还可以看看合作是不是利他性的结果,也就是自己的收益函数中不仅仅包含自己的货币收益。还可以看看,合作是不是惩罚、害怕惩罚、厌恶不公平的结果,也就是自己的收益函数中不仅仅包含货币收益,还有情感等其他收益。

再次,针对这些现象,这个理论和实验的差距的问题,我们怎么办?如何构建新的理论?前面提到了收益函数的拓展:搞清楚收益函数都包含什么,再具体问题中如何写,各个部分的权重是什么。除了这个,还可以考虑均衡概念的推广。例如,QRE——不再是仅仅追求最大化,而是只保证收益越大的策略被选择的几率越大。

最后,还有如果把经典博弈看作是对经典对象的操作的选择问题的话,一旦那个被操作对象换成了量子系统,博弈的理论描述,包含Nash理论呢的自然推广和那个时候的实验和理论相符的理论体系,如何构建?最近在看IBM Q,看看是否能够做点实验和理论研究。

顺便,除了对概率理解和最后通牒的关系的研究,天笑这几年整的Otree的使用经验,也算一个重要学术贡献。做好整理,放在网络上,供其他人参考使用。

讲完了整体思路,结合几个具体工作,来讨论一下工作风格的问题。我最近在关心几个具体一点的实验问题:原始的最后通牒(UG)和阈值版本的最后通牒(SUG)——就是接受者提前给出来一个最低可接受值的策略而不是在提议者给出来分配方案以后来决定是否接受——在实验结果和博弈者思考上的异同;提供姓名是否会促进最后通牒中的合作——最近王震等人的实验很漂亮地说明了在囚徒困境中提供姓名可以提升合作的水平;反馈均值、背后站人等因素是否会影响个体的诚实程度——以扔色子报点数的实验为例,1-5报多少给多少,报6不给钱;是否一个学校的主性别对于本性别具有促进效果;以及我们已经初步完成的概率理解测试和最后通牒中的提议者行为的关系。

在这里,我第一个想说的事情是,实验研究的直接目的和价值目的要明确。在这里,建议大家看看有一个叫做Vee Diagram(V形图的东西,在Novak和Gowin的《学会学习(Learning How to Learn)》这本书里面有)。主要是在讲在设计实验和整理实验结果的阶段,我们用什么方式来帮助思考。直接目的和价值目的分别是什么。

第二个我想说的事情是,实验工作一定要认真细致。在没有搞清楚原始的最后通牒(UG)和阈值版本的最后通牒(SUG)的行为上的区别之前,就想做网络的SUG并且还宣称自己在做UG是有问题的。这不是在做博弈,而是在研究其他花招的影响,或者对其他花招的影响。这个不是我们解决博弈理论和实验之间的差别这个核心问题的路子。更进一步,单人二人的没有清楚,直接上多人的也是问题。再进一步,单次的没有清楚,直接做多次的并且是轮换角色的多次(轮换角色加上SUG的二人单次的结果是什么是一个问题),也是问题。例如,在王震的工作中其实有两个因素是否之前就认识提供决策的时候是否提供姓名。他们目前的工作尽管不错,但是,考虑了认识的提供姓名,不认识的不提供姓名的结果,原则上还需要考虑不认识的提供姓名和认识的不提供姓名的实验结果。这样才能够区别声誉对报复的担心和提供姓名对行为的影响。在后面的几个研究中,我也没有做到随着实验的进行来调整实验方案,例如,提供均值的应该考虑更长一些的轮数。学校主性别的应该考虑刚入学的学生和后来的学生的区别,甚至国内的和国外来留学的学生的区别,提供均值的也应该考虑国内的国外的和混合的的区别。通过认知细致的实验来区分不同的因素的影响,这是需要非常注意的问题。这一点在从UG到独裁者(DG),再到信任游戏(TG),再到人和机器的实验,再到人和机器并且提供概率的实验,这个整体思路的设计上,体现的尤其深刻。

关于UG和SUG,我还想通过策略显示方法来做一下实验,看看,是不是接受者确实可以用阈值模型来描述,是不是提议者对接受者的认知可以通过阈值模型来描述,还是说,一定要概率分布函数的描述。

另外,无风险利他博弈的主要研究思路,初步结果的意义,进一步研究的问题等,也总结一下发给我,我放在这里吧。总结的时候可以考虑用V形图

练手层次的问题:昨天天笑让我看Nowak2000年的science文章。看到用演化博弈解释不给最小值,主要就通过获取历史信息来实现。但是,其中用到的是SUG。希望有学生能够用演化博弈做一下原始UG。

《博弈研究大体思路和几个项目》有3个想法

  1. 昨天天笑让我看Nowak2000年的science文章。看到用演化博弈解释不给最小值,主要就通过获取历史信息来实现。但是,其中用到的是SUG。希望有学生能够用演化博弈做一下原始UG。

吴金闪进行回复 取消回复

您的电子邮箱地址不会被公开。 必填项已用*标注