论静态与动态博弈中的逻辑推理

时间：2022-05-09 19:45:02 浏览次数：

摘要：博弈研究的目的是揭示人们互动行为的逻辑规律。不论是双主体的零和博弈与多主体的非零和博弈，还是不完美信息的静态、动态博弈与完美信息的静态、动态博弈，它们的实质都是策略分析与逻辑推理的运用。文章在简要介绍蓬勃兴起的博弈逻辑基础上，论述了静态博弈与动态博弈中的逻辑推理。

关键词：博弈逻辑；静态博弈；动态博弈；逻辑推理

作者简介：吴新民（1958—），男，湖北阳新人，江汉大学人文学院教授，从事逻辑学研究。

中图分类号：B81 文献标识码：A文章编号：1000-7504（2008）02-0051-05收稿日期：2007-08-12

人类的所有活动，一般只要是互动的行为，都可以看成是博弈行动。早在1911年，数学家策墨洛（E.Iormelo）对下棋进行了一种博弈理论的描述。1912年，数学家波雷尔（E.Borel）开始了矩阵博弈的系统研究，从而证明了在某些情形下，最优混合博弈策略的存在。1928年,博弈论奠基人冯·诺伊曼（Von Neumamn）在一篇论文中提出了当今博弈论的一些基础概念。1944年，冯·诺伊曼和摩根司特恩（O.Morgonstorn）合著的《博弈论和经济行为》正式出版，较系统地提出了策略型与广义型（扩展型）等基本博弈模型解的概念和分析方法，从而奠定了博弈论发展的基石。因此，人们普遍认为博弈论始于1944年。仅就博弈逻辑（Game logic）而言，则是随着博弈论的迅速发展而形成的一门新兴学科，它是一种行为逻辑。

一、零和博弈、博弈逻辑与博弈模型

一谈到博弈，人们就会想到输赢。比如市场就是人们逐利的行为集合，大众眼中直觉上的消费者与经营者的利益对立与博弈关系，经营者与经营者利益对立与博弈关系，等等。如果把得利放在某一个时点上，就是双方彼此的经济竞争，并且以互相挫败为其目的。这种人际的零和博弈就像棋局或球赛那样，永远有胜负而没有永久的胜负。零和博弈（zero sum game）就是参加者双方不了解对方所下的决策，待公布双方的决策后，其中一方根据双方的决策而对另一方的决策作出的给付（payoff）。也就是说，一方所获得的恰恰是另一方所失去的，并且二者所得的和等于零。博弈逻辑概念最早是美国纽约城市大学著名教授帕里克于1985年发表的《博弈逻辑及其运用》中提出的。帕里克教授认为，博弈逻辑是命题动态逻辑（PDL）的拓展，他“在命题动态逻辑原有程序算子的基础上增加对偶算子来建构复杂的二人博弈”[1]。著名的国际逻辑期刊《学习逻辑》（Studia logic）于2003年11月出版了博弈逻辑专刊，其中发表的系列论文概述了博弈逻辑的各种最新研究动态，标志着博弈逻辑作为一个新的研究领域在国际学术界得到了公认。

荷兰阿姆斯特丹大学约翰·范·本特姆（J.Van Benthem）教授认为，探索社会中多主体的互动时，描述其过程最好的模型就是博弈。他用逻辑体系去研究一般的博弈结构：比如，经济竞争、社会合作、下棋、足球、战争或对话等等，这些一般的博弈活动都涉及理性的参与者在博弈中如何合理地选取策略，或者说，用一种形式化的语言提供精致的结构来描述博弈中的策略均衡。因此，在逻辑与博弈关系上，可以从两个方向考虑：第一，逻辑中有一些概念本身就具有博弈的性质与结构，从这个意义上讲，它可以看成是逻辑所具有的博弈属性。比如，人们常见的论证就可以看成是一种博弈，由证实者和证伪者参加：证实者认为某个命题P是真的，而证伪者则要对此进行反驳。另外，像赋值、模型构造、模型比较等等也都可以看成是一种博弈；第二，逻辑的技术结果如何应用于对很多有趣的博弈现象的研究。比如，研究理性主体在博弈中如何合理地推理，等等。法国博弈逻辑学者波利认为：博弈逻辑至少能从如下几个方面来拓展博弈论的研究。首先，博弈逻辑把逻辑运用于关于计算机程序的推理，采用的建模方法不同于标准的博弈论的方法，博弈逻辑建构的博弈网模型能吸引博弈论专家的极大兴趣；其次，博弈逻辑为建构博弈模型提供了形式化工具有助于澄清模糊概念，能使给定博弈的推测转换成对象语言的公式，并给予证明。但是，不论是静态博弈还是动态博弈都是以有限而确定的代价来博取不确定状况物为目的。然而，一场博弈的输赢有没有规律可循呢？对任意的双方博弈，是否一方能拥有总赢的策略呢？这就涉及参与人的策略分析与推理运用。

二、信息思维、逻辑推理与纳什均衡

人们将思维分为推理和想象两类，每一类下面又各有不同的分支。因此，当博弈者信息量等于零时，思维就处于停滞状态，只有当信息量大于零时，思维活动才能开始，信息量越大，思维活动频率越高。也就是说，博弈参与人的知识因素和非知识因素是相互渗透，相互推进，相互补充，相互制约的，从而形成参与人的思维模式及各种各样的能力，如决策力、想象力、推理能力等。逻辑学作为研究推理为主的学科，它是对人们现实生活的各方面的推理进行分析、整理和概括所得。由于现实生活丰富多彩，推理也就多种多样。对这些多样性的推理总结就得到各种类型的逻辑，它们分别是从现实当中人们在某一领域中所用的推理提炼而成，它们是不同层次的推理，各有不同的特点，分别模拟不同的方面，各自适用不同的对象。因此，尽管推理分为形式推理系统和自然语言的语用推理，它们之间仍有着双方面的关系：一方面，形式推理接受自然语言推理的检验并充实改正自己的不足之处；另一方面，自然语言推理接受形式推理的检验，判定直觉的认识是否正确。

推理是由若干命题得出一个新命题的思维形式。从符号演算的角度看，推理指的是按照一定的计划进行的受控符号过程，该过程与目标以及根据程序规则利用规定的信息有关。英国哲学家霍布斯（Thomas Hobbes,1588—1679）对“推理”的认识是：人类的心灵之光就是清晰的语词，但首先要用严格的定义去检验，清除它的含混意义。推理就是步伐，学识的增长就是路，而人类的利益就是目标。人们常说抽象逻辑求知，具体逻辑求利。但具体逻辑也求知，只是不允许在漫无边际的知识海洋中盲目漫游。也就是说，“一个具体的日常推理，通常是在一定的条件和语境下表述的，大多和现实世界的实际情况有着直接或间接的关系”[2]。因此，在这种意义上讲，博弈逻辑是关于确定性的二人博弈的推理，它包含顺序合成、选择、角色互换等，也包括构建有内部结构的复杂博弈的博弈运算等等。博弈论专家预设了博弈参与人具有理性的决策能力。但更为基本的是，博弈论预设了人可以“自由地”选择策略，即人的意志是自由的。二人零和博弈决不可能是二人互相合作的博弈。因此，要使合作可能性产生，博弈必定至少有三个人以上参加。三人及三人以上的博弈亦可分为两种类型，其中一种是参加的人可互相合作而形成一种联盟，另一种是规定不准有联盟产生，前一种博弈是诺伊曼及摩根司特恩的研究范围，后一种博弈为数学家纳什（JohnF.Nash）所倡导，他将之命名为非合作博弈。纳什将参加博弈的人无论如何改变都不能改善其给付值的一组策略称为平衡点（equilibriumpoint），此博弈也可称之为混合策略。然而，在二人零和博弈中，对平衡点而言，未必成立，所有的解都会产生相同的值。

三、决策中的静态博弈与动态博弈

在博弈逻辑研究中，有着两种纲领：第一，结合模态逻辑系统，建立起新的博弈逻辑系统；第二，研究博弈活动中的实际“推理问题”。换句话说，博弈逻辑研究的是理性人在互动行为中的推理问题。因此，从推理推出的结论是必然，还是或然来划分的演绎推理与归纳推理，它们都运用于博弈的实际“推理问题”中。由此，人们依据信息分布划分中的完美信息、不完美信息与推理中的演绎推理、归纳推理相结合，将博弈推理划分为：不完美信息演绎推理、完美信息演绎推理；不完美信息归纳推理、完美信息归纳推理。如果根据博弈参与者的先后与信息分布状况的多少来划分，则博弈可划分为：静态博弈与动态博弈。

决策中的静态博弈是指参与人同时采取行动，或者尽管参与者行动的采取有先后顺序，但后行动的人不知道先采取行动的人采取的是什么样的行动。在静态博弈中，较典型的有“田忌赛马”的故事。战国时期，齐王和大将田忌赛马，双方约定从自己的上、中、下三个等级中，选出三匹马进行比赛，田忌的马要比齐王同一级的马差一些，而比齐王等级低一级的马要强一些。如果用同级的马对抗，田忌要连输三局。田忌采用谋士之策，用下马与齐王上马对抗（p），输一局（q）（p→q,p┣q）；用上马与齐王中马对抗(r)，赢一局(s)（r→s,r┣s）；用中马与齐王下马对抗(t)，再赢一局(s)（t→s,t┣s），这样反而赢(s)多输(q)少。田忌的谋士之策，除运用充分条件假言推理肯定前件式之外，总体上又运用的是假言联言推理：设A（下马对上马）、B（上马对中马）、C（中马对下马）、D（实现赢的策略）,其推理形式为，A→D, B→D, C→D；A∧B∧C┣ D。值得指出的是：人类实际推理都是动态的，不断引进新的前提，不断修正原有的结论，并且信息状况的分布变化，静态与动态也不是截然分开的，它们可以互相转化。博弈者的推理主要表现在博弈者对策略的选择上，博弈者的策略选取一方面是博弈的结构，另一方面是其他博弈参与人的策略。约翰·范·本特姆（J.Van Benthem）教授认为，一般情况下，博弈逻辑都是研究有限博弈中的推理，而无限博弈则研究人的持续互动行为。

决策中的动态博弈是指双方的行动可以有先后的顺序，并且后采取行动的人可以知道先采取行动的人所采取的行动。如果博弈方对博弈信息及博弈得益情况有完全的了解，那么就是所谓的完全且完美信息博弈。在动态博弈中，求解完美且完全信息动态博弈的解的方法是逆向归纳法。逆向归纳法作为求解动态博弈的方法是有效的，尽管用这样的方法求得的结果不是我们所期望的，但它是均衡结果，是完全理性的参与人的博弈结果。比如，研究社会合作可能出现情况下的重复囚徒困境模型等。主观主义者克里斯坦森构造过两个所谓的大弃赌定义，这两大弃赌定义虽然把概率论解释为置信度，又把置信度解释为公平赌局，但在这个所谓的互动博弈中，仍然运用的是一个演绎推理。大弃赌定义中的双人大弃赌是：假定我和我的妻子出门购卖东西。我对今天不下雨的置信度是百分之七十五。我的妻子比较保守，她对今天不下雨的置信度是百分之五十。我们俩一同来到赌场，庄家那里我以百分之七十五的公平赌熵，为今天不下雨打赌，因此，我出了3元而庄家出1元。我的妻子以百分之五十公平赌熵，为今天不下雨打赌，由此她和庄家各出2元。尽管这两个赌博分别对我和妻子来说是公平的，但庄家肯定能从这两个赌博中赢得1元钱，而无论是否今天下雨。因为，如果今天下雨，庄家赢我3元，输我妻子2元；如果今天不下雨，庄家输我1元，赢我妻子2元，由于我和妻子的财产是共有的，这就意味着，我们俩合起来打了一个 “大弃赌”。庄家对博弈的得益情况了如指掌。这里庄家实际上是一个二难推理简单构成式的运用。如果把天下雨或不下雨视为两种情况，设A为下雨，设B为不下雨，设C庄家赢。其推理形式为：A→C, B→C；A∨B┣ C。

博弈逻辑研究博弈中的实际“推理问题”，其中演绎推理分为“完全信息静态博弈中的演绎推理和完全信息动态博弈中的演绎推理”[3]。同样，互动博弈中的归纳推理，也分为完全信息博弈归纳推理和不完全信息博弈归纳推理。《三国演义》中诸葛亮用空城计对抗司马懿的静态博弈，就是不完全信息归纳推理。诸葛亮深知司马懿谨慎、多疑，在大开城门的情况下必不敢贸然进兵。诸葛亮运用的不完全归纳推理是：S₁是P，S₂是P，S₃是P，……，Sn是P（即一个个司马懿谨慎、多疑的具体事例），S₁，S₂，S₃……，Sn是S类的部分对象，并且没有遇到相反的情况，所以，一切S都是P（即只要是司马懿领兵，必然谨慎、多疑、不敢贸然进兵）。反过来，司马懿亦知“诸葛一生唯谨慎”，必不敢无伏兵而大开城门，诸葛亮偶尔弄险一次，获得成功（或者说司马懿遇到了一个反例）。因此，诸葛亮和司马懿双方的心理分析，彼此的博弈对决，实际都运用了不完全归纳推理。值得指出的是，不完全归纳推理的运用，其结论是“或然的”。

四、博弈对局、一般推理与博弈推理

在博弈对局中，常有两种情况，一是有些知识博弈双方都知道，但不知道对方是否知道，当然也不知道对方是否知道自己知道不知道；二是有些知识，只有博弈的一方知道，而另一方不知道，即知识是非对称性的。在这种情况下，就不能使用演绎推理而要使用归纳推理。在进行归纳推理时，每个理性人都保留自己许多的信息模型，当他需要进行选择时，他选择当前最可信的那种行为方案，其他的仍然保留，他也可能结合几种策略行为方案，在这种意义上，演绎推理的结论包含在前提里。比如，在棋类中，象棋博弈是一种完全信息的动态博弈，即双方的行动可以有先后的顺序，并且后采取行动的人可以知道先采取行动的人所采取的行动。而且，象棋博弈的博弈阶段和路径数量不是无穷的，但由于象棋博弈的路径很大，分支选择很多，即使用最先进的电子计算机也无法在短时间内找出每步的最优决策。因此，象棋比赛中不可能有人一开始就用逆推归纳下棋。然而实践却表明，下棋人往往在象棋博弈的局部阶段，即在有限步数，有限选择的范围内局部地使用逆推归纳法。因此，下棋人有“下一步，看三步”的说法。当然，“动态博弈过程，如同静态博弈，也是一个推理过程”[4]。但逆推归纳法主要适用于完全且完美信息的动态博弈。逆推归纳法只能分析明确设定的博弈问题，它要求各个博弈方了解博弈结构，且相互知道对方了解博弈结构。换句话说，动态博弈中的推理主要运用的是溯因推理。溯因推理是根据已观察现象去猜测其内在机理的思维形式，在逻辑结构上包括两个要素：第一是观察现象陈述；第二是导致观察现象的可能原因，即作为猜测性的假说。如果用E表示观察现象的陈述，用H表示猜测性的假设，那么溯因推理可以用公式表示为：E,H→E∥∴H。这里“∥”表示前提与结论之间的逻辑联系只是或然的。如果我们对博弈当事人之间长期互动的性质进行考察，就可以发现博弈的不同阶段是相互依赖的，其结果是理性博弈当事人的决策，不仅受到其过去经历的影响，而且还要受未来潜在可能性的影响。现实生活的许多行为模式，比如奖励、惩罚、传送与泄漏信息等等，都可以看成是多阶段的动态博弈。而在动态博弈中，最重要的是重复博弈，也就是同样结构的博弈重复多次，如一个行业被多家寡头所垄断，那么他们之间的竞争，就是一个重复性的动态博弈。其中的每次博弈又称为“阶段博弈”。而且，在动态博弈中的重复博弈，既可以是完全信息的重复博弈,也可以是不完全信息的重复博弈。

“你输即我赢”的博弈是双主体的零和博弈的特征，比如，商战中的期货交易等等。这种情形同样适用于国际象棋，但要稍加修改：对于国际象棋的博弈双方，或者一方拥有总赢策略，或者一方有不输的策略。这种博弈是一种完美信息博弈，因为玩家在任何时候都知道自己在博弈中所处的位置。不过，完美信息的博弈只是博弈中的一种，大量存在的是不完美信息博弈，因为很多时候一方并不知道另一方的信息，但博弈却仍将继续。比如，在军事斗争中，我国古代军事家孙武提出的“践墨随敌，以决战事”（《孙子兵法·九地篇》）,就是强调实施计划要随着敌情的变化而不断地加以改变，以求战争胜利。在孙武看来“能因敌变化而取胜者，谓之神”(《孙子兵法·虚实篇》)，这恰如不完全信息动态博弈的特征，当一方对另一方的行动作出应对时，博弈的一方可以从对手的行动中推断出有关的信息，“两将相持，必有所测” (《兵经百篇·测》)，这里的“测”就是“推理”。博弈中理性参与人如何使自己的“得益”最大，关键仍然是如何运用“推理”。即博弈逻辑研究纲领的第二种，研究博弈活动中的实际“推理问题”的推理。在这种逻辑研究纲领之下，博弈逻辑中博弈人运用的逻辑推理，与一般逻辑运用中的逻辑推理基本一样，不同之处在于：一般逻辑运用中的逻辑推理是人们在进行推理时，所运用的前提假设是静止的，不变的；而在博弈逻辑中，博弈人运用的逻辑推理，其前提假设是，既有静止的，也有动态的。

法国逻辑学者波利曾运用博弈论和社会选择理论，建立起博弈逻辑的一般语义模型。虽然波利的博弈逻辑研究尚需深入，但他涉及广泛，不仅有完美信息条件下对双主体零和博弈的推理问题与多主体非零和博弈中的推理问题的研究，而且对不完美信息条件的非零和博弈以及非合作博弈等问题也进行了探讨。如果从认知推理“模型”、建立新的博弈逻辑系统的角度, 即博弈逻辑研究纲领的第一种来看, 那么逻辑又在自然性、清晰性、通用性三大特征支持之下，为建构智能新系统提供良好的知识库基础。正如约翰·范·本特姆教授所说：我常常从两个角度考察问题，像格式塔转换一样。可以说，随着逻辑分析手段的提高，任何可以被表达的对象都可以用一阶逻辑表达。然而，最有趣味的是那些含有量词的公式，其思想是：逻辑中的联结词正好对应于博弈中玩家的各种行为。如果一个逻辑公式是析取式，那么它对应于博弈中证实者的选择行为，他可以选择其中的一个析取支，博弈继续进行；同理合取式则对应于证伪者的选择行为；否定式则对应于博弈双方的角色互换；存在量词对应于证实者从论域中挑选一个对象，全称量词则对应于证伪者的挑选行为，如此等等。

五、逻辑推理的预测功能与博弈的广泛运用

“推理”是一种形式化的符号表达式,同系统的物理状态相对应的某些要素的离散态的排列,而且，所有与系统有关的语义内容都依靠深层的符号表达式及其变换形式和符号关系结构来规定，它是一种计算。因此，在所有的博弈对局中，人们的心智与计算，都是参与人的策略分析与推理运用。除此，逻辑推理的预测功能也表现在为现代人的超前意识服务，使人们能够根据事物发展变化的规律，从现实中引申未来的思维图景，或者说，参与人博弈的“得益”状况。法国逻辑学者波利，在谈到推理论证的功能时认为：一个数学上的证明是证明推理，借助它们来肯定我们的数学知识，而物理学家的归纳论证，历史学家的史料论证和经济学家的统计论证，都属于合情推理之列。可以说，关于现象在博弈中某一状态的描述，这只是对博弈的一种“内在的”(internal)研究；与此同时，人们还可以从“外在的”(external)角度来研究博弈。如，对无穷博弈、博弈之间的等价性、序列的博弈构造运算等问题的研究等等，这些不仅能够表达整个博弈，而且还可以表达博弈与博弈之间的关系，以及博弈的其他属性。另外，关于博弈中均衡、理性等概念的逻辑探讨，对于博弈理论本身的发展也有很大启发。博弈理论无论在数学原理或实际应用上都仍在发展中，可以期待，随着博弈在社会、经济等领域的广泛运用，对博弈逻辑的研究也会更加深入。

参考文献

[1] 张峰.逻辑学的新分支——博弈逻辑研究现状分析[J].哲学动态，2005，（2）.

[2] 吴新民.自然语言逻辑预设问题探究[J].北方论丛，2005，（1）.

[3] 贺寿南.博弈视野中的逻辑推理问题[J].科学技术与辩证法,2003,(3).

[4] 潘天群.博弈行为中的演绎与归纳推理及其问题[J].自然辩证法研究,2003,(3).

[责任编辑付洪泉]

推荐访问: 逻辑推理 博弈静态动态