我们试着从博弈论的视角来探讨这个问题。因为博弈论是一门研究理性行为者在相互影响中如何做决策的科学,而1989年正是一个由多个行为体——体制内部、学生群体、知识分子、国际舆论——共同构成的高度复杂的博弈过程。理解这些角色之间的策略互动,或许可以帮助我们更冷静地总结经验与教训。
一、体制内部的非对称博弈:强权下的两种“自我对弈”
1989年的权力结构表面上似乎存在三股力量:李鹏所代表的保守派、赵紫阳所代表的改革派,以及居于“最高决策者”地位的邓小平。但若从实质权力结构来看,体制内部实际上只有一位真正的博弈主导者——邓小平。其他人,不过是他不同意志倾向的体现。
李鹏的强硬主张与赵紫阳的宽容劝谕,并非两股平行的力量博弈,而更像是邓小平内在两种判断之间的矛盾投射。毛泽东对邓的评价“绵里藏针”可谓一语中的:一方面,他支持改革、讲效率;另一方面,他深信“稳定压倒一切”,始终保留以武力压制混乱的底色。在毛泽东的另一句评语中,邓小平是“开钢铁公司的”——意指其意志之刚,手段之硬。
博弈论中,若一位参与者同时控制多个“玩家”,这构成不对称博弈中的“操纵式结构”(manipulated structure),其结果是看似多元分歧的判断,最终被统一为一个中心权力的输出。这也解释了为何赵紫阳尽管身为总书记,却毫无实权;为何李鹏可以在关键会议中持续发难——因为在那套权力配置下,他们的影响力并不取决于自身身份,而取决于他们所代表的那一面是否正被邓小平所采纳。
赵紫阳真正的失败,不是因为观点站不住脚,而是因为他在结构上无法影响邓的决断路径。他一度试图以情动人、以理服人,但邓小平早已将事态视为“动乱”,并将稳定定义为压倒一切的“零容忍红线”。赵的理性、对话策略,自此便失去了博弈的现实基础。结果是,一位体制内的温和改革者,被孤立、边缘化,直至彻底出局。
这类结构性不对称,恰如托马斯·谢林(Thomas Schelling)在《冲突的策略》中所描述的“伪多方博弈”:“当一个意志中心控制多数角色时,其它玩家不过是扩音器。”政治表象下的多元辩论,不过是单一决策者自我反复权衡的痕迹。
二、绝食行动与道义压力:民间博弈策略的误区
学生运动在5月中旬进入高潮,最具象征意义的转折点是绝食行动。博弈论称这种行为为“代价性承诺”(costly commitment):以自我伤害来表达行动意志,提升自身话语的可信度。这种策略常用于“信号博弈”中,比如古代的焚船明志、现代的工人罢工、社会运动中的绝食。
绝食确实起到了激发全国舆论、争取民众同情的作用,也在一定程度上促使高层改革派发声。但是,它也把协商推入了更狭窄的空间。因为:绝食意味着“不达目的不撤离”,学生逐渐陷入“骑虎难下”的境地;赵紫阳的中间调停空间被压缩,他既不能让学生撤退,也无法向高层保证事态可控;高层保守派则据此认定“这是动乱升级的信号”,为戒严和后续镇压寻找借口。
道义升级反而加速了博弈的激烈化。学生以牺牲为代价发出信号,却因制度缺乏“接收信号”的机制,最终变成了“误读”与“误判”。一个以道德为主导的策略,若缺乏制度性缓冲,很容易将原本可能妥协的局势逼上不归路。
在博弈论中,绝食属于“代价性信号”(costly signal)的一种。根据迈克尔·斯宾塞(Michael Spence)的信号博弈理论,一个理性行动者通过承担高代价的行为来证明其诉求的真实性。学生绝食,正是试图通过“自我牺牲”向当局和公众发出“我并非投机,我是认真的”这一信号。但问题在于:信号的“接收者”也必须理性且有回应机制。若缺乏制度性反馈路径,则再强烈的信号也可能被误读或被忽略,甚至反而促使接收方进入“防御状态”。正如诺贝尔经济学奖得主罗杰·迈尔森(Roger Myerson)所指出的:
“如果机制设计无法处理非对称信息,玩家就可能选择封闭式策略以防最坏局面。”(Myerson,“Game Theory:Analysis of Conflict”,1991)绝食在缺乏反馈机制的语境下,实际上形成了一种战略不对称:学生不能后退,因为那将视为妥协甚至失败;政府若退让,则意味着道义上的“投降”。从此刻起,协商空间迅速压缩,走向不可逆的对抗。
三、517宣言:将权威推入对抗的死角
赵紫阳在欢迎戈尔巴乔夫的公开场合首次向外界明确披露“邓小平是中国最高决策者”,这不仅削弱了赵自身的合法性,也把邓小平逼到前台。紧接着知识分子的517公开信更是直接把矛头指向他,这构成了双重逼宫。这在博弈论中相当于触发了一种“激化型信号”:原本可以模糊处理的权力归属问题,被公之于众,使得邓的退路大大收窄。他不再是可以两边调停的“仲裁者”,而成了博弈场上的“公开玩家”——而一旦成为明面上的玩家,他就必须赢,哪怕以最极端的方式。
可以用谢林的“承诺困境(commitment trap)”理论来解释这一点:一旦一个参与者在公开场合做出不可逆的身份确认,他就无法再进行灵活周旋,任何退让都被视为失败。(邓当时就诘问:退?退到哪一步?)这就是赵紫阳发言造成的后果——他意图争取民意支持,却客观上切断了体制内最后一点转圜空间。我当时用“挥刀自宫”来形容赵的这一举动。我认为这是他在博弈结构中的致命误判。5月17日,部分知识分子联名发布公开信,要求“邓小平下台,结束垂帘听政”,推动政治体制改革。在博弈论的术语中,这种公开挑战相当于将非零和博弈强行转化为零和对抗。
原本高层尚可保持模糊与灵活身份,但公开点名意味着权威被直接挑战,使得“让步”从策略选择变成“失控”象征。此举带来的后果,是邓小平彻底放弃中间协调角色,转向强硬立场。而赵紫阳在党内正式被边缘化,6月3日晚上至6月4日凌晨,武力镇压在北京展开。这是一次信息极化后的结构性崩溃。在没有宪政与程序缓冲的结构中,任何试图直接冲撞权力顶端的信号,都容易引发失控反应。历史上许多相似例子都说明:不给对手留体面退路,是最容易引发彻底对抗的策略失误。
从社会运动角度看是“诉诸正义”;但从博弈论看,这是一次典型的“极限策略”(brinkmanship)。高层集体面临“若不强硬即崩盘”的共同体幻觉(collective action illusion);于是,公开挑战反而将原本尚有退路的对手逼入死角。谢林也警告过:“在无缓冲机制的社会中,过度清晰的威胁往往导致无法控场的灾难。”(Schelling,1960)
四、博弈失败的结构教训
今天回望,不是为了对当事人简单指责,而是为了理解:1989年的失败,不是因为一方理性、一方愚蠢,而是因为各方在没有制度保障的环境中,都被结构推向了非理性。体制内缺乏合法博弈机制;民间缺乏组织与协调能力;双方都缺乏“台阶”的设计意识;信任基础几乎不存在;最终,演变成一次典型的“囚徒困境”:本可双赢,最终却是两败俱伤。
1989年可以被视作一次“重复博弈失败”的案例。在罗伯特·阿克塞尔罗德(Robert Axelrod)提出的“囚徒困境长期博弈”理论中,理性玩家往往通过“宽容但坚定”(tit for tat)策略达成长期合作。然而,该策略的前提是:各方能观察对方的行为;有回合之间的长期互动;存在惩罚失信者的制度。现实中,政府与民间运动之间缺乏有效的信息共享机制,彼此也未建立起任何形式的“长期信用”。于是,“互信型博弈”很快沦为“单次极化博弈”,演变为最坏的纳什均衡:武力镇压+舆论破裂,是所有参与者都不希望发生却不得不接受的最差结果之一。
正如阿克塞尔罗德所言:“若缺乏合作文化与容错机制,最优策略最终将失败于结构的刚性。”(Axelrod,“The Evolution of Cooperation”,1984)
五、未来博弈中妥协的智慧:如何避免再次走入死角?
如果说纪念是为了未来,我们就必须认真思考:在未来的社会博弈中,如何更理性地行动,避免再度走入1989年那样的死角?我认为,有四条基本原则值得我们记住:永远不要把对手逼到死角。要适时妥协,给对手留余地,就是给自己留余地。体面退场的机制,是任何可持续博弈的基本保障。建立可信的“中介机制”。在制度完善之前,需要半官方、非对抗性的沟通渠道和民间平台,避免局势迅速升级为零和对抗。保持模糊空间。信息极化往往促成激进行动,而激进行动则加剧误判。社会转型期的对话,需要足够的“含混”与“缓冲”。
着眼长远,避免一局定胜负。社会的改革不是短跑,而是马拉松。避免“赢一次就算赢到底”的错觉,保持合作关系远比阶段性胜利更重要。从1989年天安门事件的博弈论分析中,我们得到的最深刻教训之一是:政治博弈不是决一死战,而是寻找共赢与可持续路径的艺术。
任何一方如果只盯着“胜负”,而忽视对手的承受极限与退让空间,最终往往会把局势推向“零和博弈”,错失和平解决的窗口。尤其在面对体制性强权时,理想主义若没有策略、情绪表达若不顾结构逻辑,最终会让所有人付出代价。博弈论告诉我们:最优解往往不是最大化自身利益,而是最大化“共同生存的可能”。
这正是“妥协”之所以重要——它不是软弱,而是智慧;不是放弃原则,而是避免局势滑入不可逆的灾难。1989年缺失的,正是这种妥协的智慧。
结语:纪念,不只是为了记住,更是为了走得更远
我们纪念“六四”,不是为了怨恨,而是为了更清晰地认识世界运行的逻辑,更有智慧地面对未来的博弈。如果我们能从历史中学会不把彼此逼入死角,如果我们能在冲突中学会克制、设台阶、建机制,那三十六年前那些人的牺牲,就不仅是痛苦的终点,也会成为更理性社会的起点。愿这份纪念,不只是回望,更是一种前行。