跳到主要内容

囚徒困境

博弈论与纳什均衡

📚 概念介绍

🔒 经典博弈论问题

两个嫌疑犯被分开审讯,每人都可以选择"合作"(保持沉默)或"背叛"(揭发对方)。 他们无法沟通,必须独立做出决定。

📊 收益矩阵

对方合作对方背叛
我方合作3, 30, 5
我方背叛5, 01, 1
🤔 困境所在

无论对方怎么选,"背叛"对个人来说总是更好的选择(纳什均衡)。 但如果双方都这样想,结果是(1,1)——比双方合作的(3,3)差得多! 这就是个人理性导致集体非理性的经典案例。

🔄 迭代囚徒困境

当游戏重复进行时,情况变得有趣。"以牙还牙"策略(第一回合合作,之后模仿对方) 在锦标赛中表现出色,证明了合作可以在重复博弈中演化出来。

🎮 与AI对战

你的得分
0
回合
0/10
对手得分
0

🏆 策略锦标赛

让所有策略两两对战,看看哪种策略在长期博弈中表现最好。