囚徒困境
博弈论与纳什均衡
📚 概念介绍
🔒 经典博弈论问题
两个嫌疑犯被分开审讯,每人都可以选择"合作"(保持沉默)或"背叛"(揭发对方)。 他们无法沟通,必须独立做出决定。
📊 收益矩阵
| 对方合作 | 对方背叛 | |
|---|---|---|
| 我方合作 | 3, 3 | 0, 5 |
| 我方背叛 | 5, 0 | 1, 1 |
🤔 困境所在
无论对方怎么选,"背叛"对个人来说总是更好的选择(纳什均衡)。 但如果双方都这样想,结果是(1,1)——比双方合作的(3,3)差得多! 这就是个人理性导致集体非理性的经典案例。
🔄 迭代囚徒困境
当游戏重复进行时,情况变得有趣。"以牙还牙"策略(第一回合合作,之后模仿对方) 在锦标赛中表现出色,证明了合作可以在重复博弈中演化出来。
🎮 与AI对战
你的得分
0
回合
0/10
对手得分
0
🏆 策略锦标赛
让所有策略两两对战,看看哪种策略在长期博弈中表现最好。