混合策略纳什均衡得益怎么算_混合策略纳什均衡表达式_混合策略纳什均衡

赛局理论也被称为博弈论,它号称是现代的孙子兵法。

你看到赛局两字,就知道它是具有竞争或对抗性质的博弈行为。

在博弈行为中,参加斗争的各方都具有不同的目标或利益。

为了达到各自的目标,必须考虑对手的行动方案,并力图选取对自己最为有利的方案。

看到这里,你可能会以为博弈论是要精通“尔虞我诈”,但是恰恰相反,博弈论是一种“多人决策”模型,目的是要找到双方都同意的最优解。

你可以简单的想象成,把你自己抽离出来,以第三方的角度来思考,除了你自己的利益外,要有同理心地站在对手的角度去思考,这样才会拥有一个【全局】的观点。

混合策略纳什均衡表达式_混合策略纳什均衡_混合策略纳什均衡得益怎么算

纳什均衡

这边举个简单的例子:

你有一天和朋友去旅行,不小心船沉了,你们都漂流到一座无人岛上。

来到荒岛上没东西吃了,怎么办呢?

你们就商量着各自出发去找食物,找到的食物到时候平分。

一开始都好好的,双方都找到了很多的食物,也分享得很愉快。

但不知道从什么时候开始,因为懒惰,你开始动起小脑筋来了:下午来找个草丛睡个午觉好了,反正食物是平分,顶多吃少点就好了。

这种偷懒行为,一次两次还好,次数多了混合策略纳什均衡,你的小伙伴也跟着偷懒。

每当你睡个午觉回来,看到他也没带食物回来,你就会想:好啊,这个坏东西,我就知道…..好险我也没去找食物,结果两人都开始饿肚子,陷入恶性循环。

来拆分这例子,有四种结果:

1.你去抓鱼10条,他也去抓10条鱼。你们每人都可以获得10条鱼。

2.你去抓鱼10条,他偷懒。你亏了5条鱼,他赚到了5条鱼。

3.你偷懒,他抓到了10条鱼。你赚到5条鱼,他亏了5条鱼。

4.你偷懒他也偷懒。双方都没赚没亏。

以行为来分析的话,显然大家都各自去找食物,共同投入是最优策略。

但为什么双方最后都选择”损人不利己”呢?

因为在这个制度设计下,损人不利己,才是最优策略。

要解释这个问题,就要说到美国数学家约翰纳什,所提出的【纳什均衡】了。

在刚刚的案例中,你不会在意什么团队利益,你只会觉得,如果我努力去找食物,然后看到他在偷懒,我食物还要跟他平分,会有点吃亏的感觉。

博弈到最后,他不去找食物,他也不去找食物,双方都待在原地挨饿。

这时就形成了一个纳什平衡,虽然是个坏的平衡。

纳什平衡,简单来说就是一种博弈的稳定结果,谁单方面改变策略,谁就吃亏。

双方的策略分别拆开来看,如果他辛苦工作。

而你也选择辛苦工作,你会得到10鱼,但是你自己捕鱼也有10条,平分也有10条,你并没有额外获得什么,相对值来讲是+0。

你选择偷懒,你会得到5条鱼,但是很爽呵,不工作就有东西吃,相对值来讲是+5。

所以他如果辛苦工作,以相对值你的利益来讲,你选择偷懒是最优解。

但如果他选择偷懒呢?

你选择辛苦工作的话,你原本自己可以吃10条的,要分给他一半,你亏了5条鱼,相对值是-5。

你也选择偷懒的话,大家都没东西吃,没赚没赔,相对值是0。

他偷懒,以相对值的利益来说,你也偷懒是最优解。

所以看到这里你会发现,不管他有在工作还是偷懒,你选择偷懒都是最优解。

以他的立场来看你也是一样,不管你有在工作还是偷懒,他选择偷懒也是最优解。

这似乎陷入了死循环是吧,总不能大家都不工作最后一起饿死吧,有什么解法呢?

混合策略纳什均衡_混合策略纳什均衡表达式_混合策略纳什均衡得益怎么算

这时候就是要破坏原有规则,改变游戏制度,这题的关键是一开始制定规则时的【获取的收益要平分】。

你可以拟定一个新条约,未投入工作者,无法获得收益,那这样不管是他或是你,偷懒就无法获得任何好处了,这样共同投入就是最优解,一个新的”纳什平衡”,一个好的均衡。

在社会上也有很多纳什均衡的案例,比如各种的削价竞争,明明都不降价的话混合策略纳什均衡,收益最大,但如果一家偷偷降价,就会抢占巨大利益,所以降价是商人的最优策略,导致利润微薄的坏的平衡。

或是小学生上补习班,有些甚至幼儿园就开始上了,已经有很多研究显示小孩就给他玩就好了,上那么多并无益处,反而有损创造力。

但是没办法,看到隔壁同学小孩考100分,我家儿子只考60分,心里这口气咽不下呀。

这样也陷入了恶性循环,小学下课后就开始补习一堆长大根本用不到的知识,眼睛度数也越来越深,最后有谁得利了吗?

结论:

纳什均衡就是一种博弈的稳定结果,谁单方面改变策略,谁就会损失。

当坏的纳什平衡出现时,最好的方法是创造新的规则,打破原有的制度,来形成新的纳什平衡。

———END———
限 时 特 惠: 本站每日持续更新海量各大内部创业教程,一年会员只需98元,全站资源免费下载 点击查看详情
站 长 微 信: Lgxmw666