• <sup id="aaaa0"><delect id="aaaa0"></delect></sup>
    <sup id="aaaa0"><code id="aaaa0"></code></sup>
  • <nav id="aaaa0"><code id="aaaa0"></code></nav>
    <code id="aaaa0"><object id="aaaa0"></object></code>
  • <sup id="aaaa0"></sup>
  • <small id="aaaa0"></small>
    <tfoot id="aaaa0"><dd id="aaaa0"></dd></tfoot>
    
    <sup id="aaaa0"></sup>
  • 操美女的视频在线观看_91在线精品国自产拍蜜月_舔av片在线_欧美老熟妇乱子伦牲交_看免费av毛片_晚上一个人看的免费电影_欧美高清成人免费视频www_哪个播放器可以免费观看大片
    sitemap

    什么是博弈論和納什均衡?

    更新時(shí)間:2023-03-04 17:42:00       發(fā)布時(shí)間:2023-03-04        作者:MVP學(xué)習(xí)網(wǎng)       熱度: 0       
    [摘要]


    納什均衡(Nash Equilibrium):在非合作類博弈中,存在一種策略組合,使得每個(gè)參與人的策略是對其他參與人策略的最優(yōu)反應(yīng)。如果參與者當(dāng)前選擇的策略形成了“納什均衡”,那么對于任何一位參與者來說,單方更改自己的策略不會帶來任何好處。

    上面那段話值得仿佛閱讀體會,在看完例子后可以再多讀幾遍上面這段話。

    什么是博弈論和納什均衡?-19206

    具體例子如下:囚徒困境、智豬博弈、范式博弈、餓獅博弈、硬幣正反博弈。

    什么是博弈論和納什均衡?-19272

    囚犯的困境

    假設(shè)有兩個(gè)小偷A(chǔ)和B聯(lián)手闖入民宅盜竊被抓,警方將兩人置于不同的房間進(jìn)行審訊,并給出如下政策:如果一個(gè)犯罪嫌疑人坦白并交出了贓物,兩人都會被判有罪。如果另一個(gè)犯罪嫌疑人也坦白,則兩人各被判刑8年;如果另一個(gè)犯罪嫌人抵賴,再加刑2年,而坦白者有功,會被立即釋放。如果兩人都抵賴,偷竊罪證據(jù)不足,但會因私入民宅而各判入獄1年。即:

    什么是博弈論和納什均衡?

    表中的數(shù)字表示A,B各自的判刑結(jié)果。博弈論分析中一般都用這樣的表來表示。

    什么是博弈論和納什均衡?-19288

    此時(shí)有人會覺得雙方都抵賴就好了,但問題是雙方被隔離,都會懷疑對方會出賣自己以求自保。

    兩個(gè)人都會怎么想?

    假如對方坦白,此時(shí)如果我抵賴得坐10年監(jiān)獄,如果我坦白才坐8年監(jiān)獄;假如對方抵賴,此時(shí)如果我也抵賴會被判1年,如果我坦白可以被釋放。綜合以上考慮,不管對方坦白與否,對我而言都是坦白比較劃算。此時(shí)最后的“納什均衡”只能是兩個(gè)人都坦白,共同被判8年刑期。

    智豬博弈

    豬圈里有兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有個(gè)踏板,每踩一下踏板,在遠(yuǎn)離踏板的豬圈的另一邊的投食口就會落下少量的食物。如果一只豬去踩踏板,另一只豬就有機(jī)會搶先吃到另一邊落下的食物。但當(dāng)小豬踩踏板時(shí),大豬會在小豬跑到食槽之前剛好吃光所有的食物;大豬踩動(dòng)了踏板,則有機(jī)會在小豬吃完落下的食物之前跑到食槽,爭取吃到另一半食物。

    那么,兩只豬各會采取什么策略?

    當(dāng)然是小豬等在食槽邊,而大豬不知疲倦地奔忙于踏板和食槽之間。因?yàn)椋∝i踩踏板將一無所獲,不踩踏板反而能吃上食物。對小豬而言,無論大豬是否踩動(dòng)踏板,不踩踏板總是好的選擇。反觀大豬,已明知小豬不會去踩動(dòng)踏板,自己親自去踩踏板還有點(diǎn)吃的,總比不踩強(qiáng),所以只好去踩踏板。

    范式博弈

    GOO公司和SAM公司存在利益關(guān)系,二者的收益會隨著博弈的變化而不斷更替。如下圖:

    什么是博弈論和納什均衡?

    雙方各有兩個(gè)可選策略“合作”與“背叛”,格中的四組數(shù)據(jù)表示四個(gè)博弈結(jié)局的各自收益,。每組數(shù)據(jù)的第一個(gè)數(shù)字表示GOO公司的收益,后一個(gè)數(shù)字表示SAM公司的收益。

    現(xiàn)在我們站在GOO公司的角度來思考整個(gè)博弈策略。假如SAM選擇合作,那么我方合作的收益是3,而我方背叛的收益是5,我方應(yīng)該選擇背叛;假如SAM選擇背叛,那么我方合作的收益是 -3,而我方背叛的收益是-1,我方還是應(yīng)該選擇背叛。

    同理,SAM公司也會做出相同的選擇。最后我們發(fā)現(xiàn),本次博弈的雙方都采取了背叛策略,各自的收益都為-1,這是一個(gè)比較糟糕的結(jié)局,盡管對任何一方來說都不是最糟糕的那種。

    但博弈的次數(shù)往往不止一次,當(dāng)二家公司經(jīng)歷了多次背叛策略的博弈之后,發(fā)現(xiàn)公式上還有一個(gè)(3,3)收益的雙贏局面,這個(gè)結(jié)果顯然要好很多,因此二家公司在之后的博弈過程中必然會嘗試互建信任,從而驅(qū)使雙方都選擇合作策略。

    但假使雙方都知道博弈次數(shù)是有限的,也許下一次博弈就是最后一次,那么為了避免對方在最后一輪博弈中選擇背叛而使我方遭受-3的損失,于是雙方都會采取了背叛策略,最后的博弈結(jié)果又回到了(-1,-1)。

    由此可見,隨著次數(shù)的變化,博弈的性質(zhì)也會發(fā)生變化,納什均衡點(diǎn)會發(fā)生變化。

    餓獅博弈

    假設(shè)有A、B、C、D、E、F六只獅子(強(qiáng)弱從左到右依次排序)和一只綿羊。假設(shè)A吃掉綿羊后就會打盹,這時(shí)比A稍弱的B就會趁機(jī)吃掉A,接著B也會打盹,然后比B稍弱的C就會吃掉B,以此類推。問:獅子A敢不敢吃綿羊?

    該題須采用逆向分析法,從最弱的F開始分析,依次前推。假設(shè)E睡著了,F(xiàn)肯定會吃掉E,因?yàn)樵贔的后面已沒有其它獅子了,不用擔(dān)心自己被吃掉。繼續(xù)前推,既然E知道自己睡著會被F吃掉,那么E必然不敢吃睡著了的D。既然E不敢吃掉D,那么D則可以放心去吃睡著的C。依次前推,得出C不吃,B吃,A不吃。所以答案是獅子A不敢吃掉綿羊。

    什么是博弈論和納什均衡?

    但是,如果我們在獅子F的后面增加了一只獅子G,總數(shù)變成7只,用逆向分析法按照上題步驟再推一次,如下圖。這次的答案變成了獅子A敢吃掉綿羊。

    什么是博弈論和納什均衡?

    對比兩次博弈我們發(fā)現(xiàn),獅子A敢不敢吃綿羊取決于獅子總數(shù)的奇偶性:當(dāng)總數(shù)為奇數(shù)時(shí),A敢吃;總數(shù)為偶數(shù)時(shí),A則不敢吃。因此,總數(shù)為奇數(shù)和總數(shù)為偶數(shù)的獅群博弈結(jié)果形成了兩個(gè)穩(wěn)定的納什均衡點(diǎn)。

    硬幣正反博弈

    假如你和一個(gè)美女一起玩?zhèn)€數(shù)學(xué)游戲。美女提議:讓我們各自亮出硬幣的一面,如果我們都是正面,那么我給你3元;如果我們都是反面,我給你1元;剩下的情況你給我2元。那么你該不該和這位美女玩這個(gè)游戲呢?

    這里需要講一下納什均衡的分類:

    (1)純戰(zhàn)略納什均衡,也就是說玩家都能夠采取固定的策略(比如一直出正面或者一直出反面),使得每人都賺得最多或虧得最少。

    (2)混合戰(zhàn)略納什均衡,是對每個(gè)純戰(zhàn)略分配一個(gè)機(jī)率而形成的戰(zhàn)略?;旌蠎?zhàn)略允許玩家隨機(jī)選擇一個(gè)純戰(zhàn)略?;旌蠎?zhàn)略納什均衡中要用概率計(jì)算,達(dá)到某一概率時(shí),可以實(shí)現(xiàn)支付最優(yōu)。因?yàn)楦怕适沁B續(xù)的,所以即使戰(zhàn)略集合是有限的,也會有無限多個(gè)混合戰(zhàn)略。

    在這個(gè)游戲中,應(yīng)該采用混合策略納什均衡。

    假設(shè)我們出正面的概率是x,出反面的概率是1-x,美女出正面的概率是y,出反面的概率是1-y。為了使利益最大化,應(yīng)該在對手出正面或反面的時(shí)候我們的收益都相等,即:

    3x + (-2)(1-x) = (-2) * x + 1*(1-x )

    解方程得x=3/8;

    同樣,美女的收益:-3y + 2(1-y) = 2y+ (-1) * (1-y),

    解方程同樣得y等于3/8。

    于是,我們就可以算美女每次的期望收益是:(1-y) * (2x-(1-x)) + y(-3x+2(1-x)) = 1/8元,即雙方都采取最優(yōu)策略的情況下,美女平均每次贏1/8元。

    所以當(dāng)然不能和她玩這個(gè)游戲。其實(shí)只要美女采取了(3/8, 5/8)這個(gè)方案,不論你采用什么方案,都是不能改變局面的。

    但是當(dāng)你也采用最佳策略時(shí),至少可以保證自己輸?shù)米钌?。否則,你會賠掉更多。

    免費(fèi)留學(xué)咨詢1V1指導(dǎo)(點(diǎn)擊咨詢

    微信溝通 一鍵撥打 聯(lián)系客服
    墨江| 镇远县| 大同市| 肇源县| 改则县| 永定县| 朔州市| 芒康县| 陈巴尔虎旗| 保定市| 湖北省| 宁阳县| 鲁山县| 和田县| 改则县| 宝应县| 百色市| 古田县| 宜良县| 新疆| 南昌县| 陇川县| 涟源市| 叶城县| 保靖县| 嘉定区| 毕节市| 乌拉特前旗| 上犹县| 大悟县| 肇庆市| 萨嘎县| 随州市| 公主岭市| 宣汉县| 镇安县| 正安县| 炎陵县| 岐山县| 贵溪市| 苏尼特右旗|