1930. aastatel said John von Neumannist ja Oscar Morgensternist uue ja huvitava matemaatikaharu, mida nimetatakse mänguteooriaks, rajajad. 1950. aastatel hakkas noor matemaatik John Nash selle suuna vastu huvi tundma. Tasakaaluteooria sai tema väitekirja teemaks, mille ta kirjutas 21-aastaselt. Nii sündis uus mängustrateegia nimega "Nash Equilibrium", mis võitis Nobeli preemia palju aastaid hiljem – 1994. aastal.
Pikk vahe lõputöö kirjutamise ja üldise tunnustamise vahel on muutunud matemaatiku jaoks proovikiviks. Tunnustuseta geenius põhjustas tõsiseid vaimseid häireid, kuid John Nash suutis selle probleemi lahendada tänu oma suurepärasele loogilisele meelele. Tema Nash Equilibrium teooria võitis Nobeli preemia ja tema elu filmiti ilusas meeles.
Lühid alt mänguteooriast
Kuna Nashi tasakaaluteooria selgitab inimeste käitumist interaktsiooni tingimustes, tasub kaaluda mänguteooria põhimõisteid.
Mänguteooria uurib osalejate (agentide) käitumist üksteisega suhtlemisel nagu mäng, kui tulemus sõltub mitme inimese otsusest ja käitumisest. Osaleja teeb otsuseid oma ennustuste põhjal teiste käitumise kohta, mida nimetatakse mängustrateegiaks.
On olemas ka domineeriv strateegia, mille puhul osaleja saab parima tulemuse teiste osalejate käitumise eest. See on mängija parim võit-võit strateegia.
Vangide dilemma ja teaduslik läbimurre
Vangide dilemma on juhtum mängust, kus osalejad on sunnitud tegema ratsionaalseid otsuseid, saavutades alternatiivide konflikti tingimustes ühise eesmärgi. Küsimus on selles, millise neist valikutest ta valib, mõistes isiklikku ja üldist huvi, aga ka seda, et mõlemat ei ole võimalik saada. Mängijad näivad olevat karmi mängukeskkonna vangis, mis paneb nad mõnikord väga produktiivselt mõtlema.
Seda dilemmat uuris Ameerika matemaatik John Nash. Tema saavutatud tasakaal oli omal moel revolutsiooniline. Eriti ered alt mõjutas see uus mõte majandusteadlaste arvamust selle kohta, kuidas turuosalised teevad valikuid, võttes arvesse teiste huve, tihedas suhtluses ja huvide ristumisel.
Mänguteooriat on kõige parem uurida konkreetsete näidete kaudu, kuna see matemaatiline distsipliin ise ei ole kuiv alt teoreetiline.
Vangide dilemma näide
Näiteks kaks inimest panid toime röövi, sattusid politsei kätte ja neid kuulatakse üle eraldi kambrites. Samas pakuvad politseinikud igale osalejale soodsaid tingimusi, mille alusel ta vabastatakse, kui ta partneri vastu tunnistab. Igaüks neistkurjategijatel on järgmised strateegiad, mida ta kaalub:
- Mõlemad annavad tunnistusi samal ajal ja saavad 2,5 aastat vangistust.
- Mõlemad vaikivad korraga ja saavad kumbki 1 aasta, sest sel juhul on nende süü tõendusmaterjal väike.
- Üks tunnistab ja vabastatakse, teine vaikib ja saab 5 aastat vangistust.
Ilmselt sõltub kohtuasja tulemus mõlema osaleja otsusest, kuid nad ei saa kokku leppida, sest nad istuvad erinevates kambrites. Selgelt on näha ka nende isiklike huvide konflikt võitluses ühise huvi eest. Igal vangil on kaks tegutsemisvõimalust ja 4 tulemuste valikut.
Loogiliste järelduste ahel
Seega, kurjategija A kaalub järgmisi valikuid:
- Ma vaikin ja mu elukaaslane vaikib – saame mõlemad 1 aasta vangistust.
- Annan oma elukaaslase ja tema mind – saame mõlemad 2,5 aastat vangistust.
- Ma vaikin ja mu partner reedab mind – saan 5 aastat vangistust ja ta vabaneb.
- Annan oma elukaaslase üle, kuid ta vaikib – ma saan vabaduse ja ta saab 5 aastat vangistust.
Toome selguse huvides välja võimalike lahenduste ja tulemuste maatriksi.
Vangi dilemma võimalike tulemuste tabel.
Küsimus on selles, mida iga võistleja valib?
"Ole vait, sa ei saa rääkida" või "Sa ei saa olla vait, sa ei saa rääkida"
Osaleja valiku mõistmiseks peate läbima tema mõtete ahela. Järgides kurjategija A põhjendust: kui mina vaikin ja elukaaslane vaikib, saame minimaalse tähtaja (1 aasta), aga minaMa ei tea, kuidas ta käitub. Kui ta tunnistab minu vastu, siis on parem, kui ma tunnistan, muidu võin istuda 5 aastat. Pigem istun 2,5 aastat kui 5 aastat. Kui ta vaikib, siis seda enam on mul vaja tunnistada, sest nii saan vabaduse. Osaleja B.
Ei ole raske mõista, et iga kurjategija domineeriv strateegia on tunnistada. Selle mängu optimaalne punkt saabub siis, kui mõlemad kurjategijad annavad tunnistusi ja saavad oma "auhinna" - 2,5 aastat vangistust. Nashi mänguteooria nimetab seda tasakaalu.
Ebaoptimaalne optimaalne Nashi lahendus
Nashianliku vaate revolutsiooniline olemus seisneb selles, et selline tasakaal ei ole optimaalne, kui arvestada üksikut osalejat ja tema omakasu. Lõppude lõpuks on parim võimalus vaikida ja vabaks jääda.
Nashi tasakaal on huvide lähenemise punkt, kus iga osaleja valib tema jaoks optimaalse variandi ainult siis, kui teised osalejad valivad teatud strateegia.
Arvestades võimalust, kui mõlemad kurjategijad vaikivad ja saavad ainult 1 aasta, võime seda nimetada Pareto-optimaalseks võimaluseks. See on aga võimalik vaid siis, kui kurjategijad saaksid eelnev alt kokku leppida. Kuid isegi see ei tagaks seda tulemust, kuna kiusatus kokkuleppest taganeda ja karistust vältida on suur. Täieliku usalduse puudumine üksteise vastu ja oht saada 5 aastat sunnitud valima tunnustusega variandi. Mõelge sellele, millest osalejad kinni peavadvaikimine, koos tegutsemine on lihts alt irratsionaalne. Sellise järelduse saab teha, kui uurime Nashi tasakaalu. Näited ainult tõestavad, et teil on õigus.
Isekas või ratsionaalne
Nashi tasakaaluteooria andis jahmatavad järeldused, mis lükkasid ümber varem kehtinud põhimõtted. Näiteks Adam Smith pidas iga osaleja käitumist täiesti isekaks, mis viis süsteemi tasakaalu. Seda teooriat nimetati "turu nähtamatuks käeks".
John Nash nägi, et kui kõik osalejad tegutsevad oma huvides, ei too see kunagi kaasa optimaalset rühmatulemust. Arvestades, et ratsionaalne mõtlemine on igale osalejale omane, on Nashi tasakaalustrateegia pakutav valik tõenäolisem.
Puht alt meeste eksperiment
Ehe näide on blondide paradoksimäng, mis näib küll kohatu, kuid on selge näide Nashi mänguteooria toimimisest.
Selles mängus peate ette kujutama, et baari tuli vabade meeste seltskond. Läheduses on tüdrukute seltskond, kellest üks on teistest eelistatum, ütleks mõni blondiin. Kuidas poisid käituvad, et saada endale parim tüdruksõber?
Nii, kuttide põhjendus: kui kõik hakkavad blondiiniga tuttavaks saama, siis suure tõenäosusega ei saa sellest keegi aru, siis ei taha tema sõbrad tuttavaks saada. Keegi ei taha olla teine varumees. Aga kui poisid otsustavad vältidablond, siis on tõenäosus, et iga poiss leiab tüdrukute seast endale hea tüdruksõbra.
Nashi tasakaalu olukord pole poiste jaoks optimaalne, sest ainult oma isekaid huve järgides valiks igaüks blondiini. On näha, et ainult isekate huvide taotlemine võrdub rühmahuvide kokkuvarisemisega. Nashi tasakaal tähendab, et iga mees tegutseb oma huvides, mis on ühenduses kogu grupi huvidega. See ei ole parim valik igaühe jaoks isiklikult, kuid parim kõigi jaoks, lähtudes üldisest edustrateegiast.
Kogu meie elu on mäng
Otsuste tegemine pärismaailmas sarnaneb vägagi mänguga, kus ootate ka teistelt osalejatelt teatud ratsionaalset käitumist. Äris, tööl, meeskonnas, ettevõttes ja isegi suhetes vastassooga. Alates suurtest tehingutest kuni tavaliste elusituatsioonideni järgib kõik üht või teist seadust.
Muidugi on ül altoodud mänguolukorrad kurjategijate ja baariga lihts alt suurepärased illustratsioonid, mis näitavad Nashi tasakaalu. Näited sellistest dilemmadest tekivad väga sageli reaalsel turul ja see toimib eriti juhtudel, kui turgu kontrollivad kaks monopoli.
Segastrateegiad
Tihti osaleme mitte ühes, vaid mitmes mängus korraga. Valides ühes mängus ühe võimaluse, juhindudes ratsionaalsest strateegiast, aga satud teise mängu. Pärast paari ratsionaalset otsust võite avastada, et teie tulemus ei meeldi teile. Midavõta?
Vaatleme kahte tüüpi strateegiat:
- Puhas strateegia on osaleja käitumine, mis tuleneb teiste osalejate võimalikule käitumisele mõtlemisest.
- Segastrateegia ehk juhuslik strateegia on puhaste strateegiate vaheldumine juhuslikult või puhta strateegia valik teatud tõenäosusega. Seda strateegiat nimetatakse ka juhuslikuks.
Seda käitumist arvesse võttes saame Nashi tasakaalu uue pilgu. Kui varem räägiti, et mängija valib strateegia ühe korra, siis teist käitumist võib ette kujutada. Võib eeldada, et mängijad valivad strateegia teatud tõenäosusega juhuslikult. Mängudes, mis ei leia Nashi tasakaalu puhaste strateegiate puhul, on need alati segastrateegiates.
Nashi tasakaalu segastrateegiates nimetatakse segatasakaaluks. See on tasakaal, kus iga osaleja valib oma strateegiate valimise optimaalse sageduse, eeldusel, et teised osalejad valivad oma strateegiad etteantud sagedusega.
Karistused ja segastrateegia
Segastrateegia näite võib leida jalgpallimängust. Segastrateegia parim näide on võib-olla pen altiseeria. Niisiis, meil on väravavaht, kes suudab hüpata ainult ühte nurka, ja mängija, kes lööb pen alti.
Niisiis, kui mängija valib esimesel korral vasakusse nurka laskmise strateegia ja ka väravavaht kukub sellesse nurka ja püüab palli kinni, siis kuidas saavad asjad areneda teisel korral? Kui mängijalööb vastasnurka, on see tõenäoliselt liiga ilmne, kuid samas kurvis löömine pole vähem ilmne. Seetõttu ei jää nii väravavahil kui ka lööjal muud üle, kui loota juhuslikule valikule.
Seega üritavad mängija ja väravavaht saada maksimaalset tulemust juhusliku valiku vaheldumisi kindla puhta strateegiaga.