Hry sa hrajú, sprostredkovatelia hráčom pomáhajú

V ekonomickej teórii je Nashova rovnováha všade, ale nový výskum ukazuje, že často je nemožné ju dosiahnuť.. Nashova rovnováha je v teórii hier taká situácia, kedy žiaden z hráčov nemôže jednostrannou zmenou zvolenej stratégie vylepšiť svoju situáciu. Súčasne ide o koncept riešenia nekooperatívnych hier viacerých hráčov. Svoje meno získala po Johnovi Nashovi, ktorý dokázal, že každá konečná hra má aspoň jedno také riešenie.

V roku 1950 napísal John Nash, matematik, krátky článok, ktorý navždy zmenil ekonomickú teóriu. Vznikol o ňom životopisný film The Mind Games. Jeho hlavná myšlienka bola jednoduchá a elegantná: spočívala v tom, že v každej konkurenčnej hre je rovnováha. Nashová rovnováha je súbor stratégií hospodárskej súťaže, v ktorých žiadny účastník nemôže zvýšiť výhru zmenou stratégie, ak ostatní účastníci nemenia svoje vlastné.

Vďaka tomuto objavu v roku 1994 dostal John Nash Nobelovu cenu za ekonomiku. Koncept rovnováhy – univerzálny nástroj, ktorý nám pomáha pochopiť, čo je to strategické správanie, a to nielen v ekonomike, ale aj v psychológii, evolučnej biológii a ďalších odborov. Nositeľ ďalšej Nobelovej ceny za ekonómiu, Roger Myerson z University of Chicago, napísal: “Objav konceptu rovnováhy v ekonómii je porovnateľný vo význame s objavom dvojreťazcovej DNA v biológii.”

 

Keď je situácia v rovnováhe, hráči nemajú dôvod zmeniť svoju stratégiu. Ale ako to dosiahnuť? Na rozdiel od gule, ktorá sa rýchlo rúti z keď letí z vrchu a zastavuje počas toho keď ide na horu, v teórii hier niet jednoduchej a jasnej sily, ktorá vedie hráčov k rovnováhe Nasha.

“Toto je hlavný problém, na ktorý narážajú mikroekonómovia,” hovorí Tim Rafgarden, expert teoretickej informatiky na Stanfordskej univerzite. “Uplatňujú koncept rovnováhy, ako keby ju hráči mohli dosiahnuť, ale nie vždy si môžete byť istý, že sú v Nashovej rovnováhe a nie v stave blízko k nej.”

Je nerozumné očakávať, že ľudia dosiahnu rovnováhu na prvý raz. Platí to najmä pre prípady, keď každý hráč pozná len svoje hodnotenie situácie bez toho, aby mal najmenšiu predstavu o tom, ako ho hodnotia ostatní hráči – tak sa deje zvyčajne v reálnom živote. Ak však ľudia hrajú v jednej hre niekoľko kôl, je pravdepodobné, že sa v ranom štádiu naučia správne stratégie a rýchlo dosiahnu rovnováhu. Početné pokusy o nájdenie efektívnych metód výučby potrebných stratégií však neboli úspešné.

“Ekonómovia vyvinuli stratégie, ktoré pomáhajú rýchlo dosiahnuť rovnováhu,” hovorí Aviad Rubinstein. Teraz získal doktorát v oblasti teoretickej informatiky na California University  Berkeley. Tvrdí však, že “existuje veľa pomerne jednoduchých hier, v ktorých tieto stratégie nefungujú.”

Aviad Rubinstein a Jacob Babichenko, matematik izraelského Technologického inštitútu v Haife, vysvetľujú, prečo sa to deje. V štúdii zverejnenej v septembri minulého roka ukázali, že neexistuje žiadny spôsob, ako doladiť ich stratégiu v rámci hry, aby sa dosiahla rovnováha Nash so 100% pravdepodobnosťou – bez ohľadu na to, aký je premyslený, kreatívny a primeraný. Toto je “príliš ustálený záver”, myslí si Rafgarden.

Podľa Myersona ekonómovia často používajú Nashovu rovnováhu ako dôkazovú základňu pre navrhované ekonomické reformy. Napriek tomu nové údaje ukazujú, že nemôžu kategoricky uviesť, že hráči presne dosiahnu rovnováhu. Aby tak urobili, ekonómovia musia najskôr preukázať, prečo je to možné v tomto konkrétnom prípade. Noam Nisan, vedec, počítačový odborník na Hebrejskej univerzite, hovorí: “Ak chcete dokázať, že vaša hra umožňuje ľahko sa dostať do Nashovej rovnováhy, musíte najprv preukázať, či je to možné dosiahnuť vôbec”.

Jednoduché hry

V niektorých  jednoduchých hrách je pomerne ľahké určiť cestu k rovnováhe Nasha. Napríklad, keď mám radšej čínske jedlo, a ona talianske a chceme spoločne obedovať, potom máme dva jasné spôsoby, ako dosiahnuť rovnováhu: obaja ísť buď do čínskej alebo do talianskej reštaurácie. Dokonca aj keď nevieme, o preferenciách iných hráčov a nemusíme mu povedať našu stratégiu, len po pár večeriach osamote a zmeškaných príležitostiach ku komunikácii, pochopíme svoje preferencie a pôjdeme na večeru.

Avšak, predstavte si, že 100 ľudí chce ísť spoločne na obed,  a nevedia nič o preferenciách tých ostatných. V roku 1950, Nash dokázal, že aj v týchto zložitých hrách s viacerými hráčmi sa dosahuje rovnováha: aspoň pokiaľ pridáte prvok náhody a predpoklad, že hráči v 60% prípadov uprednostnia čínsku reštauráciu. Avšak, v roku 2015, Nash zahynul v  autonehode, a nezanechal po sebe mechanizmus pre výpočet tejto rovnováhy.

Počas štúdia dôkazu Nasha Babichenko a Rubinstein boli schopní preukázať, že vo všeobecnosti, pre hráčov nie je zaručený spôsob dokonca priblížiť k rovnováhe, keď si navzájom odhalia preferencie. A s rastúcim počtom hráčov, náklady na dobu, počas ktorej budú musieť komunikovať budú stále vysoké.

Napríklad v hre s 100 účastníkmi, sú tu 2 100 výsledkov hry, a teda 2 100 preferencií, ktoré by mali byť zdieľané medzi samotnými hráčmi. Na porovnanie, počet sekúnd od Veľkého tresku je iba okolo 2 59. Ťažkosti pri komunikácii znamenajú, že adaptačné stratégie, čas od času nepovedú k účinnému dosiahnutiu rovnováhy, prinajmenšom v prípade niektorých zložitých hier, napríklad v hre s výberom reštaurácií zo 100 hráčov. Nakoniec sa v každom kole hry sa hráči  naučia len malú časť informácií o sebe navzájom. Šťastne budú obedovať osamote.

To znamená, že prejde 2 100 kôl, skôr ako sa dozvedia o vzájomných preferenciách. Dovtedy čínske a talianske reštaurácie pravdepodobne zaniknú. “Samozrejme, že v prípade, že čas potrebný na dosiahnutie rovnováhy je dlhší ako existencia vesmíru, potom to nemá zmysel” , tvrdí to, Sergiu Hart, odborník na teóriu hier na Hebrejskej univerzite v Jeruzaleme.

Všetko o sebe

Zdá sa úplne prirodzené, dokonca zrejmé, že niekedy hráči potrebujú vedieť doslovne všetko o svojich hodnotách, aby dosiahli rovnováhu. Nová štúdia však ukazuje, že rovnaké prekážky pretrvávajú aj vtedy, keď hráči majú záujem dosiahnuť aspoň približnú Nashovu rovnováhu. Ide o dôležitý objav, pokiaľ ide o aplikáciu v praxi, kde aj výsledok, ktorý je blízko k rovnováhe, znamená veľa.

Zistenie Babichenka a Rubinstein neznamená, že väčšina alebo dokonca všetky hry sú predmetom tohto obmedzenia – platí to len pre niektoré z nich. Mnohí ekonómovia, ktorí sa špecializujú na teóriu hier, modelujú reálny svet s ďalšou štruktúrou, ktorá umožňuje výrazne znížiť množstvo výmeny informácií. Napríklad, ak si každý zo 100 ľudí vyberie jednu z dvoch trás, je nepravdepodobné, že vedci budú mať záujem o voľbu každého jednotlivého hráča – je dôležité iba množstvo hráčov na jednej či druhej trase. To znamená, že tento súbor nastavení bude symetricky a potenciálne to bude možné vyjadriť v celom rozsahu pre pár správne vybratých ťahov namiesto 2 100.

Ekonómovia môžu použiť takéto argumenty na zdôvodnenie použitie Nashovej rovnováhy v určitých hrách. Výsledok novej štúdie však naznačuje, že takéto súdy sa musia posudzovať individuálne. Nie sú žiadne dobré dôvody domnievať sa, že to platí vždy pre všetky hry.

Okrem toho, napriek skutočnosti, že mnoho hier, vynájdených ľudstvom v priebehu histórie, sú v súlade s týmito zjednodušeniami, internetové storočie splodilo veľa hier s veľkým počtom hráčov – od zoznamovacích stránok k online  obchodovaniu s akciami. V tejto fáze, v podmienkach rýchleho rozvoja ľudstva, je ťažšie dosiahnuť rovnováhu. Vynájdeme nové hry, veľmi často sa chystáme, keď to očakávame.

Ekonómia je nepresná

V skutočnosti ľudia často nedosahujú rovnováhu a podľa Andrewa Mac Lennana, ekonóma z Queenslandskej univerzity, vedci to dobre vedia. Domnieva sa však, že “ekonomická veda nemá teoretickú štruktúru, ktorá stanovuje úroveň presnosti.” Podľa neho objav teoretickej informatiky, ako je výskum Babichenka a Rubinstein, “by mal byť inšpiráciou pre vážnejšie štúdium problematiky” .

Ale tieto dve oblasti majú veľmi odlišné pohľady na svet, čo môže byť prekážkou pre interdisciplinárne  diskusie: ekonómovia majú tendenciu vytvárať zjednodušené modely zachytiť podstatu zložitých interakcií, zatiaľ čo v teoretických počítačových vedcov sa viac zaujímajú o to, ako sa bude správať model, ktorý bude oveľa komplikovanejší. “Chcel by som, aby boli moji kolegovia ekonómovia viac informovaní a zaujímali to, čo teoretická informatika robí,” sťažuje sa McClennan.

Nová práca prináša jasnú líniu medzi Nashovou rovnováhou a inou všeobecnejšou koncepciou rovnováhy, ktorá sa objavila 24 rokov po Nashovom článku. V roku 1974 Robert Aumann, ďalší laureát Nobelovej ceny za ekonómiu, navrhol koncept “korelovanej rovnováhy”, ktorý popisuje scenár, v ktorom každý účastník dostane od poctivého sprostredkovateľa (alebo “korelačného zariadenia”), poradenstvo pre voľbu stratégie. Ak žiadny hráč nedostane podnet na odklon od prijatej rady a je presvedčený, že aj ostatní hráči sledujú svoju radu, úloha sprostredkovateľa  vytvára korelačnú rovnováhu.

Spočiatku sa môže zdať, že ide o nejaký záhadný myšlienkový experiment, ale v skutočnosti stále používajú korelačnú rovnováhu: napríklad, keď hádžeme mincu pri rozhodovaní o tom, či pôjdeme do čínskej reštaurácie, alebo talianskej, alebo keď prechádzame cez križovatkou pomocou semaforov.

V týchto dvoch príkladoch, každý hráč presne vie, aký druh poradenstva od “sprostredkovateľa” dostane druhý hráč, a táto rada pomôže hráčom vyberať, ale nakoniec sa dostanú do určitého druhu Nashovej rovnováhy.

Sprostredkovateľ v hre

Auman ukázal, že pokiaľ hráči presne nevedia, akú radu dostávajú ostatní, a vedia len to, že tieto rady sú vzájomnej spojené, rad korelovaných rovnováh môže obsahovať nielen kombinácie rovnováh Nasha: môžu do neho vstupovať formy hry, ktoré nimi vôbec nie sú, ale ktoré vedú k produktívnejším výsledkom. Napríklad v hrách, kde spolupráca prináša väčší zisk, ako osamotená hra, sprostredkovateľ inokedy zapája hráčov do interakcie, ale neodhaľuje aké rady dáva iným hráčom.

A to napriek skutočnosti, že sprostredkovateľ môže poskytnúť celý rad tipov, rad korelovaných rovnováh v hre, ktorá je reprezentovaná sústavou lineárnych rovníc a nerovností, jednoduchšie riešiteľnými matematicky ako počet Nashových  rovnováh.  Myerson raz opísal Nashov pohľad na teóriu hier ako “jeden z najväčších vedeckých objavov 20. storočia”. Korelačnú rovnováhu považuje za prirodzenejší koncept ako Nashovej  rovnováhy.

Pokiaľ ide o opakujúce sa kolá hry, mnohé z najprirodzenejších spôsobov, ktorými môžu hráči prispôsobiť svoje stratégie, sú v istom zmysle založené na korelujúcej rovnováhe. Vezmite napríklad prístup “minimalizácia ľútosti”, ktorého podstatou je, že pred každým kolom hráči zvyšujú možnosť využitia navrhovanej stratégie, ak ľutujú, že ju v minulosti nepoužívali. “Minimalizácia ľútosti je metóda, ktorá sa podobá správaniu v reálnom živote – venujeme pozornosť tomu, čo fungovalo naposledy, a niekedy pridať niečo nové,” hovorí Rafgarden.

Štúdie ukázali, že pri použití mnohých spôsobov, ako minimalizovať ľútosť, hra nakoniec dosiahne korelovanú rovnováhu. Prekvapivo, po približne 100 kolách priebeh hry bude vyzerať úplne rovnako, ako keby sprostredkovateľ od začiatku radil pre hráčoom. “Ako keby sa prostredníctvom interakcie našlo [korelujúce] zariadenie,” vysvetľuje Konstantinos Daskalakis, počítačový vedec v oblasti teoretickej informatiky na Massachusetts Institute of Technology. Počas hry účastníci nemusia nevyhnutne zostať v korelovanej rovnováhe: napríklad po 1000 kolách sa môžu nachádzať v novom druhu rovnováhy, akoby ich hra bola riadená iným sprostredkovateľom. Tento proces je podobný skutočnému životu, opakuje Rafgarden, pretože normy spoločnosti, podľa ktorých sa vytvára rovnováha, sa neustále menia.

Vo všetkých zložitých hrách, kde je ťažké dosiahnuť rovnováhu Nasha, preto je korelovaná rovnováha “prirodzeným vedúcim kandidátom” na úlohu riešenia. Podľa Myersona objav Nashovej rovnováhy pred korelovanou rovnováhou je len nehoda. “Všeobecne sa uznáva, že skoršie objavy sú základom pre všetky nasledujúce. Ale v tomto prípade, kto rozhoduje, aký je základ? ”

A napriek tomu rýchle dosiahnutie rovnováhy neznamená, že každé jednotlivé kolo hry prebieha v korelovanej rovnováhe – to platí len pre celú históriu hry. Rubinstein dospel k záveru, že minimalizovanie ľútostí nie je vždy v každom kole ideálnou voľbou pre rozumných hráčov. Preto otázka “Čo bude rozumný hráč robiť?” Zostáva bez jednoznačnej odpovede. Narodila sa skôr ako tí, ktorí si ju dnes dávajú.