Teória hier
Teória hier (iné názvy: teória strategických hier, matematická teória hier[1]) je odvetvie aplikovanej matematiky. Používa modely na skúmanie interakcií s formalizovanou štruktúrou pohnútok („hier“). Teória hier skúma predpokladané a skutočné správanie sa jednotlivcov v hrách, rovnako ako aj optimálne stratégie. Zdanlivo odlišné typy interakcií sa môžu prejavovať podobnými štruktúrami pohnútok, takže všetky môžu byť reprezentované ako príklady jednej konkrétnej hry.
John von Neumann a Oskar Morgenstern ako prví formalizovali túto tému v roku 1944 v ich knihe Teória hier a ekonomické správanie (Theory of Games and Economic Behavior). Dôležité aplikácie teórie hier nájdeme v oblastiach ako operačná analýza, ekonómia, medzinárodné vzťahy, evolučná biológia, vojenská stratégia, kolektívne správanie, politológia a psychológia. Je úzko spätá s ekonómiou v tom zmysle, že sa snaží nájsť racionálne stratégie v situáciách, kde výsledok nezávisí len od našej stratégie a „podmienok na trhu“, ale aj od stratégií zvolených ostatnými hráčmi. Ciele jednotlivých hráčov môžu byť rozdielne, ale môžu sa aj prekrývať. Aplikácie vo vojenskej stratégii do istej miery prispeli k rozvoju teórie hier v jej začiatkoch.
Teória hier hrá čoraz dôležitejšiu úlohu v logike a v informatike. Niekoľko logických teórií má základ v sémantike hier. Informatici používajú hry na modelovanie interaktívnych výpočtov. Výpočtová logika sa snaží vyvinúť komplexnú formálnu teóriu (logiku) interaktívnych výpočtových úloh a zdrojov tak, že tieto entity formalizuje ako hry medzi výpočtovým agentom (činiteľom) a jeho okolím.
Analýza teórie hier sa môže vzťahovať na jednoduché zábavné hry alebo na závažnejšie aspekty života a spoločnosti. Väzňova dilema, ktorú spopularizoval matematik Albert W. Tucker, poskytuje príklad použitia teórie hier v bežnom živote – má mnoho implikácií pre charakter ľudskej kooperácie.
Biológovia používajú teóriu hier na pochopenie a predpovedanie určitých výsledkov evolúcie. Príkladom je koncept evolučne stabilnej stratégie, ktorý uviedli John Maynard Smith a George R. Price v roku 1973 v časopise Nature. Pozri tiež evolučná teória hier a behaviorálna ekológia.
Analytici hier bežne používajú v spojení s teóriou hier aj ostatné odvetvia matematiky, predovšetkým pravdepodobnosť, štatistiku a lineárne programovanie.
Typy hier
upraviťHra je dobre definovaný matematický objekt. Pozostáva z množiny hráčov, zo stratégií dostupných daným hráčom a ku každej kombinácii stratégií sú určené výplaty hráčov. Teória hier rozdeľuje hry do mnohých kategórií podľa toho, aké konkrétne metódy sa používajú na ich riešenie a ako v tej-ktorej kategórii definujeme „riešenie“. Medzi základné typy hier patria:
Hry s nulovým súčtom a hry s nenulovým súčtom
upraviťV hrách s nulovým súčtom je celkový úžitok pre všetkých zúčastnených hráčov a pre každú kombináciu stratégií rovný nule. Inak povedané, víťazný hráč získava na úkor ostatných. Príkladom pre hru s nulovým súčtom je napríklad go, šach alebo poker. V týchto hrách víťaz získa práve toľko, koľko jeho protihráči prehrajú. V realite sa väčšinou stretávame s hrami s nenulovým súčtom (v podnikaní alebo v politike, ale príkladom je aj známa väzňova dilema), pretože niektoré výsledky prinášajú celkový čistý úžitok väčší alebo menší než nula. Inak povedané, zisk jedného hráča nemusí pre iného hráča nutne znamenať stratu. Napríklad obchodný kontrakt za bežných okolností predpokladá kladný celkový výsledok, lebo každá zo zúčastnených strán je na tom v konečnom dôsledku lepšie, než v situácii, keď by sa kontraktu nezúčastnila. Vo všeobecnosti je jednoduchšie analyzovať hry s nulovým súčtom. Napokon každú hru možno pretransformovať na hru s nulovým súčtom jednoducho tak, že pridáme dodatočného fiktívneho hráča a prostredníctvom jeho strát budeme kompenzovať výhry reálnych hráčov. Vhodným spôsobom zobrazenia výsledkov hry je matica výnosov.
Kooperatívne hry
upraviťKooperatívna hra je založená na existencii vymáhateľnej dohody medzi hráčmi a skupinami. V priebehu hry koná hráč s ohľadom na to, aká je jeho dohoda s ostatnými hráčmi. Hráči teda navzájom spolupracujú. Teória kooperatívnych hier vysvetľuje fungovanie hodnoverných dohôd. Hodnovernosť dohody je úzko spätá so stabilitou.
Axiomatické vyjednávanie
upraviťDvaja hráči môžu vyjednávať o veľkosti svojich podielov v rámci kontraktu. Teória axiomatického vyjednávania umožňuje určiť, aký veľký podiel je pre hráčov primeraný. Napríklad Nashovo riešenie vyjednávania vyžaduje, aby bol podiel dostatočne veľký a účinný. Podrobné objasnenie problematiky poskytujú špecializované učebnice.
Môže sa však stať, že niekoho nezaujíma „primerané“ riešenie a vyžaduje viac. Čo na to hovorí Nashov koncept riešenia vyjednávania? V skutočnosti jestvuje nekooperatívna hra striedavých ponúk (vyvinul ju Rubinstein), ktorá potvrdzuje Nashovo riešenie vyjednávania ako jedinečný bod Nashovej rovnováhy.
Charakteristické funkčné hry
upraviťNamiesto dvoch hráčov môžu spolupracovať viacerí hráči tak, aby dosiahli lepší výsledok. Nie je jasné, aký veľký podiel z celkového výsledku pripadne na každého hráča. Jadro poskytuje primeraný súbor možných podielov. Kombinácia podielov je v jadre, ak neexistuje subkoalícia, ktorej členovia by mohli získať väčší celkový výnos než je podiel na koalícii. Ak podiel neleží v jadre, niektorí členovia môžu byť sklamaní a začnú uvažovať o opustení celej skupiny a vytvorení menšej skupinky (subkoalície) s niektorými inými nespokojnými hráčmi.
Hry s úplnými informáciami
upraviťV hrách s úplnými informáciami má každý hráč k dispozícii rovnaké informácie týkajúce sa hry ako všetci ostatní. Príkladom hry s úplnými informáciami je šach. Naopak, hrou s neúplnými informáciami je napríklad poker alebo väzňova dilema. Hry s úplnými informáciam sa v bežnom živote vyskytujú iba zriedka. V teórii sa tieto hry používajú pre zjednodušenie - ako aproximácia skutočných, v realite prebiehajúcich hier.
Aplikácie teórie hier v hazardných hrách
upraviťAko referenčný rámec si môžeme zvoliť napríklad poker, ktorý ako hra podľa teórie hrier spĺňa tieto vlastnosti:
- Je dynamická (hráči sa rozhodujú jeden po druhom)
- Je nekooperatívna (každý hrá sám za seba)
- S nedokonalou informáciou (poznáme výplaty hráčov, ale nepoznáme akciu, ktorú hráči zahrajú. Máme len presvedčenia s akou pravdepodobnosťou zahrajú hráči akciu)
- Je v extenzívnom tvare a zapisuje sa pomocou herného stromu (kvôli tomu, že hra je dynamická)
Reprezentácia hry poker v extenzívnom tvare
upraviť- Hráč Náhoda (N) rozdá hráčovi 1 dve karty z balíčka kariet. Celkovo mu môže rozdať 1351 kartových kombinácií.
- Hráč 1 zahrá jednu zo svojich n stratégií s kartami, ktoré mu boli rozdané.
- Hráčovi 2 sa rozdajú dve karty z balíčka kariet. Celkovo mu môže byť rozdaných 1351 kartových kombinácií.
- Hráč 2 zahrá jednu zo svojich m stratégií s kartami, ktoré mu boli rozdané
- Krok 2) a 4) opakujeme, pokiaľ hráči prestanú vsádzať a navyšovať.
S1 | A11 B11 | A12 B12 | ... | A1n B1n |
S2 | A21 B21 | A22 B22 | ... | A2n B2n |
... | ... | ... | ... | ... |
Sm | Am1 Bm1 | Am2 Bm2 | ... | Amn Bmn |
Kvôli zjednodušeniu sa budeme venovať iba situáciám, kde sú iba dvaja hráči. Takúto hru môžeme popísať jednou bimaticou s m riadkami a n stĺpcami. Hráč 1 má m stratégií (S1,...,Sm) a hráč 2 má n stratégií (S'1,...,S'n). Teda ak si hráč 1 vyberie stratégiu Si a hráč 2 zvolí S'j , potom bude výplata hráča 1 Aij a hráča 2 Bij
V skutočnej hre hráči používajú zvyčajne zmiešané stratégie. Robia to tak, že si vyberú jednu čistú stratégiu, ktorá sa hráčom hodí. Túto stratégiu vyberajú s určitou pravdepodobnosťou. Podľa teórie hier súčet jednotlivých pravdepodobností, s ktorými vyberajú hráči čisté stratégie, je 1. Keby sme chceli zistiť výplatu hráča 1 v zmiešaných stratégiách, vytvoríme si vektor p, kde zložka vektora pi bude pravdepodobnosť, s akou bude hráč 1 hrať stratégiu i. Pre hráča 2 analogicky vytvoríme vektor q, kde zložka qi bude pravdepodobnosť, s akou bude hráč 2 hrať stratégiu i.
Nashovo equilibrum
upraviťDvojica stratégií (p,q), kde p je stratégia hráča 1 a q je stratégia hráča 2, sa nazýva "Nashovo ekvilibrium (NEQ)", ak p je najlepšia reakcia na q a q je najlepšia reakcia na p.
Pre hráča 1 si nazveme stratégiu p "najlepšiu reakciu" na stratégiu q hráča 2, ak p prinesie hráčovi 1 najvyššiu možnú výplatu: 22 Hráč 1 Hráč 2 S21 S22 b 1-b S11 a A11 A12 S12 1-a A21 A22 Výplata hráča 1, keď zahrá stratégiu S11: b.A11+ (1-b).A12 Výplata hráča 1, keď zahrá stratégiu S12: b.A21+ (1-b).A22 Výplata hráča 1, keď zahrá stratégiu S21: a.B11+ (1-a).B21 Výplata hráča 1, keď zahrá stratégiu S22: a.B12+ (1-a).B22 Kde a je pravdepodobnosť s akou zahrá hráč 1 stratégiu S11 a 1-a je pravdepodobnosť s akou zahrá hráč 1 stratégiu S12. Hráč 2 zahrá stratégiu S21 s pravdepodobnosťou b a stratégiu S22 pravdepodobnosťou 1-b. Dá sa ukázať, že v každej hre existuje minimálne jedno NEQ, ktoré nemusí nutne nastať pri čistých stratégiách.
S21 | S22 | ||
b | 1-b | ||
S11 | a | A11 | A12 |
S12 | 1-a | A21 | A22 |
S21 | S22 | ||
b | 1-b | ||
S11 | a | B11 | B12 |
S12 | 1-a | B21 | B22 |
Referencie
upraviť- ↑ teória hier. In: Slovník filozofia a prírodné vedy. 1. vyd. Bratislava : Pravda, 1987. s. 729 - 733.