2020. már 03.

Tóth I. János: Játékelmélet és történelem

írta: Janguli

Részletek

Zérusösszegű interakció: a Bismarck-tengeri csata

1943 februárjában az Egyesült Államok és Japán harcban állt Új-Guineáért. A szövetséges hírszerzés kiderítette, hogy a japánok összevonják erőiket Új-Guinea partjainál. A csapategyesítés érdekében a japán hajóhadnak a közelben lévő Új-Britannia szigetet kellett északról (a Bismarck-tengeren át) vagy délről (a Salamon-tengeren át) megkerülnie, amely körülbelül három napot igényelt.

Az amerikai légierő a lehető legnagyobb csapást akarta mérni a japán hajóhadra. A meteorológiai előrejelzés szerint az északi Bismarck-tengeren esőre és rossz látási viszonyokra, míg a déli Salamon-tengeren tiszta és napos időre lehetett számítani. Ezért az északon fekvő Bismarck-tenger a japán hajóhad bombázására kevésbé hatékony, mint a déli Salamon-tenger. Ennek ismeretében a japán Hitoshi Imamura admirálisnak választania kellett, hogy északon vagy délen hajózik, míg ezzel egy időben az amerikai George Kenney tábornoknak azt kellett eldönteni, hogy északon vagy délen keresi a japán hadihajókat. Ha rosszul dönt, akkor a bombázás szempontjából egy értékes napot elveszít.

George Kenney

A következő mátrix mutatja az interakció nyereségeit:

Döntés		Kenney tábornok
Döntés		Északon keres	Délen keres
Imamura admirális	Északon hajózik	2 nap bombázás ^Ny	1 nap bombázás
Imamura admirális	Délen hajózik	2 nap bombázás	3 nap bombázás

1. táblázat. A Bismarck-tengeri csata mátrixa. Imamura számára az „északon hajózni” a domináns stratégia, s így Kenneynek is érdemes „északon keresni” a japán hajókat. Ny: a mátrix nyeregpontja, a valóságban is ezt a lehetőséget választották.

Hitoshi Imamura

Ez a döntési helyzet egy zérusösszegű interakció, hiszen míg az USA számára x nap bombázás nyereség, addig a japánok számára ugyanez az x nap bombázás veszteséget jelent. Világos, hogy Kenney növelni, míg Imamura csökkenteni akarja a bombázási napok számát.

Kenney számára első megközelítésben nem egyértelmű, hogy melyik utat érdemes választani. Például, ha a japánok északon hajóznak és ők északon keresnek, akkor ez 2 nap bombázást jelent, de ha először délen keresnek, akkor a Japán hadsereg megússza 1 nap bombázással. Tehát az északi út választása esetében az amerikaiak biztos nyernek 2 nap bombázást, a déli út választása esetében azonban 1 vagy 3 nap bombázásra nyílik lehetőségük.

Imamura szempontjából azonban egyértelmű, hogy északra kell hajózni, mert az északi út (2 vagy 1 nap bombázás) stratégiája szigorúan dominálja a déli út (2 vagy 3 nap bombázás) stratégiáját. Ebből viszont az következik, hogy az amerikai repülőknek is északon érdemes keresni az ellenséget.

A Neumann által javasolt minimax elv felhasználásával formálisan a következőképp juthatunk el ugyanerre az eredményre. [A minimax elv révén a felek maximalizálni tudják a minimális nyereségüket, vagy másként fogalmazva: minimalizálni tudják az ellenfelük maximális nyereségét]. Kenney tábornok megvizsgálja, hogy az egyes sorokban melyek a legkisebb értékek (2,1), és kiválasztja a minimális értékek közül a legnagyobbat (2). Ennek alapján az északi stratégiát választja, amellyel legalább (minimálisan) 2 bombázási napot nyerhet. Ezzel szemben Imamura admirális megvizsgálja, hogy az egyes oszlopokban melyek a legnagyobb értékek (2; 3), majd a maximális értékek közül kiválasztja a minimálisat (2). Így a japán admirális is az északi stratégiát választja. (Imamura tehát a maximális veszteségeket minimalizálta, azaz a minimax stratégiát választotta.) Mivel mindkét játékos ugyanazt a kimenetelt választja, ezért ez a kimenetel adja a játék (tiszta) nyeregpontját (saddle point), amelyre egyidejűleg igaz az, hogy a saját sorában a minimális, míg a saját oszlopában a maximális érték. Tekintve, hogy a Bismarck-tengeri csatában a játék értéke 2 egység, így az interakció Kenney számára kedvező. Természetesen senki sem állítja azt, hogy a hadvezérek játékelméleti eszközöket alkalmaztak volna a helyes stratégia kiválasztása során. A modell arra hívja fel a figyelmet, hogy a parancsnokok döntése játékelméleti szempontból előre jelezhető, illetve leírható. Ahogy a közgazdaságtan képes leírni, illetve előre jelezni a racionális gazdasági szereplők viselkedését, úgy a játékelmélet szintén képes leírni és előre jelezni a racionális játékosok viselkedését a különböző interakciókban. A közgazdaságtannal ellentétben viszont a játékelméletnek szembe kell nézni azzal a problémával is, hogy bonyolultabb döntési helyzetekben a racionalitásnak különböző formái léteznek.

A gyáva nyúl: a kubai rakétaválság

A konfliktuskutatásban igen nagy teret kapott az 1962-es kubai rakétaválság – sokak szerint a hidegháború legveszélyesebb konfliktusa, amelyet Steven Brams a gyáva nyúl (chicken game) segítségével elemzett 1985-ben. (A terminus fordítása arra épül, hogy az angol nyelvben a csirke, míg a magyar nyelvben a nyúl a tipikus gyáva állat.)

A játék neve eredetileg a Haragban a világgal című amerikai filmből származik. Ebben látható az a híres jelenet, amikor a főszereplő Jimmie (James Dean) egy „csibefutamra” (chickie run) hívja ki a helyi banda főnökét. A verseny lényege, hogy lopott autóikkal egy tengerparti szakadék felé száguldjanak, és az veszít, aki hamarabb kiugrik az autójából.

A Gengszterek sofőrje című filmben a főszereplő az autóvezetés nagymestere. Gyakran úgy rázza le az üldöző rendőröket, hogy egy keskeny úton nagy sebességgel száguld feléjük, s ők előbb-utóbb elrántják a kormányt. Ebben a helyzetben a sofőrök dönthetnek, hogy kitérnek vagy tovább folytatják útjukat. E modellben a kitérés jelenti a kooperáló (cooperate), míg a leszerelés a dezertáló (defect) viselkedést; az előbbit C, míg az utóbbit D betűvel rövidítik. Tehát a gyáva nyúl dilemmában és más játékelméleti dilemmákban is a kooperál és a dezertál kifejezések speciális terminus technicusok, amelyek a konfliktuskezelés módjára utalnak. Egy konfliktusban általában azt tekintjük dezertálónak, aki önérdekét keményen és a másik rovására próbálja érvényesíteni, míg kooperálónak, aki ezt puhábban, a másik érdekeit is figyelembe véve teszi. A politológia hasonló értelemben használja a héja (D) és a galamb viselkedés (C) fogalmát. A játékosok döntésüket egyidejűleg, de egymástól függetlenül hozzák, ami négy lehetséges kimenetel valamelyikéhez vezet: összeütközés (DD); megfutamodás (CD); kölcsönös kitérés (CC); győzelem (DC). Ezeket a kimeneteleket mindkét játékos egytől négyig rangsorolja, amely egyben preferencia-sorrend is.

Döntés		Y játékos
Döntés		Kitér (C)	Továbbhalad (D)
X játékos	Kitér (C)	3; 3 ^PO	1; 5 * ^PO
X játékos	Továbbhalad (D)	5; 1 * ^PO	0; 0 ^PI

2. táblázat. Gyáva nyúl. Az első szám az x, míg a második az y játékos nyereségét mutatja. Minél magasabb a szám, annál kedvezőbb kimenetelt jelent a játékos számára, amelyek lehetnek Pareto-optimálisak (PO) vagy Pareto-inferior (PI) jellegűek. A csillag (*) a tiszta egyensúlyi helyzeteket jelöli. A szituációnak létezik egy kevert egyensúlypontja is, amikor mindkét játékos 1/3 valószínűséggel választja a kitérést. Ebben az esetben mindkét játékos nyeresége: 5/3. A két játékos közös nyeresége 6 és 0 egység között változik. Tehát a kollektív racionalitás is azt diktálja a feleknek, hogy kerüljék el az összeütközést.

A játéknak két tiszta egyensúlyi helyzete van: ha x, vagy ha y játékos tér ki egyoldalúan. Ebből következik, hogy mind a kitérés, mind a továbbhaladás egyensúlyi (vagyis „optimális”) viselkedésnek tekinthető. Természetesen ezek a stratégiák nem egyenértékűek a szereplők számára, hiszen nekik a továbbhaladás (győzelem) előnyösebb, mint az egyoldalú kitérés (vereség). Tehát az egyensúlyi stratégia választásának elve nem határozza meg egyértelműen a szereplők döntését. A kitérő (C) stratégia választása kockázatkerülő vagy kompromisszumkereső, ezzel szemben a továbbhaladás (D) választása egy kockázatkedvelő vagy a győzelmet mindenáron elérni akaró viselkedést jelent. A katasztrofális eredmény (DD) akkor következik be, hogy ha két kockázatkedvelő (vagy kompromisszumot elutasító) személy és stratégia találkozik.

Az Egyesült Államok területének nagy részét veszélyeztető szovjet nukleáris rakéták Kubába telepítésének hírét az amerikai hírszerzés 1962. október 14-én erősítette meg. Véleményük szerint a rakéták 10 napon belül bevetésre alkalmasak lettek volna. Az USA kormányzata magas rangú tisztviselőkből álló válságstábot, egy úgynevezett Végrehajtó Bizottságot hozott létre, amely hat napon keresztül titokban ülésezett. Megoldásként több alternatívát vettek fontolóra, de végül két megoldási lehetőség maradt az asztalon:

(1) Egy tengeri blokád (C) a további szovjet fegyverszállítások megakadályozására, amelyet egy határozottabb akció követne annak érdekében, hogy a Szovjetuniót rábírják a már telepített rakéták visszavonására.

(2) Egy sebészi pontosságú légitámadás (D) a telepített rakéták ellen, amelyet esetleg követett volna a sziget megszállása.

A szovjet politikusok a következő alternatíva előtt álltak:

(1) A rakéták visszavonása (c).

(2) A rakéták telepítésének a folytatása és befejezése Kubában (d).

A fentiekből következően a lehetséges kimenetelek a következők:

(1) Mindkét fél kompromisszumos megoldással próbálkozik (Cc, ami a konfliktusban a döntetlennek (3; 3) felel meg.

(2) A szovjeteknek sikerül telepíteni a rakétákat Kubában (Cd), azaz szovjet győzelem, amerikai vereség (2; 4).

(3) Az amerikai légitámadás hatására a szovjetek kivonják a rakétákat (Dc), azaz amerikai győzelem, szovjet vereség (4; 2).

(4) Mindkét fél agresszíven lép fel (Dd), így az amerikai légitámadást követően feltehetően nukleáris háború (1; 1) alakul ki a nagyhatalmak között.

Ebben a helyzetben két tiszta egyensúlyi helyzet van: nevezetesen amerikai légitámadás és szovjet visszavonulás, illetve a szovjet rakétatelepítés és a (sikertelen) amerikai blokád. Az előbbi az amerikaiak, míg az utóbbi a szovjetek győzelmét jelentette volna. Nyilvánvaló azonban, hogy az amerikaiak számára, ahogy a szovjetek számára is, a győzelmi kimenetel jobb, mint a vereség. Ezért mindkét játékos hajlani fog arra, hogy a számára jobb egyensúlyi stratégiát kövesse, azaz az amerikaiak a légitámadást, míg a szovjetek a rakéták telepítését válasszák. A probléma csak az, hogy ezen egyensúlyi stratégiák metszete már nem egyensúlyi állapothoz, hanem atomháborúhoz vezet. Ez a lehetőség pedig elrettenti őket attól, hogy a végsőkig haladjanak az összeütközés felé vezető úton. S így végül a felek lemondtak a számukra nagy győzelmet (4 egység) és a riválisuk számára nagy vereséget (2 egység) jelentő egyensúlypont megvalósításáról, mert ez mindkettőjük számára óriási veszteséget (1 egység) eredményezett volna, e helyett megegyeztek egy kölcsönösen elfogadható döntetlenben (3-3 egység). (Általánosan elfogadott vélemény, hogy a kölcsönös elrettentés akadályozta meg a két nagyhatalom közötti háborút.)

A krízist a politikai vezetők állásfoglalásai, illetve üzenetváltásai kísérték:

Robert Kennedy, az elnök testvére és tanácsadója: „Ha ők nem távolítják el a bázisokat, mi fogjuk eltávolítani azokat. Egy azonnali támadást mindenki Pearl Harbour fordítottjának tekintett volna, és ez befeketítette volna az USA nevét a történelem lapjain.”

John F. Kennedy Hruscsovnak írt leveléből Brams a következőt idézi: „Ha Önök eltávolítják ezt a fegyverrendszert Kubából, mi beleegyezünk abba, hogy [...] (1.) azonnal felszámoljuk működő blokádunkat, és (2.) biztosítékot adunk afelől, hogy nem támadjuk meg Kubát.”

Hruscsov levele Bertrand Russelnek a válság elején: „Ha az amerikai kormány agresszív politikáján nem változtat, akkor az Egyesült Államok és más nemzetek lakosságának is több millió emberélettel kell fizetnie ezért a politikáért. Ha biztosítékot kapnánk afelől, hogy az Egyesült Államok elnöke nem vesz részt egy Kuba elleni támadásban, és a blokádot eltörlik, akkor a kubai rakéták eltávolításának vagy megsemmisítésének kérdése egész másképp merülne fel.”

Végül a szovjet álláspont a válság végen: „Beleegyezünk abba, hogy eltávolítsuk Kubából az Önök által támadónak minősített fegyvereket [...] [, amennyiben] az USA a saját részéről – figyelembe véve a szovjet állam nyugtalanságát és aggodalmát –, ugyancsak ki fogja vonni hasonló fegyvereit Törökországból.”

Tehát, ahogy ezek a nyilatkozatok is mutatják, mindkét fél joggal gondolhatott arra, hogy a másik akár az atomháborút is hajlandó kockáztatni, de nem hátrál meg. S ezután a felek egyre inkább egy mindkét fél számára elfogadható kompromisszum felé mozdultak el. S éppen ezért nem véletlen, ahogy arra az elemzések is rámutatnak, hogy a kubai válságban mindkét nagyhatalom el akarta kerülni a fegyveres konfliktus kirobbanását. Mint tudjuk, a kölcsönösen elfogadható kompromisszum végül az lett, hogy a Szovjetunió kivonta a rakétáit, míg az USA megígérte, hogy nem támadja meg Kubát. Általában a gyáva nyúl játékot olyan konfliktusok jellemzésére használják, ahol a felek rendelkeznek valamilyen elrettentő erővel. Ezért a gyáva nyúl típusú konfliktusok gyakran végződnek kompromisszummal, ellentétben a fogolydilemma típusú konfliktusokkal. Formális szempontból a gyáva nyúl csak abban különbözik a fogolydilemmától, hogy a felek nem a nagy vereséget (CD) tekintik a legrosszabb kimenetelnek, hanem az összeütközést (DD).

Folytatjuk...