Simonovits András: Neumann János és a játékelmélet
Ismert tény, hogy a játékelméletet nemcsak a közgazdaságtanban és a hadászatban, hanem a társasjátékokban és az evolúcióelméletben is alkalmazzák.
A cikkben négy kérdésre keresek választ.
1. Hogyan született a játékelmélet? 2. Mi volt a jelentősége a Neumann-Morgenstern-féle játékelméleti könyvnek? 3. Mi a Neumann-Morgenstern-hasznosságfüggvény? 4. Hogyan fejlődött a játékelmélet a könyv megjelenése óta?
Természetesen szeretnék minél közérthetőbb cikket írni, de kihasználva számos olvasónk matematikai képzettségét, nem mondok le néhány képlet és tétel bemutatásáról sem. A gazdag irodalomból kiemelem Nashar (1998) magyar nyelvre is lefordított, kiváló népszerűsítő könyvét és Eső (1995) nívós cikkét, amely ebben a folyóiratban jelent meg.
1. Hogyan született a játékelmélet?
Mindenekelőtt a játék fogalmát kell megadni. Egy anekdotával kezdem. Az 1950-es évek közepén, amikor a dogmatizmus szorításából szabaduló Marx Károly Közgazdaság-tudományi Egyetem legfelvilágosultabb oktatói felvetették, hogy a diákokat játékelméletre kellene tanítani, egy tudatlan tanár tiltakozott: az egyetem nem kártyaklub. Ma már minden elsőéves közgazdászhallgató tanul játékelméletet, és az oktatók legtöbbször szemérmesen elhallgatják, hogy a játékelmélet egyaránt foglalkozik társasjátékokkal és gazdasági, katonai, biológiai versengéssel is. Ahogy egy ragyogó áttekintő cikk megfogalmazta célkitűzését: a játékelmélet fejlődését a társasjátékoktól a társadalomtudományokig követte nyomon (Leonard, 1995).
Az egyszerűség kedvéért főleg a kétszemélyes játékokra szorítkozunk a cikkben. Egy játék két alakban adható meg: a) a stratégiai vagy normálalakban és b) az extenzív alakban.
a) Kezdjük a stratégiai vagy normálalakkal. A játékosok indexe i=1, 2, és az i-edik játékos az Ai absztrakt stratégiahalmazból egy tetszőleges aiÎAi stratégiát választhat. Mindkét játékos nyeresége, hasznossága függ saját és "partnere" (esetleg ellenfele vagy ellensége) választásától: a függést az A1´A2 halmazon értelmezett ui(a1, a2) skalárértékű függvény adja meg. A hagyományos közgazdaságtanban föltették, hogy a 2. játékos (a külvilág) olyan nagy, hogy annak az a2 döntése adott az 1. játékos számára, tehát az 1. játékosnak csupán az u1(a1, a2) függvényt kell maximalizálnia az első változó szerint. A játékelméletben ez nincs megengedve, tehát valamilyen egyensúlyi fogalmat kell keresnünk. Ennek a feladatnak a megoldása volt Neumann egyik érdeme.
b) Extenzív alakról beszélünk, ha feltesszük, hogy a játékok stratégiái lépésekből állnak, és a legegyszerűbb esetben mindkét játékos felváltva lép, mint a sakkban.
Leonard (1995, 732. o.) szerint a modern játékelmélet kialakulásának két oka volt. Az egyik ok a hilberti axiomatizálási program, amely az igazság keresése helyett a matematikai elmélet konzisztenciáját állította a kutatás központjába. A másik ok: belső igény a matematikai módszerek alkalmazására "szűz" területeken. Nem véletlen, hogy az első modern játékelméleti cikket a modern halmazelmélet egyik klasszikusa, Zermelo írta 1913-ban a sakkjáték matematikájáról, amely a fent említett extenzív alakban van megadva. Leonard szerint ez a felfogás főleg a német és a magyar matematikát jellemezte.
Ernst Zermelo, az első modern játékelméleti cikk írója
Tasnádi Attila hívta föl a figyelmemet Schwalbe-Walker (2001) és Ewerhart (2002) munkáira, amelyek pontosították Zermelo cikkének korábbi értékelését. A játékelméleti irodalom egy fél évszázadon át Zermelo tétele címén egy olyan eredményt emlegetett, amelyet nem is Zermelo fogalmazott meg, hanem a játékelmélészek által elfeledett Kőnig Dénes (1927) és Kalmár László (1928/1929), de valójában Kuhn (1953). Ennek a tévedésnek prózai oka volt: az amerikai játékelméleti iskola tagjai csak hozzávetőlegesen értették meg Zermelo, Kőnig és Kalmár németül megjelent eredményét.
A játék normálalakját a valós függvénytan és a modern valószínűség-számítás egyik óriása, Emile Borel vezette be. Több cikkben is (például Borel, 1921) elemezte a kétszemélyes zérusösszegű játékokat, ahol az egyik játékos nyeresége a másik vesztesége: u1(a1, a2)=-u2(a1, a2) minden stratégiapárra. Ez a feltétel teljesül a sakkban, a társasjátékokban (például a kártyajátékokban), de nem teljesül a közgazdasági "játékok" zömében (lásd később). A legegyszerűbb érdekes játék a fej, vagy írás: mindkét játékos egyidejűleg letesz az asztalra egy 100 Ft-os érmét. Ha azonosat tettek le (FF vagy II), akkor az 1. játékos elnyeri a 2. játékos pénzét; ha különbözőt tettek le (FI vagy IF), akkor a 2. játékos nyeri el az 1. játékos érméjét.
Ennek a nagyon fontos játéktípusnak cikkünk hőse, a pályakezdő Neumann János adja a teljes elemzését 1928-ban megjelent cikkében. Fő érdeme, hogy megfogalmazta e feladat egyensúlyi megoldását, és igazolta annak létezését. Pontosabb értelemben a következőről van szó.
Az 1. játékos bármilyen a1 stratégiát választ, a min a2ÎA2 u1(a1, a2) mennyiségnél többet nem kaphat, ha a 2. játékos vele szemben a legrosszabb indulattal van. Az 1. játékos ezt a mennyiséget akarja maximalizálni, azaz max a1ÎA1 min a2ÎA2 u1(a1, a2) értéket akarja elérni. Hasonlóan gondolkodik a 2. játékos is: az 1. játékos max a1ÎA1u1(a1, a2) maximális nyereményét akarja a minimumon tartani, azaz min a2ÎA2 max a1ÎA1 u1(a1, a2)-t akar elérni. Ha e törekvés mindkét félnek sikerül, akkor egyensúlyról beszélhetünk. (Szép-Forgó, 1974, 52. o.). Szabatosabban: minimax megoldásról beszélünk, ha teljesül a következő egyenlőség:
max a1ÎA1 min a2ÎA2 u1(a1, a2)=
=min a2ÎA2 max a1ÎA1u1(a1, a2)=v,
ahol v skalár a játék értéke.
A fej, vagy írás játékban azonban nincs minimax megoldás, legalábbis az eredeti stratégiatérben. Ebben semmi meglepő sincs, hiszen a játékban megadott stratégiák kiismerhetők az ellenfél számára. Ezen segít az ún. randomizálás, vagyis a kevert stratégiák alkalmazása: pl. az 1. játékos p valószínűséggel választ F-t és 1-p valószínűséggel I-t, ellenben a 2. játékos - az 1. játékos választásától függetlenül - q valószínűséggel választ F-t és 1-q valószínűséggel I-t, 0Łp, qŁ1. (A kevert stratégia hasznosságát már a XVIII. század elején is ismerték, lásd Osborne-Rubinstein, 1994, 51. o.) Könnyű belátni, hogy az 1. játékos nyeresége
u1(p, q)=
=pq+(1-p)(1-q)-p(1-q)-(1-p)q.
Igazolható, hogy a minimax megoldás p=q=1/2, és a játék értéke 0. Természetesen a tiszta stratégiák (F és I) olyan kevert stratégiáknak tekinthetők, amelyeknél a valószínűség-eloszlás elfajult, egyetlen egy tiszta stratégiára korlátozódik (p=0 vagy 1).
Neumann János ezt az egyszerű megfigyelést általánosította arra az esetre, amikor mindkét eredeti stratégiahalmaz véges sok stratégiából áll.
1. tétel. Minden kétszemélyes, zérusösszegű, véges sok tiszta stratégiából álló játéknak létezik legalább egy kevert minimax megoldása.
Megjegyzések
1. Természetesen a megoldás egyértelműsége általában nem igaz. Érvényes viszont a megoldások csereszabatossága: ha egy játéknak két különböző minimax egyensúlya létezik, pl. (a1*, a2*), és (b1*, b2*), akkor a belőlük képzett vegyes megoldások, például (a1*, b2*) vagy (b1*, a2*) szintén egyensúlyiak.
2. Figyelemre méltó, hogy a minimax megoldás létezésének bizonyításához Neumann egy meglehetősen bonyolult utat követett. (A Brouwer-féle fixponttételre támaszkodott: a véges dimenziós térben egy korlátos zárt halmazt önmagára leképező folytonos függvénynek van legalább egy fixpontja. Ezt a fontos tételt még a matematikus szakon sem tanították 1965-1970 között, amikor az ELTE-re jártam.) Azóta a Neumann-tétel bizonyítása jelentősen leegyszerűsödött, elegendő a véges kúpok elválasztó hipersíkjának létezésére vagy akár a lineáris programozásból ismert ún. Farkas-lemmára hivatkozni (vö. Prékopa, 1978 és Martinás, 1992).
3. Fizikus és tudománytörténész olvasók kedvéért idézzük Leonardot: nehéz elképzelni, hogy ne lett volna logikai kapcsolat a játékelmélet kevert stratégiái és az éppen megszülető kvantummechanika kevert állapotai között. (Az biztos, hogy Neumann írta meg - és éppen ebben az időben - a kvantummechanika első matematikai megalapozását!) A történeti érdekesség kedvéért megemlítjük, hogy a korábban idézett, extenzív játékokról szóló cikke megírásakor Kőnig kapcsolatban állt Neumann-nal, és Kalmár Kőniggel.
Távirati stílusban szólunk arról, hogy Neumann minimax tételének milyen jelentős tudományos hatása volt a játékelméleten kívül. A harmincas évek közepén a náci Németországból kiszoruló Neumann, aki a princetoni Institute for Advanced Studiesban Einsteinnel együtt kapott állást, többször látogatott Bécsbe, ahol Oskar Morgenstern osztrák közgazdász élénk közgazdasági szimpóziumokat szervezett, amelyeken többek között tevékenyen részt vett a modern matematikai statisztika egyik megalapítója, a szintén magyar származású Wald Ábrahám. Az egyik ilyen szimpóziumon Neumann bemutatta a közgazdaságtan első növekedési modelljét (Neumann, 1937), amely saját játékelméleti modelljét általánosította. A II. világháború során kifejlesztett lineáris programozás is szoros rokonságban áll a minimax tétellel. Ezekről a hatásokról bőven olvashatunk Bródy (1970), Szép-Forgó (1974) és Zalai (1999) tanulmányaiban. Itt csak egy érdekes magyar vonatkozásra térek ki. A korábban említett Kuhn - egy speciális lineáris programozási feladatról írt cikkében - a már szintén említett Kőnig német és a még említetlen Egerváry magyar nyelvű cikkéhez nyúlt vissza, s a nyelvi nehézségeket legyőzve a magyar szerzőjű forrásokból kifejlesztett egy algoritmust, amelyet magyar módszernek nevezett el (vö. Rapcsák, 2002, 3. o.).
Kőnig Dénes (1883-1944) |
Kalmár László (1905-1976) |
Emile Borel, aki a játék normálalakját bevezette |
Wald Ábrahám, a modern matematikai statisztika megalapítója |
2. Mi volt a jelentősége a Neumann-Morgenstern-féle játékelméleti monográfiának?
Már említettük, hogy Neumann 1933-ban Princetonban telepedett le. 1939 körül a Princetoni Egyetemen állást vállaló Morgensternnel együtt elhatározták, hogy megírják a játékelmélet első monográfiáját. A II. világháború lassította e munkát, hiszen Neumannra fontos szerep várt mind az alkalmazott matematikai kutatásokban (atombomba-készítés), mind az elektronikus számítógép kifejlesztésében. Az akadályok ellenére a könyv 1944-ben megjelent, és azonnal bombaként robbant.
A könyvből csupán egy új fogalmat körvonalazok: a Neumann-Morgenstern-megoldások kérdéskörét. Míg a minimax megoldás a nemkooperatív játékokról szólt, ez a kooperatív játékokról.
A koalíciós vagy kooperatív játékelméletben N játékos van, halmazukat jelölje N={1, 2, , N}. Legyen S az N halmaz egy tetszőleges nem üres részhalmaza, amelyet koalíciónak nevezünk, s legyen S a részhalmazok halmaza. Ekkor a játék egy v értékfüggvénye a koalíciók S halmazán definiált skalárértékű függvény, és v(S) megmondja, hogy az S koalíció mennyi értéket tud magának biztosítani. Például egy egyszerű többségi szavazási játékban minden többségi koalíció értéke 1, a többié nulla.
Föltesszük, hogy két idegen koalíció, S és T együtt legalább annyira képes, mint külön: v(S+T)łv(S)+v(T). Tegyük föl, hogy minden koalíció képes szétosztani tagjai közt a koalíciós értéket: xS jelölje azt az N dimenziós vektort, amelynek a megfelelő helyein egy xi skalár áll, s ennek értéke annyi, amennyit a koalíció i-edik tagja kap, egyébként 0. Az xS vektor elemeinek összege v(S). Természetes feltevés, hogy a koalíció minden tagja legalább annyit kapjon, mint amennyit egymaga ér: xiłv({i}). Ha bármely S és T koalícióra vonatkozó egyenlőtlenségben egyenlőség áll, akkor az egytagú koalícióra vonatkozó egyenlőtlenségben is egyenlőség áll, ezt hívjuk érdektelen esetnek. Felvetődik a kérdés: milyen értékfüggvények léteznek akkor, ha kizárjuk az érdektelen esetet?
Mindenekelőtt bevezetjük a következő definíciót: az x elosztás dominálja az y elosztást az S koalícióra nézve, ha az S koalíció minden tagja jobban jár x-szel, mint y-nal: xi>yi ,ha iÎS.
Neumann-Morgenstern a következő megoldásfogalommal próbálkozott (Szép- Forgó, 1974, 6.2. alfejezet). Az elosztások X halmazának Y részhalmazát stabilnak nevezzük, ha kielégíti a következő két feltételt.
Belső stabilitás: ha yÎY, akkor nem létezik olyan zÎY, amelyre létezne olyan S koalíció, amelyre nézve z jobb, mint y.
Külső stabilitás: ha zÎX-Y, akkor létezik olyan yÎY, amelyre y jobb z-nél S-re.
A definíció eléggé bonyolult, és látni fogjuk, hogy nem vált igazán népszerűvé.
3. Mi a Neumann-Morgenstern-hasznosságfüggvény?
Talán a leggyorsabb sikert a Neumann-Morgenstern-hasznosságfüggvény bevezetése hozta, ezért ezzel a területtel külön pontban foglalkozunk (Varian, 1992, 11. fejezet). Az FI-játékban magától értetődőnek tekintettük, hogy egy kevert stratégiapár hasznossága a tiszta stratégiapárok hasznosságának a várható értéke (a várható hasznosság tétele). Pedig ez a feltevés a legkevésbé sem magától értetődő, és erről a tudósok már a Daniel Bernoullitól származó szentpétervári paradoxon óta, 1735-től tudtak. A szerzőpáros - és mindenekelőtt Neumann - e kérdéskör tárgyalásakor egy zseniális megoldáshoz, az axiomatikus módszerhez folyamodott.
A közgazdaság-tudományban már régóta küszködtek a közönséges hasznosságfüggvény kérdésével. Az ún. neoklasszikus közgazdaságtan kiindulópontja szerint minden egyénnek van egy választási halmaza, jele X, amely a legegyszerűbb esetben a sík pozitív negyede, x=(x1, x2)>0. Ezen a halmazon definiálva van egy u(x) (xÎX) skalárértékű hasznosságfüggvény. A fogyasztó célja: a hasznosságfüggvény maximalizálása. Az egyszerűség kedvéért most föltesszük, hogy a választási halmaz csak olyan választásokat foglal magában, amelyeket az egyén meg tud valósítani (például van elég pénze hozzá, hogy a választás költségét fedezze). Ugyancsak természetes feltevés, hogy minél többet választunk, annál nagyobb a hasznosságunk: u(x) mindkét változóban növekvő függvény.
Az első nehézség: nemcsak egy hasznosságfüggvény jellemez egy fogyasztót, hanem végtelen sok, s ezek ekvivalensek egymással. (Hasonlóan ahhoz, hogy sokféle ekvivalens hőmérsékleti skála képzelhető el.) Legyen T egy növekvő skalár-skalár függvény, akkor T[u(x)] is ekvivalens hasznosságfüggvény. Például ha u>0, akkor u2 is ekvivalens. Azt mondhatjuk, hogy mindkét hasznosságfüggvény ugyanazt a preferenciarendezést képviseli, amelynek jele: xńy, akkor és csak akkor, ha u(x)>u(y).
A második nehézség a bizonytalanság melletti választásnál vetődik föl, s ezt a lottóhúzáson lehet a legjobban szemléltetni. Ismert, hogy Magyarországon minden héten több millió ötöslottó-szelvényt vesznek, amely a szerencsés kisebbségnek nyereményt, a többségnek pedig semmit sem fizet. Tegyük föl, hogy csak egyféle nyeremény van, amelynek nagysága G, valószínűsége p. Legyen egy szelvény ára C, és az állam lottószelvényenkénti várható bruttó bevétele R; ekkor nyilvánvalóan teljesül, hogy C-pG=R>0. Ha a lottózó u hasznosságfüggvényére igaz a várható hasznosság tétele, akkor egy W vagyonú személy számára, aki lottószelvény nélkül u(W) hasznosságot élvez, egy szelvény vétele utáni várható hasznossága pu(W+G-C)+(1-p)u(W-C). Az illető csak akkor vesz szelvényt, ha a fenti hasznosságkombináció értéke nagyobb, mint a tartózkodásé: pu(W+G-C)+
+(1-p)u(W-C)>u(W). Azt láthatjuk, hogy egy olyan személyre, akinek a hasznosságfüggvénye lineáris, nem igaz ez az összefüggés, hiszen ekkor (egységnyi szorzóval számolva) az egyenlőtlenség az összevonások után a következő alakot ölti: pG-C>0, s ez ellentmond az állami lottóbevételek pozitivitásának.
A bevezető példa után rátérünk az axiomatikus megoldás vázolására. Tekintsük a választások X halmazát, és vezessük be két elem, x és y p és 1-p valószínűségű véletlen kombinációját: z=px+(1-p)y:p valószínűséggel kapjuk x-et és 1-p valószínűséggel y-t. Feltesszük, hogy a kibővített, kevert választások X halmazán is létezik egy rendezés, amely kielégít bizonyos természetesnek látszó tulajdonságokat.
a) A kombinációk rendezése logikus, követi a valószínűség-számítás törvényeit. Például x ekvivalens px+(1-p)x-szel.
b) Ha egy választás előnyösebb, mint egy másik, akkor egy harmadik választás hozzákeverése nem változtat a rendezésen: ha xńy, akkor px+(1-p)zńpy+(1-p)z.
c) Az x-nél előnyösebb választások halmaza nyílt.
A technikai bonyodalmak elkerülése végett egy felesleges axiómát is becsempészünk a tárgyalásba:
d) Van egy legjobb (b) és egy legrosszabb választás (w), és bármelyik p és q valószínűségre a pb+(1-p)w kombináció akkor és csak akkor jobb, mint qb+(1-q)w, ha p>q.
Igaz a
2. tétel. A fenti feltevések mellett létezik lényegében egyetlen egy olyan u hasznosságfüggvény, amelyre a kevert választások hasznossága egyenlő a hasznosságok várhatóértékével: u(px+(1-p)y)=pu(x)+ (1-p)u(y).
Bizonyítási ötlet. Legyen u(w)=0 és u(b)=1 (ezzel ugyanúgy normalizáljuk a hasznosságfüggvényt, mint ahogyan Celsius a víz fagyás- és olvadáspontjának megválasztásával normalizálta a Celsius-skálát). Az axiómák szerint létezik olyan p valószínűség, amelyre x és pb+(1-p)w ekvivalens, tehát célszerű az u(x)=pu(b) definícióval próbálkozni. Igazolható, hogy ez a választás eleget tesz az axiómáknak.
Az elmondottak fényében érthető, hogy mind a játékelméletben, mind a közgazdaságtanban nagyon népszerű a Neumann- Morgenstern-hasznosságfüggvény. Arra a kérdésre, hogy a valóságot mennyire írja le az axiómarendszer, még visszatérünk.
4. Hogyan fejlődött a játékelmélet a könyv megjelenése óta?
Természetesen egy ilyen rövid alkalmi cikkben nem adhatunk részletes választ erre a kérdésre sem, csupán a legfontosabb fejleményekre szorítkozunk.
Az első könyvismertetések nagyon optimisták voltak: sokan abban reménykedtek, hogy a frissen megszületett játékelmélet minden társadalomtudományi kérdés modellezésére receptet kínál. A valóság azonban rácáfolt a várakozásokra: több évtizednek kellett eltelnie addig, amíg a játékelmélet a társadalomtudományok és a biológia nélkülözhetetlen eszközévé vált. És a fejlődés jelentős mértékben eltért a Neumann által remélt iránytól.
a) Az első jelentős fejlemény Nash megjelenéséhez kapcsolódik. Az alig 21 éves doktorandusz pár hónap alatt megtette azt a lépést, amelyre Neumann-nak és kisszámú követőjének 20 év is kevés volt: megteremtette az n személyes nemkooperatív játékok elméletét (vö. Nash, 1951). Mindenekelőtt a minimax megoldás helyett az azóta róla elnevezett Nash-egyensúlyt vezette be: az (a1*, a2*)ÎA stratégiapárt Nash-egyensúlynak nevezik, ha egyik játékosnak sem érdemes eltérnie e stratégiától, feltéve, hogy a másik játékos követi e stratégiát: u1(a1*, a2*)łu1(a1, a2*) minden a1ÎA1-ra és u2(a1*, a2*)łu2(a1*, a2) minden a2ÎA2-re.
Hangsúlyozzuk, hogy ha mindkét játékos eltér az egyensúlytól, lehetséges, hogy mindketten jobban járnak, mintha egyensúlyban maradnának; ám nincs rá garancia, hogy a másik fél is a társadalmi optimumot választja. (Például egy egyszerű közlekedési modellben a Nash-egyensúlyban nem érdemes udvariasan vezetni, mert valaki jobban jár, ha nem viszonozza az udvariasságot; de ha mindenki udvariasan vezetne, akkor mindenki jobban járna!)
Könnyű belátni, hogy a kétszemélyes zérusösszegű játékok esetében a Nash-egyensúly a minimax megoldást adja, és nem ilyen játékok esetében is értelmes a definíció: a játékosok száma közömbös. A Neumann-féle egzisztenciatétel ilyen általánosságban is igaz, sőt a véges számú tiszta stratégia feltevése nagyban általánosítható, például eleve "kontinuumdimenziójú" stratégiahalmazokra. S az általános eset bizonyításánál már szükség van a Neumann által használt Brouwer-féle fixponttételre.
Egyetlen komoly veszteség ér bennünket az általánosítással: ellentétben a Neumann-esettel, általában nem teljesül az egyensúlyok csereszabatossága: ha egy játéknak két különböző Nash-egyensúlya létezik, akkor a belőlük képzett vegyes párosok általában nem adnak egyensúlyt.
Nashar (1998, I. rész) részletesen ismerteti Neumann elutasító magatartását Nash korszakalkotó újításával szemben. Két oka is lehetett az elutasításnak: egyrészt Neumann-nak nem tetszett a Nash-elképzelés mögött meghúzódó "túlzott" individualizmus, európai szelleme számára a koalícióépítés fontosabbnak tűnt, másfelől Neumann gyakran nem volt nagyvonalú, nem karolt föl minden tehetséget.
b) Ahogyan a Nash-egyensúly fogalma egyre inkább tért hódított a különféle tudományokban, egyre zavaróbb lett, hogy e fogalom túl sok egyensúlyt enged meg. A kutatók azóta is próbálják a megoldások finomításával eltüntetni a határozatlanságot (vö. Selten, 1975), ám ezek a kísérletek legalább annyi kérdést vetnek föl, mint amennyit megválaszolnak.
c) Az alkalmazásokat gyakran megnehezítette az a feltevés, hogy a játékosok tökéletesen ismerik egymás stratégiahalmazát és hasznosságfüggvényét. Ezt a feltevést iktatta ki Harsányi János 1967-68-ban publikált cikkhármasában (vö. Eső, 1995), ahol feltette, hogy az egyes játékosoknak valószínűség-eloszlásuk van a másik játékos lehetséges típusáról, és erre az általánosabb esetre is alkalmazható a Nash-egyensúly. Az a)-c) pontok kidolgozásáért a svéd akadémia Nashnek, Seltennek és Harsányinak az 1994-es közgazdasági Nobel-emlékdíjat adományozta.
d) A biológiai érdeklődésű olvasókat különösen érdekelheti az evolúciós játékelmélet (pl. Maynard-Smith, 1974), amely gyengíti a játékosok racionalitására vonatkozó szigorú feltevéseket, és segít a számos Nash-egyensúly közti választásban is. Erről az elméletről részletesebben is szólok. Képzeljünk el egy egynemű (állati vagy emberi) populációt, amelynek tagjai páronként találkoznak egymással. Mindkét egyed stratégiahalmaza azonos: A1=A2=A, hasznosságfüggvényük szimmetrikus egymásra: u1(a, b)=u2(b, a)=u(a, b), és ez utóbbi az egyed életképességét méri, ha az 1. játékos stratégiája a, a 2.-é pedig b. Olyan egyensúlyi fogalmat keresünk, amelyben egy kis valószínűséggel megjelenő mutáns képtelen fennmaradni. Legyen e egy kicsiny pozitív szám, és tegyük föl, hogy a populáció e része tetszőleges bÎA mutáns stratégiát követ a "maradék" 1-e rész által követett egyensúlyi b* stratégiával szemben. Ekkor a mutáns várható hasznossága eu(b, b)+(1-e)u(b, b*), míg a többieké eu(b*, b*)+(1-e)u(b, b*). A b* stratégiát evolúciósan stabilnak nevezzük, ha megfelelően kicsiny e-okra a mutáns várható hasznossága kisebb, mint a többié:
eu(b, b)+(1-e)u(b, b*)<
<eu(b*, b*)+(1-e)u(b, b*), bąb*.
Belátható, hogy ez az egyenlőtlenség akkor és csak akkor teljesül, ha
u(b, b*)<u(b*, b*) vagy u(b, b*)=u(b*, b*) és u(b, b)<u(b*, b).
Figyeljük meg, hogy az első egyenlőtlenség szerint (b*, b*) a szimmetrikus játék szimmetrikus, szigorú Nash-egyensúlya.
Az irodalom kedvenc példája a héja-galamb viselkedésről szóló játék, amelyben megfelelő paraméterértékek esetén egyetlenegy evolúciósan stabil stratégia létezik, amely kevert.
Az evolúciós játékelméletben szerepel a replikátordinamika, amelyben a különböző tiszta stratégiákat játszó egyedek induló eloszlása adott, és az átlaghasznosság fölötti többlethasznossággal arányos a sikeres stratégiák súlyának időbeli növekedése. Dinamikus rendszerek elméletét alkalmazva megállapítható, hogy a rendszer stacionárius állapota stabil-e, s ha igen, akkor milyen tulajdonságú Nash-egyensúly.
e) A 3. pontban említett Neumann-Morgenstern-féle hasznosságfüggvény bekerült a középszintű közgazdasági tankönyvekbe is (vö. Varian, 1999/2001, 12. fejezet). Ugyanakkor számos közgazdász rámutatott e hasznosságelmélet életidegenségére. A pszichológiai érdeklődésű olvasók számára megemlítjük, hogy szinte mindegyik axióma sérül a gyakorlatban. Például a szintén Nobel-díjas Allais (1953) cikke - nagyon korán - kísérleti úton jelezte, hogy még a legracionálisabbnak tartott, üzletembernek tanuló diákok között is igen gyakori, hogy nem tudnak szabadulni a "csomagolástól": döntésüket befolyásolja, hogyan vannak feltéve a kérdések. (Egy egyszerű példa is megteszi. Melyik gyógyszert választja: amelyik 400 beteg közül 200-at megment, vagy amelyik 400 beteg közül 200 emberen nem tud segíteni? Sok ember nem látja át, hogy a két gyógyszer azonos hatású.) Szintén Neumann távlatos hatásáról tanúskodik, hogy Kahnemann alternatív döntési modellek kidolgozásáért (Kahnemann-Tversky, 1979) kapott megosztott Nobel-díjat 2002-ben (a társszerző Tversky ekkor már nem élt).
f) Neumann szándékaival ellentétesen, a kooperatív játékelmélet egyre inkább háttérbe szorult. Különös módon a Neumann- Morgenstern-monográfiában bevezetett megoldásról kiderült, hogy gyakran nem is létezik (Lucas, 1968). Itt sem veszett azonban kárba Neumann eredeti ötlete. Legkedvesebb játékelméleti tanítványa, a Nobel-díjra javasolt Shapley cikkében (1953) megadott egy értékfüggvényt, amelyet a Neumann-Morgenstern-féle hasznosságfüggvényhez hasonló módszerrel, axiomatikusan vezetett le (Szép-Forgó, 1974, 6.3. alfejezet). Itt is egy köznapi példával szemléltetem a kérdéskör költségmegosztási alkalmazását (Simonovits, 1980). Két ember A pontból B, illetve C pontba akar egy közös taxival eljutni. Egyszerűség kedvéért tegyük föl, hogy nincs kiállási költség, a B pont felezi az AC közti legrövidebb utat, és a taxiköltség arányos a megtett úttal. Kérdés: hogyan ossza meg a két utas méltányosan a taxiköltséget? A választ a Shapley-érték adja meg: a B-be tartó utas a teljes AC-költség 1/4-ét, a C-be tartó utas pedig a 3/4-ét fizeti ki, mert a közösút-költséget felezik. Figyeljük meg, hogy itt a kétszeres útért a C-be tartó utas háromszor annyit fizet, mint a B-be tartó. (Ne próbáljuk ezt az elvet az Egyesült Államokban alkalmazni, mert ott az első utasnak ki kell fizetnie a teljes AB-költséget, és a második utasnak a teljes AC-költséget!)
Harsány János | John F. Nash | Reinhard Selten | Lloyd Shapley |
Összefoglalás
Neumann János a tudomány számos területén hozott létre kiemelkedő alkotást, igazi polihisztor volt, az Arkhimédész, Newton, Leibniz, Daniel Bernoulli, Euler, Gauss stb. sor talán utolsó tagja. Bízvást mondható, hogy neves elődök félénk lépéseit követve Neumann hozta létre a játékelméletet. Igazolta a minimax tételt a kétszemélyes zérusösszegű játékokra. A játékelmélet első monográfiájában, amelyet Morgensternnel együtt írt, jelezte a fontosabb kérdéseket. Morgenstern segítségével megalkotta a róluk elnevezett hasznosságfüggvényt. A játékelmélet princetoni iskolájának tagjai (Kuhn, Nash és Shapley) az ő köpenyéből bújtak ki. Túlzás nélkül állíthatjuk, hogy ha nem halt volna meg olyan fiatalon, akkor az 1969-ben létrehozott közgazdaság-tudományi Nobel-díjat elsők közt kapta volna meg, részben a játékelmélet kidolgozásáért.
Forrás: Természet Világa (150 éves!)
Kapcsolódó posztok: Erény és ármány