A játékelmélet elemei és Neumann János

A játékelmélet elemei és Neumann János

0. Bevezető

Ez a rövid cikk alapvetően didaktikai szándékú és fő célja, hogy megmutassa a XX. század egyik legkiemelkedőbb magyar matematikusának, Neumann Jánosnak egy igazán világra­szó­ló ered­ményét, pontosabban az ahhoz vezető fő gondolatokat, amit ma „Minimax-tételnek” vagy a játék­­elmélet alaptételének is neveznek. A leírtak alapján akár egy középiskolai kísér­leti kipró­bálást is meg lehet szervezni, amit a szerző meg is tett évekkel ezelőtt több vidéki és fővárosi iskolában.

Két, nem csak a matematikus világban világ­hírűvé vált János született majdnem pon­tosan 100 év különbséggel a XIX. és a XX. században. Mindketten a világon valaha élt legjelentősebb matematikusok közé tartoznak. Ezért is fontos lenne az iskolában mindkettőjükről beszélni, hiszen magyar tanuló számára a matematika szó elhangzásakor legalább ezek a nevek be kellene, hogy ugorjanak. Egyikük Bolyai János (1802-1860), akinek a nem-euklideszi geo­metriát köszönhetjük, s amelynek iskolai be­­­­­mutatása először Lénárt István[1] gömb­je­ivel vált lehetővé. Bolyai elismerése tragikus élete során nem, csak halála után kezdődött, igaz azóta is töretlen. 

Eredménye a modern matematika egyik előfutárává tette, aki évtizedekkel meg­e­lőz­te korát. Ennek az úttörő szerep­nek a bemutatására egy tudomány­elméleti meg­közelítést vá­lasz­tó beszélgetésre utal­nék, a­mely Staar Gyula könyvében [1] ol­vas­ható a Tóth Imrével folytatott dialó­gus­ban. Munkásságának igazi jelentősége re­me­­kül kiviláglik Tóth matematika filozó­fi­a­i fejte­ge­téséből. Az olvasónak ajánljuk a beszélgetés megismerését.

Bolyai János és részlet egy kéziratából
. 
Bélyeg Neumann Jánosról, 1992-ből  
Másikuk a már említett Neumann Já­nos (1903-1957), aki a számítógép műkö­dé­­si elvének és mechanizmusának kidolgo­zása és megvalósítása (az ENIAC első szá­­mí­tógép) mellett nagyon sok alapvető ered­ményt ért el a matematikában és az el­mé­­­le­ti fizikában. Hozzá fűződik a Schrödin­ger-féle hullám-mechanika és a Heisenberg-fé­le mát­­rix-mechanika izomorfiájának igazolá­sa.
Ez egy nagyon mély eredmény, ma is csak a felsőoktatásban szerepelhet, ahol évtizedek óta egy másik nagy teljesítménye a játékelmélet is szerepel, lásd [3]. Ezúttal az utóbbiról szeret­nénk azt megmutatni, hogy hamarabb is előkerülhetne, már akár középiskolában is, bár termé­sze­­tesen csak egy egyszerű esetben. Ehhez első lépés egy ilyen játék ismertetése, amit a követ­kező fejezetben meg is teszünk.
 
1. Egy egyszerű játék a snóbli[2] alapján

 

Két játékos játszik úgy, hogy mindkettőnek két lehetősége van, vagy tesz egy pénzérmét a kezébe vagy nem. Majd mindketten előrenyújtják az összezárt kezüket és egyszerre kinyitják. Az első, nevezzük őt játékosnak, nyer, ha a két kéz szimmetrikus, azaz mindkettő üres vagy mindkettőben van egy-egy érem. A másik, B nyer, ha aszimmetrikus, azaz ha az egyikben van pénz­­érme, míg a másikban nincs. Abban is hasonlít a játék a snóblira, hogy a nyeremény a kezekben levő pénzérmék összege. De mivel, ha senki nem tett, akkor 0 lenne a nyeremény, ezért a pénzérmékhez a vesztes még egyet hozzátesz. Így az alábbi, ún. kifizetési mátrixszal írhatjuk le a játékot:

A játékos; B játékos téte 0 1
0 1 -2
1 -2 3

 A kérdések a következők:

  1. ) Milyen stratégiát kövessenek a játékosok?
  2. ) Igazságos-e a játék vagy valakinek kedvez?

A kérdések megválaszolását megelőzheti a játék kipróbálása, amelynek tapasztalatait a követ­ke­zőkben összegezzük.

2. A játék elemzése stratégiai szempontból

Mindkét játékos számára fontos, hogy kiismerhetetlen legyen a játéka, mivel ellenkező eset­ben veszteni fog, bármelyik szerepben is van. Pl. ha A tudja mit fog lépni B, akkor ugyanazt te­szi ő is, hiszen szimmetrikus esetben ő nyer. Ugyanez igaz B-re is, csak ő ekkor éppen ellen­kezőképpen fog cselekedni, s nyer. Azaz mindkettőjük számára fontos a kiismerhetetlenség. De hogyan is lehet a viselkedésem kiismerhetetlen? Ha véletlenszerű, hiszen ekkor nem tudja a másik, mi fog történni. Bármilyen rafinált determinisztikus stratégiával is játszom, egy idő múlva felismeri a másik, s meg tudja jósolni a következő lépésemet. A nem tét és a tét egy 0, 1 sorozattal írható le. Ha akár A, akár B felismer valami szabályszerűséget partnere 0, 1 soro­za­tában, akkor onnantól kezdve nyerni fog. Ezzel azonban még csak az első lépést tettük meg Neumann János gondolatmenetében. Itt jegyezzük meg azt, hogy a véletlennek egy lehetséges meghatározása éppen a bonyolultság segítségével lehetséges. Ha egy 0, 1 sorozatot nem lehet lényegesen rövidebb hosszúságú programmal leírni, mint a sorozat elemeinek száma, akkor mondjuk véletlennek sorozatnak. Ezzel ma egy új matematikai elmélet a bonyolultságelmélet foglalkozik, melyet nem meglepően éppen az a matematikus kezdeményezett Chatain amerikai kollégájával, aki a valószínűségszámítás matematikai megalapozását is elvégezte, azaz A. N. Kolmorogov[3]. Egy Lovásztól származó egyetemi jegyzet 6. fejezetében olvashatunk erről bővebben, lásd [4] 109. oldaltól.

A következő kérdés persze az, hogy milyen véletlen generátorral játsszak. Más szavakkal, mi le­gyen a „teszek a kezembe pénzt” vagy a „nem teszek” valószínűsége? Vajon léteznek-e o­lyan valószínűségértékek, amelyek „optimálisak” abban az értelemben, hogy a tőlük való el­té­rés hátrányos a játékos(ok)nak. Elemezzük a helyzetet. Ha a két játékos egymástól függet­le­nül p és q valószínűséggel tesz pénzérmét a kezébe, akkor az A játékos nyereményének várha­tó ér­té­ke a két egyelőre ismeretlen valószínűséggel a következőképpen írható fel:

(1)                         

Két dolgot használtunk fel, a várható (nyeremény)érték fogalmát, valamint az események függetlensége esetén fennálló szorzási szabályt. Tehát, hogy például A tesz és B nem tesz, annak esélye éppen   . Vizsgáljuk most meg ezt a kifejezést.

Egyúttal vegyük észre, hogy B várható nyereménye éppen , azaz amikor B nyere­mé­nye maximális, akkor A nyereménye minimális és fordítva, mivel pénzt csak egymástól nyer­nek el. Ha nincs se külső pénzforrás, se pénznyelő, akkor az ilyen játékokat szokás zérus­összegű játéknak nevezni, mivel a játékosok „nyereményeinek” összege mindig 0. Mielőtt to­vább vizsgálnánk a helyzetet, alakítsuk át (1)-et, a beszorzások elvégzésével és az egynemű ta­gok összevonásával adódik

(2)                    .

Iskolás feladat, hogy egy kifejezést alakítsunk szorzattá, lehetőleg úgy, hogy az egyik ténye­ző­ben csak a p, a másikban csak a q szerepeljen. Így kapjuk

(3)                  

Most kezdhetjük bemutatni Neumann János gondolatát, amelyben feltételezi, hogy mindkét játékos intelligens, s a számára legjobb megoldást képes választani. A feltételezi, hogy B na­gyon okos, tehát olyan q értéket választ, ami mellett nyeresége maximális, azaz A nyereménye minimális. Ezután jön a saját „okossága”, ami olyan p választást jelent, hogy a nyereménye maxi­mális legyen. Ezt úgy fejezhetjük ki, hogy keressük a következő kettős szélsőértéket: . Ugyanez B szemszögéből . Akkor van optimális megoldás mindkét játékosnak, ha a két szélsőértékhely egybeesik. Neumann éppen azt bizo­nyí­totta, hogy két játékos zérusösszegű játéka esetén mindig vannak olyan valószínűségek a döntési lehetőségeik halmazán, amely mindkettőjüknek a lehető legjobb. Ha ilyenkor a nyere­mény várható értéke 0, akkor igazságosnak mondjuk a játékot. Az optimumot az egység­négy­ze­ten ábrázolt felületet szemlélve, amit az  függvény grafikonja rajzol ki, érthető, miért hívjuk nyeregpontnak. Lásd a mellékelt két ábrát illusztrációként.

Neumann számára az ötletet, amelyből kiindulhatott, a Young-tétel adhatta, mely szerint a két­változós függvény változók szerinti parciális deriváltjainak esetében a deriválás sorrendje felcserélhető, formálisan: . Egyébként ezt a (2)-beli kifejezésünkön elvégez­ve is láthatjuk. Ha először p szerint deriválunk, a másik változót paraméternek véve, akkor kapjuk:  Ezt tovább deriválva, most q szerint, adódik 8. Ha fordított sor­rend­ben végezzük el a parciális deriválást, akkor első lépésben   adódik, s ezt most p szerint deriválva, szintén 8 lesz az eredmény.  A tételnek természetesen feltételei vannak, ame­lyek esetünkben teljesülnek. Ennek általában egy n változós analógiája szükséges, lásd a 3. pa­ragrafusát ennek a cikknek. Ezen túl azt is igazolni kell, hogy a szélsőérték az egység­négy­zet (egység-hiperkockába) belsejébe vagy legfeljebb a határára esik, mivel itt valószínűségek szerepelnek, melyek 0 és 1 közé kell, hogy essenek. Erre még visszatérünk.

Először vizsgáljuk meg a (3) kifejezést. Itt világos, hogy mivel a két paraméter külön­böző tényezőkben szerepel, látszik, hogy a másik játékától egy módon függetleníthetem ma­gam, ha a saját tényezőmet 0-vá teszem, mert akkor a szorzat a másiktól függetlenül 0 lesz. Azaz mindkettőnek ez célszerű választás (esetünkben p = 3/8 és q = 3/8), hiszen ilyenkor nem is kell a másikat figyelni. Azonban az is látható, hogy bármelyiküknek veszteséges lehet az ettől való eltérés, ha a másik elég intelligens. Akár A, akár B szempontjából elvégezhetjük az elté­rést a fentebb meghatározott p és q értéktől akár felfelé, akár lefelé. Egy esetet bemutatunk, a másik hármat az olvasó is elvégezheti. Tehát pl. A játékos felfelé eltér a p = 3/8 értéktől. Ezt, ha sokszor játszanak a megfelelő relatív gyakoriságból észreveszi B. Mivel neki a függvény mi­nél kisebb értéke a célja (ha A nyeresége minimális, akkor az övé maximális) ezért ő lefelé fog eltérni a  q = 3/8 értéktől. Ekkor mivel a szorzat negatív lesz (ezért tér el éppen ellentétes irányban, mint A) több, mint 1/8 lesz a nyeresége átlagosan partinként. Tehát ha A intelligens, akkor jobb, ha nem tér el felfelé a 3/8-tól. ugyanez igaz a lefelé eltérésre is. Ezért nevezzük ezt optimális értéknek számára. Hasonló érveléssel mondható el ez B-ről is. Azaz mindenféle mélyebb analízis ismeret nélkül, pusztán elemi algebrai okoskodással ebben az esetben meg­mu­tatható, hogy van mindkettő számára optimális valószínűség és ezzel játszva, a játék par­tin­ként átlagosan 1/8 egységet hoz B-nek. Tehát a játék nem igazságos. Ha választhatunk, ak­kor B szerepét kell kérnünk. Jó gyakorlás annak meggondolása, hogy a mi kifizetési mát­rixunk­ban egyetlen szám megváltoztatásával, hogyan lehetne elérni az igazságosságot.

Megjegyeznénk azonban egy „hamis okoskodást”, amellyel amellett lehetne érvelni, hogy ez volt az igazságos. B mindenképpen 2 egységet nyer, ha nyer. A átlagosan szintén 2 egységet, mivel 1 és 3 átlaga is 2. Ezért sokan igazságosnak gondolják a játékot. A hiba ebben a gondo­lat­ban az, hogy nem a p = ½ az optimális stratégia, ezért A nem az átlagot nyeri partinként átlagosan!        

3. Az egyszerű 2x2-es játék általánosítása és az alaptétel kimondása

A bemutatott és elemzett játék egyszerű általánosítása, ha nem csak két lehetőség van a játé­ko­sok számára, hanem több, pl. mindegyik tehet 1 vagy 2 vagy 3 érmét is. Ekkor mindkettő­nek 4 lehetősége van. Ehhez is kell egy kifizetési mátrixot rendelni, s akkor megkérdezhető, hogy ezúttal miként játszanak. Egy példát adjunk erre a következő mátrix segítségével, foly­tat­va a szimmetrikus A és az aszimmetrikus B játékos elvét és a pénzérmék össze­ge plusz egy elvet a nyeremény meghatározásához. Ezt követve kaphatjuk meg a következő kifizetési mátrixot vagy inkább táblázatot:

A játékos; B játékos téte  0  1  2  3
0  1 -2 -3 -4
1 -2  3 -4 -5
2 -3 -4 5 -6
3 -4 -5 -6 7

 

A nyeremény várható értékét kell itt is felírni, ahol az A játékos négy lehetséges választásának esélyei legyenek   ,míg hasonlóan a B játékoséi:  . Ezekkel a jelölésekkel kapjuk:

 (4)                

 továbbá       .

Azonban most lesz egy nagy nehézség az eddig bemutatott módszerrel kapcsolatban, nevezetesen most már legalább három p és q érték kell, azaz 6 ismeretlenes lesz a várható nye­re­mény-függvény, egyet a két feltétel miatt kifejezhetünk a többivel. Ennek szemlélte­té­sé­re egy hétdimenziós térre lenne szükségünk. Így a „nyeregpont” már nem látszik, ezért a szem­lé­letes megoldás kiesik, másrészt a fentebb leírt szorzattá bontás esetleg akár több tényezővel, de úgy, hogy ezek közül egyesek csak p-ket, mások pedig csak q-kat tartalmaznak, nem vezet ered­mény­­re. Már a kisebb háromszor kettes esetben is baj van, tehát ha csak az egyiknek van 3 le­he­tősége. Ezekben az esetekben már komolyabb eszközökre van szükség, amelyet ma ép­pen pl. a számítógépek segítségével lehet elvégezni. Az alaptétel szerint ilyenkor is van opti­má­lis valószínűség-eloszlás a lehetőségeink halmazán, amelytől sem A, sem B nem tér el, ha intelli­gens játékosok. Neumann tétele tehát az egzisztenciáról szól, ezt sikerült belátnia még 1928-ban megjelent cikkében [5]. A tétel  a következő:

Ha van egy kétszemélyes zérusösszegű játék, akkor mindig létezik mindkét játékos számára olyan optimális kevert[4] stratégia, amelytől való eltérés nem kedvező, azaz mindig létezik nyeregpontja a játéknak. Ez az ún. Minimax (Maximin)-tétel, vagy a játékelmélet alaptétele.

Az eloszlás numerikus kiszámítása azonban bonyolult feladat. Az egzisztenciát eredetileg topologikus módszerekkel sikerült Neumannnak igazolnia, mára azonban egészen más mód­sze­rek is létez­nek, amelyek közül egy már a Morgensternnel írt közös könyvben [3] is megje­le­nik. A téma tör­té­netét elég részletesen ismerteti Kóczy Á. László cikke [6], amelyben beszá­mol a máig nyúló fejlődéséről is. Csupán az érdekesség kedvéért je­gyez­zük meg, hogy végül a téma első Nobel- díjasa az a John F. Nash[5] lett, aki a nemkooperatív játékok egyensúlyi állapotainak  vizsgálata során végzett úttörő munkásságáért, főleg annak jelentős közgazda­sá­gi al­kal­mazásai miatt megosztva közgazda­sá­gi Nobel díjat kapott a magyar származású, Har­sányi Jánossal, valamint R. Seltennel 1994-ben. Ez a terület a Neumann-féle elmélet egyik általánosítása.

Emléktábla a Fasori Evangélikus Gimnáziumban

Milyen meglepő, hogy Harsányi János is éppen a legendás evangélikus Fasori Gimnáziumban tanult és érettségizett, mint Neu­mann, csak majdnem 20 évvel később. Mindkettejüket ma egy emléktábla örökíti meg az iskolában, a hasonlóképpen itt tanult Wigner Jenővel együtt. A szintén János kereszt­név viszont már talán igazi véletlen…

4. Didaktikai megjegyzés

Sokféle oktatási struktúrába illeszthetjük a bemutatott játékot. Lehet akkor foglalkozni vele, ami­kor már valószínűségszámítást tanultak a diákok (legalább a függetlenség esetén a szorzási sza­­bályt és a várható érték fogalmát is bevezettük már). Ekkor ezekre lehet hivat­kozni. Ebben az esetben egy modellezési feladatról van szó, amelyhez a szükséges matematika ismert, tehát alkalmazásról beszélhetünk. Van azonban másik lehetőség is, éppen a valószí­nűség­számítás tanulásának motiválása, amikor pl. az eloszlások és ezek várható értékének bevezetését szeret­nék megcélozni. Ekkor a bemutatott feladat már probléma és éppen az a célja a foglalkozás­nak, hogy a megoldáshoz milyen „elméletet” kell, hogy fejlesszünk. Ez az út sokkal időigé­nye­sebb, de a megértést és a motiváció által a tanulást is segítheti. Bármely lehetőséget is vá­laszt­juk, célszerű a játékot sokszor eljátszatni, amit időtakarékosságból lehet szabadidős te­vékenység terhére és nem a matematika óra idején folytatni. Ott már csak a megfigyelések összegzése történne. A szerző saját tapasztalatai szerint a véletlen stratégia szükségességére rájönnek a tanulók, azonban a következő lépésben segíteni kell, mármint, hogy mit jelent itt a véletlen szerepe és hogyan lehet „alkalmas” véletlent választani. Azaz a várható érték felírása átlagos tanulóknál (ahol a kísérlet folytatódott) segítség nélkül nem várható el. A megoldás is­me­retében a kérdés, hogy milyen esetben lenne igazságos, már nem nehéz, ha csak a főátló­ban változtathatunk és az 1-est nem így csak a 3-at lehet módosítani. Mivel jelenleg B-nek ked­vez a játék, A többet kell, hogy nyerjen, így 3-nál nagyobb szám kell. A számolás ellenőr­zé­sére közöljük a megoldást, amely talán meglepő, de éppen a 4.  

5. A játékelmélet további, iskolában is megmutatható alkalmazásai

Ehhez igen gazdag az irodalom, az első ilyen tárgyú munka a már említett Neumann és a közgazdász Morgenstern közös könyve [3]. Egy igazán gazdag tartalmú, didaktikailag is jól felépített és szerteágazó kapcsolatokat bemutató könyv Mérőtől származik [7]. Ebben kezdve a pszicho­lógiától, viselkedés-lélektani, társadalmi és biológiai példák mellett a kvantum­mecha­nika ilyen szemléletű bemutatása is szerepel. Az evolúciós biológia területén Dawkins  génekről írt könyve [8] tartalmazza annak leírását, hogy miként lehet az evolúció modelle­zé­sére ezt az elméletet sok esetben használni. Végül két, még az elmúlt század hetvenes évei­ben a Műszaki Kiadónál megjelent könyvet említenénk meg, melyek közül a későbbi [10]-ben még irodalmi alkalmazásokat is olvashatunk, így Sherlock Holmes a híres detektív és a bűnö­ző Moriarty „párbaját a vonaton”. Méltánytalanul elfeledett, pedig akár középiskolás diákok­nak is bátran ajánlható művekről van szó. Közülük a háromszerzős (egyikük Kemény János - már megint János! - magyar származású amerikai matematikus, aki a Basic nyelv kidolgozá­sá­val, Neumannhoz hasonlóan a számítástechnikában is jelentőset alkotott. Ő azonban a középiskolát már Amerikában járta ki, mivel az általános iskola elvégzése után  zsidó származású szüleivel az Egyesült Államokba menekültek.) Ebben a könyvben [9], elsősorban diszkrét matematikát és valószínűségszámítási témákat dolgoznak fel, mátrixok komoly alkalmazásá­val. Mégis elemi tárgyalásmódja lehetővé teszi a matematikában kevésbé jártas olvasónak is a megértést, s egyben a modern matematika egyes elemeinek közérthető bemutatását nyújtja, kiváló példát mutatva a népszerűsítésre és a matematika szélesebb közönséghez eljuttatására. Egyben nagyon alkalmas tanárok számára is néhány az iskolában korábban nem szereplő téma egy lehetséges tárgyalására. Azért említem meg, mert a témánkhoz tartozó feladatokat is találhatunk benne.         

6.  Irodalom

[1] Staar Gy. : A megélt matematika – beszélgetések. Gondolat Kiadó Budapest 1990

[2] Neumann, J.: A kvantummechnika matematikai alapjai. Akadémiai Kiadó, Budapest 1980

[3] Morgenstern, O., von Neumann, J. : Theory of Games and Economic Behavior. University Press Princeton 2004(Először 1944-ben jelent meg, mint a játékelmélet első monográfiája).

[4] Lovász, L.: Algoritmusok bonyolultsága. Egyetemi jegyzet, ELTE Matematikai Intézet A 2014-es változata elérhető: http://www.cs.elte.hu/~kiraly/alg.pdf

[5] Neumann, J. : Zur Theorie der Gesellschaftspiele. Mathematische Annalen, 100. 295– 320.   (1928)

[6] Kóczy Á., L. : A Neumann-féle játékelmélet. Közgazdasági Szemle, LIII. évf., 2006. január (31–45. o.) online: http://epa.oszk.hu/00000/00017/00122/pdf/02koczy.pdf

[7] Mérő, L.: Mindenki másképp egyforma. Tercium Kiadó 2007

[8] Dawkins, R.: Az önző gén. Gondolat 1986

[9] Kemeny, Snell, Thompson: A modern matematika alapjai. Műszaki Kiadó 1971 

[10] Williams J. D.: Játékelmélet. Műszaki Kiadó 1972

 

Vancsó Ödön, ELTE TTK


[1] Lénárt István már nagyon sok iskolában elterjedt eszközéről a Lénárt gömbről lehet egy videót megnézni a http://lenartgomb.hu/ honlapon.  

[2] Régi játék, amelyet akárhányan játszhatnak. Mindenki 0 vagy 1 vagy 2 egyforma (pl. 5 forintos) pénzérmét tehet a kezébe. A kezdő mond egy számot a kezekbe levő összes pénzérmék számának becslésére, az utána következő ha­sonlóképpen, de az előző által mondott szám már foglalt. Ezt folytatva mindenki mond sorban egy számot, amely a megelőzőkétől különböző kell, hogy legyen. Az nyer, aki eltalálja a pénzdarabok számának összegét, ha ilyen nincs, akkor az, aki a legközelebbi egész számot mondta. A nyeremény a kezekben levő összes pénzdarab. Döntetlen esetén feleznek (ami akkor lép fel, ha pl. összesen 7 pénzdarab van a kezekben, ezt a számot senki nem mondta, de van 6 és 8 is tippként).  

[4] Kevert stratégia azt jelenti, hogy nem az egyiket vagy a másikat választom szisztematikusan, hanem, véletlen szerint „keverem” a választásomat minden egyes partiban. Az egyes stratégiákhoz tartozó valószínűség­értékek­nek van mindig optimális választása, erről szól a tétel.

[5] Róla még egy kiváló könyv és annak filmfeldolgozása is született „Egy csodálatos elme” címmel.