Teorija igara i osnovne vrste igara SEMINARSKI RAD
1
SADRŽAJ: 1. Teorija igara ...............................................................................................................................1. 2. Osnovne karakteristike i vrste igara ...........................................................................................2. 3. Proste matrične igre ...................................................................................................................4. 4. Matrične igre sa mešovitim strategijama ...................................................................................8. 5. Dodatak ....................................................................................................................................10.
2
1. Teorija igara Najveći broj modela koji su predmet razmatranja kvanititativne analize ekonomskih pojava jesu modeli u kojima postoji samo jedan donosilac odluka. Postojanje samo jednog donosioca odluka u ovim modelima podrazumeva da se svi potencijalni subjekti koji bi u oblasti ponašanja donosioca odluke imali suprotne interese u odnosu na njega, smatraju egzogenim elementima modela i predstavljaju ograničavajućim uslovima za ostvarenje unapred definisane funkcije cilja. U takvim slučajevima, uobičajeno, na osnovu rešavanja pogodno odabranih modela donosilac odluke poznaje moguće alternativne rezultate svojih različitih odluka i u skladu s tim se ponaša. Ne postoje, dakle, drugi subjekti koji direktno utiču na rezultat odluke, kao što i ne postoje subjekti koji se nalaze u sukobu interesa sa donosiocem odluka. Ovakav pristup u modeliranju ekonomskih aktivnosti isključuje mogućnost matematičkog opisivanja i rešavanja situacija u kojima postoje suprostavljeni interesi ekonomskih subjekata. Takve situacije obuhvataju sve one slučajeve ekonomskog (poslovnog) ponašanja u kojima se dva ili više ekonomskih subjekata nalaze u konfliktnim odnosima, iz kojih žele ostvariti za sebe što povoljniji rezultat. Tako, na primer, neko proizvodno preduzeće u postupku definisanja svojih planova prodaje mora voditi računa o potencijalnim potezima preduzeća konkurenta koji na tržiste izlaze sa sličnim ili istim proizvodnom, koji takođe iz svog tržisnog nastupa žele da ostvare sto povoljniji finansijiski rezultat (veći profit). Osim navedenog, u domenu poslovnog odlučivanja na nivou preduzeća u uslovima razvijene tržisne privrede veoma često se mora voditi računa o potencijalnom ponašanju ekonomskih subjekata (tržiste, banke, konkurentska preduzeća, potrošaci, itd.) sa kojima se to preduzeće nalazi u odnosima izraženog sukoba interesa. Pri tome, nijedan od ekonomskih subjekata ne može u potpunosti kontrolisati rezultate svojih odluka, zato što i suprotstavljena strana takođe odlučuje u uslovima nepoznavanja odluka ‘protivnika’ . Teorija igara predstavlja matematičku teoriju i metodologiju koja se koristi za analizu i rešavanje konflitknih situacija u kojima učesnici imaju suprostavljnje interese. Razmatranje situacija u kojima dva ili vise subjekata donose odluke u uslovima sukoba interesa nazvano je teorijom igara zato što tipične primere ovakvih situacija predstavljaju različite društevene igre kao što su: sportske utakmice, karataške igre (poker, bridž, i sl.), šah, itd. Naravno, iako je veći deo termina koji se koriste u okviru matematičke teorije igara sličan terminologiji društvenih igara, teorija igara ima mnogo širu primenu i koristi se za modeliranje konfliktnih situacija u matematici, politici, ekonomiji, vojnoj strategiji, itd. Pri tome neophodno je istaći da metodi torije igara služe za analizu i rešavanje takvih konfliktnih situacija koje karakteriše višekratno ponavljanje pojednih odluka o mogućem razrešenju sukoba interesa između učesnika tj. igrača. Prvi radovi iz domena teorije igara datiraju još iz prve polovine devetnaestog veka, od radova Cournot-a i Bertrand-a, koji su nagovestili mogućnost korišćenja teorije igara za potrebe ekonomske analize, posebno u analizi proizvodnje i cena. Međutim, ideju opšte teorije igara na teorijiski konzistentan način prvi su predstavili John von Neumann i Oskar Morgenstern 1944. godine u svom fundamentalnom radu ‘Teorija igara i ekonomsko ponašanje’ . U tom radu pokazano je da se mnogi ekonomski problemi mogu veoma uspešno modelirati korišćenjem teorije igara i predstavljene su igre u ekstenzivnoj i normalnoj formi. U posleratnom periodu razvoj i usavršavanje skoro nijedno područje ekonomske analize i matematičkog modeliranja nije ostvrilo toliku ekspanziju i razvoj kao što je to slučaj sa torijom igara. Najznačajniji predstavnik posleratne teorije igara je John Forbes Nash, Jr koji je za svoj rad u oblasti teorije igara na Princeton univrezitetu dobio Nobelovu nagradu 1994. godine. O John Nashu je 2001. god snimljen biografski film Blistavi um u kojem se opisuju pojedinosti iz života ovog naučnika.
2. Osnovne karakteristike i vrste igara 3
Da bi korišćenjem odgovarajućeg modela mogli analizirati konfliktnu situaciju, neophodno je izvršiti takvo uprošćavanje koje omogućava uključivanje u razmatranje samo najznačajnijih faktora koji utiču na mogući ishod konflikta. Zbog toga, možemo reći da igra predstavlja uprošćeni model konflikta koji obuhvata ukupnost pravila ponašanja učesnika u igri (igrača), koja opredeljuju njihove moguće poteze kao i potencijalne rezlutate njihovog izbora. Igrači tj. učesnici u igri, mogu biti pojednici, grupe pojedinaca, preduzeća, vojne formacije, itd. Pri tome cilj svakog od učesnika u igri jeste da postigne u igri takvo rešenje koje mu obezbeđuje ostvarenje najpovoljnijeg mogućeg rezultata. Potencijalne rezultate igrača učesika, odnosno ishod igre obično predstavljamo tzv. funkcijom plaćanja koja predstavlja numerički izraz dobitka odnosno gubitka učesnika neke igre. Pravila koja nalaže igra definišu način delovanja svakog od učesnika odnosno svako delovanje igrača u okviru igre predstavlja određenu vrstu strategije. Strategije predstavljaju ukupnost pravila ponašanja igrača i potencijalne rezultate izbora pojedinih alternativa u svakoj konkretnoj situaciji. Očigledno, strategija predstavlja centralni pojam ukupne teorije igara, kojom se unapred definišu mogući izbori različitih alternativa od strane igrača za koje se oni mogu opredeliti u svim mogućim varijantama igre. Svaka igra se realizuje preko pojedniačnih poteza igrača, pri čemu potez predstavlja jedan izbor moguće alternative od strane igrača. Skup većeg broja poteza predstavlja partiju. Postoje različite vrste igara, pri čemu se kao kriterijumi za klasifikaciju igara obično uzimaju sledeći kriterijumi: broj igrača, broj strategija, karakter funkcije plaćanja i međusobna povezanost igrača. Zavisno od broja igrača učesnika, sve igre delimo na igre sa dva lica, igre sa tri lica, ..., igre sa n lica. Za realizaciju neke igre, odnosno postojanje odnosa konflikta ( ili kooperativnosti), neophodno je učešće najmanje dva lica. Postojanje tri ili više učesnika u igri otvara mogućnost stvaranja tzv. koalicija, tj. mogućnost da se dva više igrača usklađujući svoje interese koordinisano opredeljuju u izboru strategija. Ukoliko svakom od igrača u igri stoji na raspolaganju konačan broj strategija, tada se radi o tzv. konačnoj igri. U suprotnom slučaju, kada broj strategija igrača nije ograničen, igra predstavlja beskonačnu igru. Prema karakteru funkcije plaćanja sve igre delimo na igre sa nultom i igre sa nenultom sumom. Igra sa nultom sumom predstavlja takvu igru u kojoj je suma ukupnog plaćanja jednaka nuli, tj. ukupan dobitak jednog ili više igrača je jednak ukupnom gubitku “poraženih” igrača. Tipičan primer za ovakvu vrstu igre jeste igra pokera, u kojoj je ukupna suma plaćanja jednaka nuli. Nasuprot ovome, u igrama sa nenultom sumom, u kojima se obično prepliću odnosi konflikta i kooperacije igrača, suma ukupnog plaćanja je različita od nule. Na primer, u igri lutrije organizator zadržava za sebe deo ukupnog dobitka. Zavisno od međusobnog odnosa igrača učesnika, sve igre delimo na kooperativne i nekooperativne. Kooperativne igre predstavljaju takvu vrstu igara u kojima igrači formiraju koalicije koje im služe za međusobno usklađivanje ponašanja i izbor pojedinačnih strategija koje im obezbeđuju postizanje najpovoljnijih rezultata. Ukoliko u toku igre ne postoji koordinacija u ponašanju ( izboru poteza ) od strane igrača, takva igra predstavlja nekooperativnu, tj. antagonističku igru. Za potrebe matematičkog modeliranja, analize i rešavanja, igra može biti predstavljena na različite načine. Jedan postupak primenjuje se za igre kod kojih ne postoji potpuna informisanost 4
igrača o potencijalnim odgovorima protivnika na njihov izbor pojedinačnih strategija. Za takve igre je karakteristično da se rezultat svih poteza u toku neke igre obračunava tek na kraju igre, kada se obavi predviđeni broj poteza, odnosno realizuje jedna partija. Ovakva vrsta igre, koju koju nazivamo igrom ekstenzivnog (opšteg) oblika, predstavlja se obično preko odgovarajućeg stabla igre, u kome se predstavljaju odabrani potezi igrača. Tipičan primer ovakve igre jeste poker. Takođe, pregovaračke igre, kao specijalna vrsta igara prikazuju se grafičkim putem, tzv. funkcijom koalicije, u prvom kvadrantu koordinatnog sistema. Upravo o ovoj vrsti igara biće više reči u narednom poglavlju. Drugi postupak predstavljanja i analiziranja igreprimenjuje se u situaciji tzv. pune informisanosti o potencijalnim rezultatima odabranih strategija od strane igrača. Kod ovakve vrste igre, koju nazivamo igra u normalnoj (matričnoj) formi, za sve alternativne kombinacije odabranih strategija od strane igrača unapred su poznata plaćanja, odnosno rezultat igre. Na primer, kod konačne igre dva lica sa nultom sumom, ova plaćanja (funkcija plaćanja) predstavljena su matricom plaćanja u kojoj su predstavljeni rezultati koji će biti ostvareni izborom različitih mogućih kombinacija parova strategija od strane dva igrača, učesnika u igri.
3. Proste matrične igre 5
Postoji više različitih klasifikacija igara zavisno od kriterijuma koji je uzet u obzir. Medutim, razmatranje suštine teorije igara najčešce počinje razmatranjem prostih matričnih igara odnosno strogo determinisanih igara. Analizirajmo igru dva igrača sa nultom sumom u normalnoj formi, za slučaj kada svakom od igrača stoji na raspolaganju određeni, konačan broj strategija. Pretpostavimo da imamo igru u kojoj učestvuju dva igrača, igrač A i igrač B, pri čemu igrač A raspolaže sa m tzv. čistih strategija A1........Am, dok igrač B raspolaže sa n strategija B1........Bn. Izboru bilo koje od strategija igrača A odgovara izbor neke od strategija igrača B. Ukoliko pretpostavimo da je igra determinističkog tipa (nema aleatornosti u izboru strategija), izboru svakog para mogućih strategija od strane igrača A i B odgovara rezultat koji pokazuje dobitak jednog igrača (igrača A), odnosno gubitak drugog igrača (igrača B). Tako ćemo rezultat igre za slučaj izbora para strategija (Aj, Bj) predstavljati vrednošću aij, koji pokazuje koliko iznosi dobitak igrača A, odnosno gubitak igrača B. Ukoliko je aij < 0 ova vrednost pokazuje da će igrač A morati platiti igraču B iznos od |aij| novčanih jedinica, odnosno da je ’dobotak’ za igrača A negativan što znači da termine gubitak i dobitak treba uslovno prihvatiti. Sve potencijalne rezultate različitih kombinacija izbora strategija od strane igrača A i B možemo predstaviti u obliku matrice igre, odnosno matrice plaćanja koja predstavlja tabelarni zapis funkcije plaćanja u igri dva lica sa nultom sumom. Matricu plaćanja za slučaj postojanja m strategija igrača A i n startegija igrača B možemo predstaviti u obliku:
a11 a 21 P= ...... am 1
a12 a 22 am 2
a1 n a 2 n ...... ..... amn ..... .....
Proste matrične igre su igre u kojima postoje dva igrača (to su, dakle, parne igre) koji raspolažu sa nekoliko razlicitih strategija. Interakcija između strategija dva igrača data je preko takozvane matrice plaćanja koja determiniše dobitke odnosno gubitke igrača zavisno od izabrane strategije. Matrična igra je u potpunosti odredena matricom plaćanja. B A
B1 B2
.....
Bn A1 A2 ... Am
a11 a12
.....
a21 a22
.....
a1n a2n.. .........
........... am1 am2 .... amn
Strategije igrača A su predstavljene vrstama matrice plaćanja, dok su strategije igrača B predstavljene kolonama. Kao što vidimo, elementi matrice plaćanja pokazuju koliko će iznositi dobitak za igrača A, odnosno gubitak igrača B, u slučaju izbora bilo koje od mogućih kombinacija (para) strategija koje im stoje na raspolaganju. Igra dva lica sa nultom sumom, predstvljena prethodnom matricom plaćanja realizuje se u uslovima kada igrači prilikom izbora bilo koje od startegija ne znaju koju će starategiju izabrati 6
protivnik. Osnovni cilj svakog igrača jeste da odabere staretegiju koja će mu obezebediti osvarenje najboljeg mogućeg rezultata, odnosno maksimalan mogući dobitak igraču A i minimalan mogući gubitak igraču B. Pri tome, svaki od igrača podrazumeva racionalno ponašanje svog protivnika, tj. njegovo stremljenje da u uslovima definisanim matricom plaćanja ostvari za sebe najpovoljniji rezultat. Ova pretpostavka predstvlja osnovnu determinantu ponašanja igrača i njihova opredeljenja za izbor pojedinih strategija. U cilju ostvarenja najpovoljnijeg rezultata u igri, svaki od igrača, ne znajući izbor protivnika i podrazumevajući njegovo racionalno ponašanje, prethodnu analizu mogučih dobitaka odnosno gubitaka. Igrač A, zbog toga za svaku svoju čistu strategiju Ai (i= 1,...., m) određuje minimalan dobitak koji će ostavriti bez obzira na izbor strategije igrača B, tj. opredeljuje minimalni elemenat svake od vrsta matrice plaćanja u obliku: αi = min aij i =1,..., m j
Između svih ovako određenih minimalnih dobitaka za pojedine strategije, igrač A bira maksimalan elemenat u obliku α = maxαi = max min aij i
i
j
vrednosti igre određuje optimalnu strategiju za igrača A, čijim izborom dobitak od α jedinica za igrača A ne može biti umanjen bez obzira na izbor strategije od strane njegovog protivnika. Sličnu analizu mogućeg rezultata izbora pojedinih strategija možemo izvršiti i za igrača B, koji se trudi da u igri odabere takve strategije koje mu obezbeđuju minimizaciju gubitaka. Zato za svaku od svojih strategija, koje su predstvljenje kolonama matrice plaćanja, igrač B izračunava maksimalne gubitke, tj. određuje vednosti βj = max aij j =1, ...., n i
Minimalan od ovako određenih elemenata, odnosno vrednost β = min βj = minmax aij j
i
predstavlja gornju granicu verdnosti igre, odnosno tzv. minimaks vrednost za igrača B. Racionalno se ponašajući, igrač B će strategiju kojoj odgovara ovako izračunata gornja granica vrednost igre smatrati optimalnom strategijom, jer mu ona obezbeđuje poziciju u kojoj nikakav izbor strategije od strane igrača A ne može povećati njegov gubitak iznad vrednosti β. Izborom optimalnih startegija od strane oba igrača oni obezbeđuju za sebe najpovoljniji rezultat, igrač A obezbeđuje dobitak ne manji od donje granice α, dok gubitak igrača B ne može biti veći od gornje granice određene vrednošću β. Na taj način, igrači A i B izborom svojih optimalnih strategija se opredeljuju za način igre u kome će rizik usled različitog izbora starategija od strane protivnika svesti na minimum.
Primer 1. 7
Odrediti donju i gornju granicu vrednosti igre i optimalne strategije za igrače A i B u igri predstavljenoj matricom plaćanja 2 − 3 P= 7 4
5 −4 2 6 4 3 2 1
0 1 8 5
Rešenje: Strategije igrača A i B su predstavljene vrstama i kolonama matrice P, retrospektivno. Da bi odredili njihove optimalne strategije, potrebno je odrediti vrednosti maksimalnih gubitaka igrača A i B, što je predstavljeno sledećom tabelom: B B1
B2
B3
B4
αi
A1
2
5
-4
0
-4
A2 A3 A4 βj
-3 7 4 7
2 4 2 5
6 3 1 6
1 8 5 8
-3 3 1
A
Tabela 1. Opredeljujući se prema prethodno opisanom pravilu maksimuma, igrač A će odabrati svoju treću starategiju kao optimalnu, jer mu ova stategija obezbeđuje ostvarenje vrednosti α = maxα = mixmin aij = 3 ii
j
dok je očigledno za igrača B optimalna njegova druga strategija za koju se ostavrauje gornja granica vrednosti igre, odnosno vrednost β = minβj = minmax aij = 5. Kao što vidimo sve izračunate j
i
vrednosti minimalnih dobitaka za igrača A manje su od vrednosti makismalnih gubitaka za igrača B, na osnovu čega se zaključuje da donja granica vrednosti igre nikada nije veća od gornje granice vrednosti igre, što pokazuje sledeća teorema. Teorema 1. U matričnioj igri gornja granica vrednosti igre uvek je veća ili jednaka u odnosu na donju granicu vrednosti igre, tj. β ≥α . Dokaz Dokaz tvrđenja naše teoreme je jednostavan i proizilazi iz načina definisanja gornje i donje granice vrednosti igre. Naime, iz definicija gornje i donje vrednosti igre proizilazi njihov odnos prema bilo kom od elemenata matrice plaćanja koju možemo predstaviti u obliku βj= max aij ≥ aij
j =1, ..., n
i
dok je 8
αi = min aij ≤ aij
i= 1, ..., m
j
Iz oba izraza dakle proizilazi da je βj = max aij ≥ aij ≥ min aij = αi i
j
odakle je βj ≥ αj. Kako očigledno ovaj odnos važi za svako i i j, to možemo da donja granica vrednosti igre nije veća od gornje granice vrednosti igre, odnosno da je β ≥ α. Ukoliko je u matričnoj igri donja granica vrednosti igre jednaka gornjoj granici igre. tj. ako je α ≥ β , takva igra je prosta matrična igra i nazivamo je igrom sa sedlastom tačkom ili jednostavno igrom sa sedlom. Sedlasta tačka matrične igre nalazi se na preseku optimalnih strategija igrača, za koje su izjednačena maximin i minimaks vrednost, tj. donja i gornja granica igre. Vrednost elemenata koji u matrici plaćanja odgovara sedlastoj tački pokazuje verdnost igre, odnosno dobitak za igrača A i gubitak za igrača B koji iznosi υ = α = β. Rešavanje proste matrične igre, prema tome, predstavlja postupak određivanja optimalnih čistih strategija igrača A i B, sedlaste tačke i vrednosti igre. Primer 2. Odrediti optimalne strategije igrača A i B, sedlastu tačku i vrednost igre ukoliko je matrica plaćanja predstavljena u obliku 4 6 4 5 3 8 7 1 0 − 2 P= − 5 10 − 1 − 4 2 Kao što vidimo, igrač A raspolaže sa 3, a igrač B sa pet mogućih startegija. Da bi opredelili optimalne strategije, za igrača A ćemo odrediti minimalne dobitke, a za igrača B maksimalne gubitke za pojedine strategije, što je predstavljeno tabelom 5.2. Vrednosti α i i βj u tabeli pokazuju minimalne dobitke za igrača A i maksimalne gubitke za igrača B, određene na prethodno opisani način. Kao što vidimo, za igrača A je optimalno da igra svoju prvu strategiju kao čistu dok je za igrača B optimalna njegova treća strategija. Ove strategije, određene na osnovu B B1
B2
B3
B4
B5
αi
A1
4
5
3
4
6
3
A2 A3 βj
8 -5 8
7 10 10
1 -1 3
0 -4 4
-2 2 6
-2 -4
A
Tabela 2. maksimin odnosno minimaks vrednosti, koje su u ovom slučaju izjednačene, tako da je vrednost igre određena vrednošću sedlaste tačke koja se nalazi na preseku optimlanih strategija (prve za igrača A i treće za igrača B), tj. υ = α = β = 3. Ovakvo rešenje igre, tj. vrednost igre, okazuje prosečan donitak koji će u svakom od poteza ostvariti igrač A, odnosno prosečan gubitak koji će ostvariti igrač B. 9
4. Matrične igre sa mešovitim strategijama Ukoliko u matrici plaćanja postoji sedlasta tačka, vrednost igre je izvesna i ona odgovara vrednosti sedlaste tačke. U takvom slučaju svaki od igrača igra svoju optimalnu strategiju kao čisti, dakle radi se o prostoj matričnoj igri. Međutim, ukoliko je donja granica vrednosti igre manja od gornje granice vrednosti igre, tj. α < β, tada se postavlja pitanje kako odrediti rešenje igre. Izbor optimalne strategije igraču A obezbeđuje dobitak ne manji od α, dok izbor optimalne startegije igraču B obezbeđuje da njegov gubitak neće biti veći od β. Racionalno se ponašajuči, svaki od igrača, ne zanjući koju će strategiju odbrati njegov protivnik, u takvim uslovima nastoji da uveća svoj dobitak odnosno smanji svoj gubitak. Takav cilj igrači ostvaruju odabirajući u nizu poteza ne jednu već više stategija koje im stoje na raspolaganju. Analizom igre bez sedlaste tačke lako bi mogli pokazati da igrač A naizmeničnim izborom rauličitih strategija može ostvariti dobitak koji je veći od vrednosti maksimin elementa, koji če ostvariti igranjem optimalne strategije. Analogno, igrač B izborom različitih strategija u uzastopnim potezima može umanjiti svoj gubitak u odnosu na minimaks vrednost. Opredeljivanje za izbor različitih strategija od strane igrača A i B realizuje se slučajnim izborom, odnosno određenom verovatnoćom, prim čemu jedan slučajan izbor različitih strategija predstvlja tzv. mešovitu strategiju. Mešovita strategija, prema tome, redstavlja kombinaciju različitih verovatnoća sa kojima igrači u uzastopnom nizu poteza igrati pojedine strategije koje im stoje na raspolaganju. Ukoliko je igra dva lica nultom sumom definisana matricom plaćanja reda (m,n) u kojoj igrač A može izabrati bilo koju od m strategija, njegovu mešovitu strategiju možemo predstaviti u vidu vektora x = (x1, x2, ..., xm), čiji elementi čine verovatnoće sa kojima igrač A primenjuje pojedine strategije. Kako su elementi vektora koji predstavlja mešovitu strategiju igrača A verovatnoće izbora pojednih strategija, to mora biti zadovoljeno m
xi ≥ 0 (i = 1,2,..., m),
∑ x =1 i
i =1
Anlogno, mešovitu strategiju igrača B možemo predstaviti u obliku vektora y = (y1, y2, ..., yn), čiji elementi pokazuju verovatnoće izbora igrača B neke od njegovih n strategija, pri čemu je m
yj ≥ 0 (j = 1,2,..., n),
∑ y =1 j
i =1
Opredeljivanje igrača za igranje bilo koje strategije od starategija kao čiste, predstavlja očigledno specijalan oblik mešovite strategije. U tom slučaju sve verovatnoće igranja strategija su jednake nuli, izuzev čiste strategije za koju je ova verovatnoća jednaka jedinici, zbog čega i kažemo da prosta matrična igra predstavlja specijalan oblik mešovite matrične igre. Strategija igrača A i B za koje su varovatnoće xi i yj veće od nule predstavljaju aktivne strategije. Ukoliko igrači A i B biraju strategije Ai i Bj sa verovatnoćama xi i yj, tada verovatnoću istovremenog izbora ove dve strategije, odnosno ostvarivanja para (Ai i Bj) određujemo u vidu proizvoda ovih verovatnoća, tj. u obliku verovatnoće xi yj. Pri nizu uzastopnih igara koji su definisani mešovitim strategijama, potencijalni dobitak za igrača A, odnosno potencijlni gubitak za igrača B, predstavlja slučaju veličinu, koja zavisi od vektora x i y i od matrice plaćanja. Vrednost igre u uslovima realizacije mešovitih strategija, zbog toga, možemo predstaviti u vidu očekivane (matematičkog očekivanja) srednje vrednosti u obliku υ = ƒ (x,y) =
m
n
i =1
j =1
∑ ∑a
ij
xi yj 10
odnosno u matričnom obliku υ = ƒ (x,y) = xPy΄ gde funkcija ƒ (x,y) predstavlja funkciju plaćanja, x vektor mešovite strategije igrača A, y vektor mešovite strategije igrača B, P matricu plaćanja. Primer 3. Data je matrica plaćanja u obliku 4 5 0 2 − 2 6 − 3 5 P= 1 − 4 7 3 i mesovite strategije igrača x = (0,45 0,20 0,35) i y = ( 0,30 0,20 0,15 0,35). Odrediti očekivanu vrednost igre. Rešenje Na osnovu predstavljene matrice plaćanja vidimo da igrač A raspolaže sa 3 strategije, dok igrač B može izabrati bilo koju od četiri strategije koje su predstavljene kolonama matrice P. Elementi vektora mešovitih strategija x i y pokazuju verovatnoće izbora pojedinih strategija od strane igrača A i B. Tako za igrača A smo pretpostavili da će od ukupnog broja poteza u 45% slučajeva igrati svoju prvu strategiju, u 20% drugu, dok će 35% poteza odigrati birajući svoju treću strategiju. Slično značenje imaju elementi vektora y, samo za igrača B. Vrednost igre odredićemo na sledeći način 0,30 4 5 0 2 − 2 6 − 3 5 0,20 ΄ υ = xPy = (0,45 0,20 0,35 ) 0,15 = 1 − 4 7 3 0,35 0,30 0,20 = 1,9075 = (0,85 1,60 4,10 2,05) 0,15 0,35
Na osnovu čega konstatujemo da će našem zadatku prosečno u svakom od poteza igrač A dobijati 1,9075 jedinica, koliko će igrač B dobijati.
5. Dodatak Jedna od najviše proučavanih igara u svim oblastima gde se teorija igara može primeniti je poznata Zatvorenikova dilema (Prisoner's dilemma - PD). PD predstavlja fundamentalni problem u teoriji 11
igara koji pokazuje zašto dvoje ljudi ne bi sarađivalo iako im je u obostranom interesu da sarađuju. Igra je prvobitno smišljena od strane Merrill Flood i Melvin Dreshera koji su radili u RAND1 1950. god. Albert Tucker je formalizovao ovu igru i pretvorio je u oblik u kome se može naći i danas. Zatvorenikova dilema je princip koji se široko primenjuje u politici, ekonomiji, pravu, biologiji i socijalnim naukama. ’’Postavka PD igre teče ovako. Policija uhvati dva prestupnika A i B u ukradenom vozilu prilikom bežanja, u blizini neke banke. Detektivi imaju dovoljno dokaza da obojicu pred porotom osude za krađu kola, ali nemaju dovoljno dokaza da ih osude za pljačku banke. Oba zatvorenika poriču pljačku banke i dogovore se medjusobno da pri toj tvrdnji ostanu.’’ Islednici stave zatvorenike u odvojene sobe, tako da jedan sa drugim ne mogu više da komuniciraju, i svakome naprave sledeću ponudu: ″Možeš da odlučiš da priznaš pljačku, u kojoj je impliciran i tvoj saradnik, ili da to porekneš. Ako priznaš a tvoj saradnik porekne, sve optužbe protiv tebe će biti povučene, slobodan si, a mi ćemo iskoristiti tvoje priznanje da ozbiljno kaznimo tvog saradnika. Obrnuto, ako tvoj saradnik prizna pljačku, a ti je ne porekneš, on će biti slobodan, a tebi sleduje teška kazna na osnovu njegovog priznanja. Ako obojica priznate pljačku, bićete obojica i osudjeni, ali sa smanjenim kaznama zbog saradnje sa sudom. Najzad, ako obojica poreknete, samo što može je da vas se obojica osudi na manju kaznu zbog kradje automobila.″ Kako će zatvorenik da odluči, i gde je ovde dilema? Payoff matrica za PD izmedju zatvorenika A i B je prikazana ispod, zajedno sa dobicima koji svaki zatvorenik dobije za određene odluke.
Slika 1. Payoff matrica za PD izmedju zatvorenika A i B Dilema je u tome što je zatvoreniku bolje da prizna pljačku nego da je porekne, štagod onaj drugi uradio. Ako misli samo na sebe, onda je logika sledeća: ako prizna, a onaj drugi porekne, slobodan je. Ako prizna, i drugi takodje prizna, dobice manju kaznu zbog saradnje. U oba slučaja priznanjem stiče neku korist. Na isti način rezonuje i drugi zatvorenik. Od fundamentalnog značaja je, međutim, da bi obojica najbolje prošli ako bi se držali svog početnog dogovora i poricali pljačku. 1
Research ANd Development je neprofitna svetska organizacija koja pomaže donošenju objektivnih odluka na bazi analiza i istraživanja.
12
U ovoj igri se priznanje pljačke policiji zove nekooperacija (NC, ili još Defect), jer se zatvorenik ne pridržava početnog dogovora sa drugim zatvorenikom, a poricanje pljačke kooperacija (C) jer se tog dogovora pridržava. Koristeći ove oznake, dakle, svaki zatvorenik pojedinačno će bolje proći ako prizna pljačku, tj. primeni strategiju NC, međutim, zajednički će bolje proći ako je ne priznaju, tj. ako obojica ostanu pri početnom dogovoru i primene strategiju C. U tom smislu, PD igra ilustruje razliku izmedju kolektivnog i pojedinačnog rezonovanja. Primetimo da ovde ključnu ulogu ima poverenje. Situacija je, međutim, dramatično drugačija ako igrač igra PD veliki broj puta protiv istog oponenta. Ova varijanta sa ponovljenim PD "partijama" se zove Iterisana Zatvorenikova dilema (Iterated PD). Na duže staze, igračima najveću dobit donosi kooperacja. Evolucija, ili razvijanje kooperacije se, kao sto vidimo, oslanja na dva važna faktora: (i) da igrači prepoznaju jedan drugog (poverenje), i (ii) da je, na duge staze, kumulativna zajednička i pojedinačna dobit, pri kooperaciji, veća od svake pojedinačne zasebno. Najbolja strategija u iterisnoj PD je tzv. Tit-for-Tat (TFT) strategija. Ona se odvija po sledećem jednostavnom pravilu: onaj ko prvi počinje, počne sa C, i u svakom sledećem koraku uzvrti onim sto je dobio od oponenta. U tom slučaju, ako oponent takođe igra TFT strategiju, sekvenca poteza će izgledati ovako: C C C C C C C.....itd C C C C C C C.....itd. Tada će obojica imati najveću dobit. Sve druge strategije su lošije od TFT. Medjutim, ključni faktor ovde je da ni jedan od igrača ne sme da zna unapred koliko poteza traje igra. Jer, ako bi se to znalo, onda bi onaj poslednji na potezu uvek mogao da igra NC i da iskoristi poverenje oponenta i stekne ekstra dobit. Postoji mnogo drugih aspekata IPD (o tome postoje citave knjige napisane), ali, jednu je važno pomenuti. Naime, TFT kao strategija je nestabilna u odnosu na nesporazume. Zamislimo da se igra TFT, i sekvenca je prosta - prvi C, oponent C, prvi opet C, oponent C, itd., srećno sarađuju. Medjutim, ako, iz nekog razloga, nerazumevanja, šuma ili ometanja, prvi oponentovo C u sekvenci kooperacija shvati, razume, ili doživi, kao NC, onda prvi, razume se, uzvraća sa NC (tako TFT nalaze), oponent sa NC (tako njemu njegov TFT nalaže), i sada su prešli na međusobno i uzajamno "ujedanje" (back biting). Sekvenca se tada nastavlja sa: prvi NC, oponent NC, prvi NC, oponent NC, itd. Ovo uzajamno uzvraćanje NC odgovorima može da se nastavi u nedogled, i niko od toga nema koristi, kao sto smo videli. U ekonomiji jedan od najboljih primera PD je onaj kada su dve kompanije za proizvodnju duvanskih proizvoda u Sjedinjenim Američkim Državama trebale da odluče koliko će novca potrošiti na reklamne kampanje. Efektivnost kompanije A je delimično zavisila od kampanje kompanije B. Analogno tome, profit kompanije B će zavisiti od ulaganja kompanije A u reklamnu kampanju. Ukoliko obe kompanije odluče da se reklamiraju u istom periodu, njihovi prihodi će ostati isti ali će se ukupni troškovi povećavati zbog troškova marketinga. Obe kompanije bi profitirale ukoliko bi jedna od njih smanjila troškove reklame. Ukoliko jedna od kompanije potpuno odustala od reklamiranja ona druga bi višestruko profitirala. Sada se postavlja pitanje koja je to optimalna suma koja bi predstavljala optimalan izdatak za obe kompanije. Konkretan odgovor za ovu dilemu jeste da obe strane pristanu na sporazumni dogovor da se ovaj problem reši. Duvanska industrija u Sjedinjenim Američkim Državama je problem smanjenja troškova rešila veoma jednostavno a to je da je uspela da utiče na donošenje zakona za zabranu reklamiranja duvanskih proizvoda. Iako ovo rešenje na prvi pogled deluje pogubno po industriju to ipak nije tako. O čemu se radi, naime, kompanije više neće imati troškove za marketing a dobitak će deliti celokupna industrija jer će potražnja za njihovim proizvodima i dalje ostati ista. 13
14