Universidad Nacional del Callao - FCE
TEORIA DE JUEGOS JUEGOS DINAMICOS DE INFORMACIÓN COMPLETA Juego Dinámico Un juego dinámico, es un juego secuencial (a diferencia de los juegos estáticos), donde los jugadores adquieren nueva información, respecto a lo realizado por los demás jugadores, mientras el juego se desarrolla. En los juegos dinámicos la estructura secuencial del juego tiene relevancia, es por ello que se recomienda utilizar la forma extensiva para poder analizar un juego dinámico. Juego de información completa Al igual que en los juegos estáticos de información completa, tanto la estructura del juego, la racionalidad de los jugadores y los futuros pagos, de acuerdo a las estrategias utilizadas, son de conocimiento común. Un juego dinámico de información completa puede ser representado mediante la forma normal o estratégica, sin embargo al utilizar esta representación podemos encontrar los equilibrios de Nash, tal y como se ha estudiado en la parte de juegos estáticos de información completa. Sin embargo, en el caso de juegos dinámicos (como se dijo en la definición de juego dinámico) resulta más apropiado contar con una representación del juego que muestre la estructura secuencial del juego. La representación en su forma extensiva de un juego incorpora explícitamente la estructura secuencial. Utilizando esta representación de los juegos dinámicos podemos encontrar lo que se conoce como Equilibrio de Nash perfecto en subjuegos, el cual es el concepto de solución en juegos dinámicos (a diferencia de los Equilibrios de Nash en juegos estáticos) que será explicado más adelante. Ejemplo 14 Dilema del Prisionero (diferencia entre juegos estáticos y dinámicos) Recordemos el enunciado del dilema del prisionero, el cual se representa en su forma normal de la siguiente manera
NC NC
( 2,2 )
J2
C
( 0,3 )
J1 C ( 3,0 ) ( 1,1 ) Panel A: Juego estático Panel B: Juego dinámico Para poder representarlo en su forma extensiva utilizaremos el diagrama de árbol. Para este caso como ya hemos entrado a la parte de juegos dinámicos haremos una distinción en la forma extensiva de representar un juego estático y dinámico, para ello representamos el dilema del prisionero en su forma extensiva donde: Panel A: Dilema del prisionero en juegos estáticos Panel B : Dilema del prisionero en juegos dinámicos. Para esta versión del dilema del prisionero, tenemos que el jugador 1 elige primero su acción, la cual es observada por el jugador 2 antes de que él deba elegir su acción. Es por ello que se les conoce como juegos secuenciales. A continuación la forma extensiva del dilema del prisionero
Página 1 de 15
Universidad Nacional del Callao - FCE
TEORIA DE JUEGOS
J1
J1
NC
NC
C
J2
NC
(22)
J2
J2
C
(03)
NC
C
(30)
C
(11)
NC
(22)
J2
C
(03)
NC
(30)
C
(11)
Las líneas punteadas del panel A que unen los nodos de decisión del jugador 2 nos hace referencia a que el juego es un juego estático, donde el plan de acción se toma al inicio del juego (por ambos jugadores) mientras que el juego representado en el panel B nos muestra la secuencialidad del juego, donde el jugador 2 decidirá qué estrategia usar dependiendo de la estrategia tomada por el jugador 1. Diferencia entre acción y estrategia En los juegos estáticos vistos anteriormente no existía diferencia entre acción y estrategia. La estrategia de un jugador consistía en la elección de una acción. Sin embargo, en los juegos dinámicos una estrategia es muy diferente a una acción. Los jugadores pueden ir tomando distintas acciones a lo largo del juego. La estrategia de un jugador es un plan contingente completo de acción. Representación extensiva La definición matemática de un juego en su forma extensiva consiste en la descripción de los elementos que lo componen: 1. Un conjunto finito de jugadores Un conjunto finito de acciones Un conjunto finito de nodos
N . A=×i ∈ N A i .
X .
A continuación se utiliza el ejemplo anterior donde se representan los nodos los cuales están encerrados con un círculo rojo
Página 2 de 15
Universidad Nacional del Callao - FCE
TEORIA DE JUEGOS
Panel A: Juego estático
Panel B: Juego dinámico
J1
J1
NC
NC
C
J2
NC
(22)
J2
J2
C
NC
(03)
2. Una función
p: X
NC
C
(30)
C
(22)
(11)
J2
C
NC
(03)
(30)
C
(11)
que especifica en único inmediato predecesor de cada nodo.
Hay dos tipos de nodos:
Nodos terminales
T ={ x ∈ X }
que no pertenecen a ningún jugador, sino que
representan los resultados del juego y a los que se asocian los pagos correspondientes de cada jugador.
Los demás nodos
X ∖T
son los nodos de decisión, donde algún jugador es
requerido a tomar una acción. Dentro de ellos está el nodo inicial
x0
donde el
juego empieza. 3. Una función inicial)
γ : X ∖{ x 0 } → A
que asigna la acción que lleva hacia cada nodo (no
x desde su inmediato predecesor.
4. Una colección de conjuntos de información a cada nodo de decisión 5. Una función
H
y una función
H : X ∖T → H
que
x le asigna un conjunto de información h=H ( x ) ∈ H .
I : H →N
conjunto de información de
que a cada conjunto de información le asigna un jugador. El
i se denota
H i={ h ∈ H :i=I ( h ) } .
La interpretación de un conjunto de información es que un jugador no puede distinguir en qué nodo está entre los nodos que pertenecen a un mismo conjunto de información cuando elige una acción cualesquiera de ellos. Por lo tanto, se requiere que todos los nodos de decisión asignados a un mismo conjunto de información tengan las mismas acciones disponibles. Página 3 de 15
Universidad Nacional del Callao - FCE
TEORIA DE JUEGOS Así, podemos definir el conjunto de acciones disponibles en cada conjunto de información
h : A ( h )= { a ∈ A :a ∈ A ( x ) para x ∈h }
A continuación se utiliza el ejemplo anterior donde se señalan los conjuntos de información del jugador 1 y 2
Panel A: Juego estático
Panel B: Juego dinámico
J1
J1
NC
NC
C
J2
J2
J2
NC
C
(22)
NC
(03)
(11)
J2
NC
C
(30)
C
C
(22)
(03)
NC
(30)
C
(11)
v ={v 1 ( ∙ ) ,… , v n ( ∙ ) } que a cada jugador le asigna un pago en
6. Una colección de pagos
v i :T → R .
cada nodo terminal:
Por lo tanto, podemos definir un juego dinámico en su forma extensiva por la colección de todos
Γ E= ⟨ X , A , N , p ( ∙ ) , γ ( ∙ ) , H , H ( ∙ ) , I ( ∙ ) , v ⟩ .
sus elementos: Se han asumido
N
y
A
finitos (y por lo tanto
X
finito), pero la definición se puede
extender directamente al caso más general. Un juego dinámico se dice finito si (que implica
N
y
A
X
es finito
finitos)
Información perfecta e imperfecta Un juego extensivo es de información perfecta si cada conjunto de información contiene un único nodo. De lo contrario, es un juego de información imperfecta. Así, el juego del dilema del Página 4 de 15
Universidad Nacional del Callao - FCE
TEORIA DE JUEGOS prisionero que vimos anteriormente (Panel A) es un juego de información imperfecta, mientras que la versión del juego en su forma dinámica (Panel B) es un juego de información perfecta. Estrategia Pura Definición
i
Una estrategia pura para el jugador
es una función
si : H i → A
tal que
s i ( h ) ∈ A ( h ) , ∀ h ∈ H i . Al conjunto de estrategias puras de i lo denotamos por S i . Es importante enfatizar que una estrategia especifica una acción para todos y cada uno de los conjuntos de información del jugador. Ello incluso si de acuerdo a la estrategia algún conjunto de información no va a ser alcanzado en el juego. En concreto, sean
h'
donde
i
jugador
h
h'
y
se encuentra en una etapa posterior en el juego que debe asignar una acción a
impida que se llegue a
h'
i
dos conjuntos de información que pertenecen al jugador
h'
h . Una estrategia del
aun cuando la acción especificada en
h
durante el juego. La idea detrás de una estrategia en un juego
dinámico es que debe especificar qué haría el jugador en cada nodo de decisión del juego. Es por ello que una estrategia en un juego dinámico es un plan contingente y completo de acción. Dos planes contingentes completos de acción que se diferencian sólo en una acción constituyen dos estrategias diferentes. Por lo tanto, es común que los jugadores tengan muchas posibles estrategias en juegos dinámicos. Específicamente, si
i
disponibles del jugador
| A ( h )|
es el número de acciones
en el conjunto de información h , entonces el número de
estrategias puras de dicho jugador es
|Si|= ∏ | A ( h )| h∈Hi
Ejemplo 15 Dilema Prisionero (estrategias en juegos en suB:forma extensiva) Panel A: del Juego estático Panel Juego dinámico Recordemos el enunciado del dilema del prisionero
J1
J1
NCJ 2
NC
C
C
NC
J2 C
NCJ 2
NC
C
C
NC
J2 C
Página 5 de 15
(22)
(03)
(30)
(11)
(22)
(03)
(30)
(11)
Universidad Nacional del Callao - FCE
TEORIA DE JUEGOS
En el juego del dilema del prisionero (Panel A), cada jugador tiene sólo un conjunto de información (aunque el jugador 1 tiene un único nodo de decisión en el suyo y el jugador 2 tiene
NC
dos nodos de decisión), en el cual dos acciones están disponibles:
y
C . Sus
estrategias deben especificar qué acción tomar en dicho conjunto de información. El conjunto de todas las estrategias puras posibles de cada jugador son entonces:
S 1= { NC , C }
y
S 2= { NC , C } . Vemos que estos son iguales a los conjuntos de acciones de los jugadores: A 1= { NC , C }
A 2= { NC , C } .
y
Es en este sentido que mencionamos anteriormente que
no hay diferencia práctica entre acción y estrategia en los juegos estáticos. En cambio, el juego del dilema del prisionero presentado en el Panel B es un juego dinámico. En este caso el jugador 1 sigue teniendo un único conjunto de información y su conjunto de estrategias puras sigue siendo
S 1= { NC , C } .
Sin embargo, el jugador dos tiene dos
conjuntos de información: aquél al que se llega luego de que el jugador 1 juegue aquél al que se llega luego de que el jugador 1 juegue
NC
y
C . Una estrategia pura del jugador 2
debe especificar qué acción va a tomar en cada uno de sus conjuntos de información. Definimos una estrategia pura del jugador 2 como un vector tomar si el jugador 1 juega El
conjunto
de
NC
e
Y
estrategias
( X , Y ) , donde
X
indica la acción a
indica la acción a tomar si el jugador 1 juega puras
S 1= {( NC , NC ) , ( NC , C ) , ( C , NC ) , ( C , C ) } .
del
jugador
2
será
C .
entonces:
El número de estrategias puras del jugador 2
es 4, que es lo que se obtiene al calcular
|S2|= ∏ | A ( h )|=2 ×2=4 h∈ H 2
Estrategia Mixta Definición
Página 6 de 15
Universidad Nacional del Callao - FCE
TEORIA DE JUEGOS
σi
Una estrategia mixta
para el jugador
i
es (al igual que para juegos estáticos) una
distribución de probabilidad sobre su conjunto de estrategias puras
Si .
Representación Normal de Juegos Extensivos Siempre es posible reducir un juego en su forma extensiva a un juego en su forma normal o estratégica, donde los pagos están asociados a perfiles de estrategias en lugar de a nodos terminales. Un perfil de estrategias puras lleva a un único nodo terminal. Sea
ts∈ T
el único
nodo
s .
Entonces
terminal
asociado
con
el
perfil
de
estrategias
puras
ui ( s )=vi ( t s ) , ∀ i ∈ N . Asimismo, el pago esperado asociado al perfil de estrategias mixtas σ
es:
U i ( σ )= ∑
s∈ S
(∏ σ ( s )) v t j ∈N
j
j
i s
En la práctica, veremos que para juegos dinámicos es muchas veces más conveniente considerar las estrategias de comportamiento de los jugadores en lugar de sus estrategias mixtas. Estrategia de Comportamiento Definición Una estrategia de comportamiento
σi ( A ( h) )
para el jugador
i
es una distribución de
probabilidad sobre sus acciones disponibles en cada uno de sus conjuntos de información
h ∈ H i . En otras palabras, asumimos que un jugador asigna probabilidades a sus decisiones en cada uno de sus conjuntos de información, en lugar de asignar probabilidades a sus estrategias puras. Ambas definiciones son equivalentes bajo el supuesto, que vamos a mantener, que los jugadores tienen “memoria perfecta”: un jugador no puede olvidar lo que hizo en una etapa anterior del juego (este resultado es conocido como el teorema de Kuhn).
CONCEPTOS DE SOLUCIÓN EQUILIBRIO DE NASH Recordemos la definición de equilibrio de Nash dada anteriormente: un equilibrio de Nash es un perfil
de
estrategias
σ¿
tal
que
¿ ¿ U i ( σ ¿i , σ −i ) ≥ U i ( σ i , σ−i ) , ∀ σ i ∈ Σi .
Sendero de Equilibrio
Página 7 de 15
para
cada
jugador
i :
Universidad Nacional del Callao - FCE
TEORIA DE JUEGOS En un juego dinámico decimos que, dado un EN
σ ¿ , un conjunto de información
h
está
σ¿ .
en el sendero de equilibrio si y sólo si se alcanza con probabilidad positiva al jugar Ejemplo 16 Juego del Ultimátum
Dos personas utilizan el siguiente procedimiento para asignar dos objetos indivisibles. J2 propone una asignación y el J1 puede aceptar la propuesta o rechazarla. Si J1 rechaza la propuesta, ningún jugador recibe el objeto, si la acepta, la asignación propuesta se lleva a cabo. El pago de cada jugador es el número de objetos que recibe. La representación de este juego en su forma extensiva es la siguiente:
J2
( 2−0 )
( 1−1 )
( 0−2 )
J1
J1
J1
A
R
A
R
A
R
(20)
(00)
(11)
(00)
(02)
(00)
Como podemos observar, en este juego el jugador 2 tiene un solo conjunto de información, mientras que el jugador 1 tiene 3 conjuntos de información, por lo tanto el conjunto de estrategias puras del J2, quien tiene un único conjunto de información, es:
S 2= {( 2−0 ) , (1−1 ) , ( 0−2 ) } El J1 como se dijo tiene tres conjuntos de información. Por lo tanto definimos una estrategia pura del J1 como
XYZ ,
donde
X
indica la acción a tomar si J2 juega
conjunto de estrategias puras de J1 es:
S 1= { AAA , AAR , ARA , ARR , RAA , RAR , RRA , RRR } La representación normal del juego será:
J2
( 2−0 )
( 1−1 )
Página 8 de 15
( 0−2 )
( 0−2 ) . El
Universidad Nacional del Callao - FCE
TEORIA DE JUEGOS
J1
AAA
2,0
1,1
0,2
AAR
2,0
1,1
0,0
ARA
2,0
0,0
0,2
ARR
2,0
0,0
0,0
RAA
0,0
1,1
0,2
RAR
0,0
1,1
0,0
RRA
0,0
0,0
0,2
RRR
0,0
0,0
0,0
Tenemos nueve equilibrios de Nash en estrategias puras:
EN =( ARR , ( 2−0 ) ) , ( AAR , ( 1−1 ) ) , ( RAR , ( 1−1 ) ) , ( AAA , ( 0−2 ) ) , ( ARA , ( 0−2 )) , ( ARR , ( 0−2 ) ) , ( RAA , ( 0−2 ) Analicemos uno de estos EN, por ejemplo
( ARR , ( 0−2 ) )
:
J2
( 2−0 )
( 1−1 )
( 0−2 )
J1
J1
J1
A
R
A
R
A
R
(20)
(00)
(11)
(00)
(02)
(00)
Para este caso, la línea continua de color rojo representa un sendero de equilibrio, las líneas discontinuas representan las otras acciones que conforman la estrategia del J1. Un problema del concepto de equilibrio de Nash en juegos dinámicos es que pueden no ser secuencialmente racionales. El principio de racionalidad secuencial establece que la estrategia de cada jugador debe especificar acciones óptimas en todos sus nodos de decisión, incluso en aquellos que se encuentran fuera del sendero de equilibrio. En el ejemplo previo, el equilibrio de Nash
( ARR , ( 0−2 ) )
no es secuencialmente racional. De acuerdo a este equilibrio, aunque
Página 9 de 15
Universidad Nacional del Callao - FCE
TEORIA DE JUEGOS
( 1−1 ) . Este nodo no está en el sendero
no sea óptimo para J1, J1 jugaría rechazar si J2 juega
de equilibrio por lo que sólo constituye una “amenaza” de J1. Sin embargo, es una amenaza no creíble porque, de darse el caso, J1 actuaría de manera óptima aceptando la propuesta de J2. Así J2 preferiría jugar
( 1−1 )
( 1−1 ) y obtener 1 en lugar de jugar ( 0−2 ) y obtener 0 .
Por su puesto, J2 puede realizar esta misma deducción y por lo tanto, no esperaríamos que el equilibrio de Nash
( ARR , ( 0−2 ) ) se dé en realidad.
Analicemos otro de estos EN, por ejemplo
( ARA , ( 0−2 ) ) :
J2
( 2−0 )
( 1−1 )
( 0−2 )
J1
J1
J1
A
R
A
R
A
R
(20)
(00)
(11)
(00)
(02)
(00)
¿Es este equilibrio secuencialmente racional? Para encontrar los equilibrios de Nash que son secuencialmente racionales podemos aplicar el procedimiento conocido como inducción hacia atrás. Posteriormente vamos a explicar detalladamente este procedimiento. Por ahora, sólo lo ilustramos aplicándolo al ejemplo anterior. Empezamos determinando las acciones óptimas de J1 en los últimos nodos de decisión:
A
luego de
( 2−0 ) ,
A
luego de
( 1−1 )
y tanto
A
como
R
luego de
( 0−2 ) . En seguida vamos hacia atrás y determinamos qué es lo óptimo para J2 en el primer nodo de decisión dado que anticipa correctamente lo que óptimamente va a hacer J1 en cada uno de los nodos finales de decisión. Como luego de
( 0−2 )
tanto
A
como
R
son
óptimos para J1, debemos tratar cada uno de estos casos por separado. En caso de que J1 juegue
A
luego de
R
luego de
( 0−2 ) , lo óptimo para J2 es jugar
( 0−2 ) . En caso de que J1 juegue
( 0−2 ) , lo óptimo para J2 es jugar ( 1−1 ) . Así, vemos que en el ejemplo
previo sólo hay dos EN secuencialmente racionales: Página 10 de 15
Universidad Nacional del Callao - FCE
TEORIA DE JUEGOS
EN ={ ( AAA , ( 0−2 ) ) , ( AAR , ( 1−1 ) ) } En base a estos resultados podemos identificar tres posibles casos de acuerdo a las acciones óptimas para el jugador 1: 1. Siempre: Acciones de color celeste 2. Caso 1: Acción de color verde (En caso de que J1 juegue óptimo para J2 es jugar
( 0−2 ) , lo
luego de
( 0−2 ) )
3. Caso 2: Acción de color naranja (En caso de que J1 juegue óptimo para J2 es jugar
A
R luego de ( 0−2 ) , lo
( 1−1 ) )
De igual manera podemos identificar los casos para el jugador 2 de acuerdo a sus acciones óptimas: 1. Caso 1: Acción de color verde (En caso de que J1 juegue óptimo para J2 es jugar
( 0−2 ) , lo
luego de
( 0−2 ) )
2. Caso 2: Acción de color naranja (En caso de que J1 juegue óptimo para J2 es jugar
A
R luego de ( 0−2 ) , lo
( 1−1 ) )
El juego en su forma extensiva quedaría de la forma
J2
( 2−0 )
( 1−1 )
( 0−2 )
J1
J1
J1
A
R
A
R
A
R
(20)
(00)
(11)
(11)
(02)
(00)
Por lo tanto los equilibrios de Nash secuencialmente racionales son los ya hallados. Hemos visto cómo se puede aplicar el principio de racionalidad secuencial en un ejemplo de un juego finito de información perfecta. El concepto de solución que incorpora este principio de
Página 11 de 15
Universidad Nacional del Callao - FCE
TEORIA DE JUEGOS manera más general es conocido como equilibrio de Nash perfecto en Subjuegos. Antes de presentar este concepto, necesitamos primero definir qué es un subjuego. Subjuego Dado un juego en forma extendida, un subjuego es cualquier subconjunto de nodos que constituye un juego por derecho propio. Ello significa que debe satisfacer dos condiciones: 1. Comienza con un conjunto de información que contiene un único nodo y contiene todos los sucesores (inmediatos y subsiguientes) de este nodo. El subjuego no contiene otros nodos además de éstos. 2. Si el subjuego contiene el nodo
x , entonces contiene todos los nodos que están en el
mismo conjunto de información que
x . (Es decir, no hay conjuntos de información
“rotos”) Tenga en cuenta que el juego original también es un subjuego. Ejemplo 17 Subjuegos En la figura debajo se muestran dos juegos presentados en los apartados anteriores. El juego del Dilema del prisionero en su forma estática y dinámica. Recordemos el enunciado del dilema del prisionero Panel A: Juego estático
Panel B: Juego dinámico
J1
J1
NC
J2
NC
(22)
NC
C
J2
J2
C
(03)
NC
(30)
C
C
(11)
NC
(22)
J2
C
(03)
NC
(30)
C
(11)
En base a la definición de subjuego ¿Cuántos subjuegos tiene el Panel A y cuantos subjuegos tiene el Panel B?
Página 12 de 15
Universidad Nacional del Callao - FCE
TEORIA DE JUEGOS Podemos identificar que el Panel A (juego estático) cuenta con un único subjuego que es el juego mismo. El panel B (juego dinámico) cuenta con tres subjuegos: el juego mismo y cada subjuego que comienza en un nodo de decisión del jugador 2. Puesto que un subjuego es un juego en sí mismo podemos aplicarle los conceptos de solución usuales. Precisamente eso es lo que hace el equilibrio de Nash Perfecto en Subjuegos. Equilibrio de Nash Perfecto en Subjuegos Dado un juego en su forma extensiva, un perfil de estrategias
σ¿
es un equilibrio de Nash
Perfecto en Subjuegos (ENPS) si induce un equilibrio de Nash (EN) en todos los subjuegos del juego (incluyendo el juego original). Notese que si
σ
¿
es un ENPS, entonces también es un EN (dado que el juego original
también es un subjuego). Pero no todo EN es un ENPS. Por lo tanto, el conjunto de los ENPS es un subconjunto del conjunto de los EN:
{ ENPS } ⊆ { EN } . Así, el ENPS nos brinda una
predicción más precisa sobre los resultados que caben esperar en un juego dinámico. El procedimiento de inducción hacia atrás que ilustramos previamente es clave porque brinda un método para encontrar los ENPS. Dado que en cada subjuego los jugadores eligen sus acciones óptimas anticipando correctamente las acciones óptimas de los demás, a ningún jugador le conviene desviarse de su estrategia y, por lo tanto, estamos encontrando un EN en cada subjuego. Detallamos los pasos del método de inducción hacia atrás para juegos finitos de información perfecta: 1. Encontrar las acciones óptimas en los últimos nodos de decisión. 2. Encontrar las acciones óptimas en los penúltimos nodos de decisión dado que los jugadores anticipan correctamente las acciones óptimas que van a ser tomadas en los últimos nodos de decisión. 3. Así sucesivamente hasta llegar al nodo inicial. Si nunca se encuentra más de una acción óptima en cada nodo, entonces el procedimiento brinda un único ENPS. En caso contrario, todos los ENPS se encuentran repitiendo el procedimiento para cada acción óptima identificada. Para esta categoría de juegos, contamos con el siguiente teorema: Teorema de Zermelo Todo juego finito de información perfecta tiene un ENPS en estrategias puras que puede obtenerse por inducción hacia atrás. Además, si ningún jugador tiene los mismos pagos en cualquiera de los nodos terminales, entonces hay un único ENPS que puede ser derivado de esta manera. Nótese que este teorema sólo se aplica a los juegos de información perfecta. El procedimiento de inducción hacia atrás se puede generalizar para obtener los ENPS en todo juego dinámico finito: no sólo en aquellos con información perfecta, sino también en aquellos Página 13 de 15
Universidad Nacional del Callao - FCE
TEORIA DE JUEGOS con información imperfecta. Los pasos del método generalizado de inducción hacia atrás son los siguientes: 1. Encontrar el EN en cada uno de los subjuegos finales. 2. Encontrar el EN en el penúltimo subjuego dado que los jugadores anticipan correctamente los EN que van a darse en los subjuegos finales. 3. Así sucesivamente hasta llegar al nodo inicial. Si nunca se encuentra más de una acción óptima o EN, entonces el procedimiento brinda un único ENPS. En caso contrario, todos los ENPS se encuentran repitiendo el procedimiento para cada caso identificado. Equilibrio de Nash Perfecto en Subjuegos (Definición alternativa - Emilio Cerdá) Definición extraida del libro “Teoria de Juegos” - Emilio Cerdá: La estructura temporal de un juego dinámico con información completa obliga a cada jugador a tener en cuenta que sus decisiones en cada momento influyen en las posibilidades y pagos posteriores para él y para los demás, y que al mismo tiempo las decisiones futuras previsibles suyas y de los demás condicionan sus decisiones presentes. Aparece así un elemente de vital importancia, la credibilidad que se puede dar a las decisiones futuras a la hora de determinar las decisiones presentes, es decir, la credibilidad de las posibles amenazas o promesas que se pueden plantear sobre el comportamiento futuro para condicionar el comportamiento presente de los jugadores. … vamos a plantear un concepto de equilibrio llamado equilibrio de Nash perfecto en subjuegos. Este concepto representa, para el caso de los juegos dinámicos con información completa, una adecuación y una mejora con respecto al equilibrio de Nash, precisamente porque tiene en cuenta ese elemento de credibilidad antes mencionado. Ejemplo 18 Elección del nicho de mercado La empresa E está considerando entrar a un mercado que en ese momento sólo tiene una empresa incumbente (empresa I). En la primera etapa, la empresa E puede decidir entrar o quedarse fuera del mercado. Si E elige quedarse fuera el juego termina y los pagos son para la empresa E y
2
0
para la empresa I. Si E elige entrar al juego va a una segunda etapa.
En la segunda etapa ambas empresas eligen simultáneamente su nicho de mercado (grande o pequeño). Si ambas eligen el mismo nicho de mercado, ambas empresas incurren en pérdidas (
−3
−6
si nicho grande,
si nicho pequeño). Si eligen nichos diferentes, la empresa en el
nicho grande gana 1 , mientras que la empresa en el nicho pequeño pierde
−1 . La
representación extensiva de este juego es el siguiente (donde NP es nicho pequeño y NG es nicho grande):
E
No entrar
Entrar Página 14 de 15
(02)
E
−6 NGI NG NP I( NP (−3 (−11NP) (−1NG −3 ) 1) −6 )
Universidad Nacional del Callao - FCE
TEORIA DE JUEGOS
Encontrar los ENPS. Inducción hacia atrás generalizada: Juegos dinámicos con información completa pero imperfecta El algoritmo de inducción hacia atrás se aplica para juegos de información perfecta, pero podemos generalizar este método para juegos de información imperfecta. Para juegos finitos, la inducción hacia atrás generalizada se realiza de la siguiente forma: 1. Encontrar el EN en los últimos subjuegos. 2. Encontrar el EN en los penúltimos subjuegos dado que los jugadores anticipan correctamente los EN que van a darse en los últimos nodos de decisión. 3. Así sucesivamente hasta llegar al nodo inicial. Si en cada nodo hay solo una acción óptima o EN entonces este será el único ENPS. En caso contrario, todos los ENPS se encuentran repitiendo el procedimiento para cada caso. Para el ejemplo 18 (Elección del nicho de mercado) Una estrategia de la empresa I es simplemente la acción que elige luego de que la empresa E entra en el mercado. Definimos una estrategia de la empresa E como (X,Y), donde X indica si E entra o no al mercado en la primera etapa e Y indica qué juega en la segunda etapa si entra. Los ENPS son
( ( E , NG ) , NP) , ( ( F , NP ) , NG )
Página 15 de 15