Ayudantía Teoría de Juegos_2003_2

•

Outros

0

Apuntes Generales

3.6.2022

¡Estudia con miles de materiales!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Administración

589.183 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

TEORÍA MICROECONÓMICA I

AYUDANTÍA
REPASO DE TEORÍA DE JUEGOS Y APLICACIONES A JUEGOS DINÁMICOS

2do Semestre 2003 Prof : Juan Pablo Montero
Ayud: Paula Benavides
Manuel Hermosilla

I.- Juegos Estáticos con Información Completa:

Este es un repaso de conceptos básicos en Teoría de Juegos. Ha sido extraído de los capítulos 1 y 2 del
texto "Un primer curso de teoría de juegos" de R. Gibbons, y complementado con algunas aplicaciones de
MCW y FT.

1.1.- Teoría Básica: Juegos en forma normal y equilibrio de Nash.

Esta sección considera juegos simples, en que los jugadores forman sus decisiones simultáneamente,
posteriormente reciben sus ganancias que dependen de la combinación de acciones que acaban de elegir.
Nos referimos a los juegos estáticos y en particular por ahora con información completa, es decir la
función de ganancias de cada jugador es conocida por todos los jugadores.

Este tipo de juegos se puede describir a través de una representación en forma normal. Esto significa que
cada jugador elige de forma simultánea una estrategia y la combinación de las estrategias elegidas por los
jugadores determina las ganancias de cada uno.

Ejemplo 1: Dilema del prisionero.

Dos sospechosos son arrestados y acusados de un delito. La policía no tiene evidencia para condenar a
menos que uno confiese. Si ninguno confiesa, ambos son condenados por un delito menor, a un mes de
cárcel. Si ambos confiesan son sentenciados a seis meses de cárcel. Finalmente si uno confiesa y el otro no,
el que confiesa es puesto en libertad y el otro es sentenciado a nueve meses de prisión. Este problema
puede representarse mediante la siguiente matriz:

Preso 2
Callarse Confesar
Callarse -1,-1 -9,0
Preso 1
Confesar 0,-9 -6,-6

Podemos ver que se encuentra toda la información requerida en la forma normal:

(i) Los jugadores del juego.
(ii) Las estrategias de que dispone cada jugador.
(iii) La ganancia que cada jugador obtiene en cada combinación posible de estrategias.

Hasta ahora hemos señalado que la representación normal permite representar juegos estáticos (en que los
jugadores actúan sin conocer las decisiones de los demás jugadores), más adelante se verá que también
puede darse en el contexto de juegos dinámicos, aunque en dichos casos la representación en forma
extensiva suele ser más conveniente.

Ya sabemos como representar un juego simple, pero falta ver como lo resolvemos. Una primera forma es
pensar que un jugador racional no utilizará una estrategia estrictamente dominada, es decir que para cada
combinación posible de estrategias de los restantes jugadores la ganancia para el jugador de utilizar una
estrategia sea estrictamente menor que la de utilizar otra. En el dilema del prisionero la estrategia de
callarse es estrictamente dominada para ambos jugadores. Podemos repetir este proceso repetidas veces
(eliminación iterativa de estrategias estrictamente dominadas) pero para ello necesitamos suponer que los
jugadores son racionales y que existe conocimiento común de la racionalidad (Aumann 1976). Otra
desventaja de este método es que frecuentemente nos lleva a una predicción imprecisa sobre el juego.
Puede que no existan estrategias estrictamente dominadas para eliminar.

Un concepto mucho más preciso es el de Equilibrio de Nash. Este concepto está basado en el hecho que si
la teoría predice un perfil de estrategias de equilibrio, la estrategia predicha para cada jugador debe ser su
mejor respuesta a las estrategias predichas par los otros jugadores. Esta predicción sería self-enforcing,
puesto que ningún jugador querría desviarse de la estrategia predicha para él.

Definición: En el juego en forma normal de n jugadores, G = {S1, .....Sn; u1,.....un}, las estrategias s1*,.....,Sn*,
forman un equilibrio de Nash si para cada jugador i, si* es la mejor respuesta del jugador i (o al menos una
de ellas) a las estrategias de los otros n-1 jugadores, (s1*,....si-1*, si+1*,....,sn*):
ui(s1*,....si-1*,si*, si+1*,....,sn*)≥ui(s1*,....si-1*,si,si+1*,....,sn*), para cada posible estrategia si en Si.

Veamos como hacerlo en la práctica: Podemos ver si cada combinación posible de estrategias satisface la
condición del EN, es decir si la estrategia de cada jugador es la mejor respuesta a la del otro.
Metodológicamente, para cada jugador y cada posible estrategia, marcamos la mejor respuesta del otro
jugador a esa estrategia. Los pares de estrategias, en el caso de dos jugadores, que satisfagan esta condición
son los equilibrios de Nash en estrategias puras del juego.

Ejemplo 2:

J2
I C D
A 0,4 4,0 5,3
M 4,0 0,4 5,3
J1
B 3,5 3,5 6,6

En el ejemplo, el par de estrategias (B,D), constituye el único equilibrio de Nash en estrategias puras del
juego, con pagos (6,6).

Ahora veremos la relación entre la eliminación iterativa de estrategias estrictamente dominadas (EIEED)
y el concepto de equilibrio de Nash. Resultado 1: si la eliminación iterativa de estrategias estrictamente
dominadas elimina todas las estrategias menos las estrategias (s1*,....,sn*), entonces estas estrategias
constituyen el único equilibrio de Nash del juego.

Sin embargo, el concepto de equilibrio de Nash es más poderoso ya que a menudo la EIEED elimina sólo
unas pocas estrategias. Resultado 2: Si las estrategias (s1*,....,sn*) forman un equilibrio de Nash, entonces
sobreviven a la eliminación iterativa de las estrategias estrictamente dominadas. Esto no señala que
pueden existir estrategias que sobrevivan a la EIEED pero que no formen parte de ningún equilibrio de
Nash. Constatar esto en nuestro ejemplo anterior.

Por último, hasta ahora hemos señalado que si la teoría de juegos ofrece una única solución a un juego,
esta debe ser un equilibrio de Nash. Pero debemos considerar que existirán juegos en los cuales no se
pueda alcanzar acuerdo (no existe EN) o en los cuales existan múltiples equilibrios de Nash. Otros
conceptos de equilibrio que se verán más adelante podrán refinar esta predicción, pero aún así existirán
juegos en los cuales la teoría de los juegos no ofrece una solución única.

Ejemplo 3: La batalla de los sexos.

J2
Ópera Boxeo
Ópera 2,1 0,0
J1
Boxeo 0,0 1,2

(Ópera,Ópera) y (Boxeo, Boxeo) son Equilibrios de Nash.

Recomendación: ver en Gibbons aplicaciones al modelo de duopolio de cournot y el modelo de duopolio
de Bertrand. Se verán en siguiente ayudantía.

1.2.- Teoría Avanzada: Estrategias mixtas y existencia de equilibrio.

Veamos el siguiente ejemplo conocido en la literatura como Matching Pennies.

Ejemplo 4: Matching Pennies: El juego de las Monedas.

J2
Cara Cruz
Cara -1,1 1,-1
J1
Cruz 1,-1 -1,1

Si ambas monedas coinciden, el jugador 2 gana la moneda del jugador 1 y si no coinciden el jugador 1
gana la moneda del jugador 2. En este juego no existe ningún par de estrategias que cumplan las
condiciones del EN, siempre hay incentivos a desviarse. Este juego se caracteriza por que a cada jugador le
conviene adivinar la jugada del otro y que el otro no adivine la suya. En este caso no existe equilibrio ya
que existe incertidumbre sobre lo que harán los otros jugadores.

Introduciremos el concepto de estrategias mixtas que se interpreta en términos de la incertidumbre de un
jugador respecto a lo que otro jugador hará. Una Estrategia Mixta es una distribución de probabilidad
sobre alguna o todas las estrategias en Si (llamadas estrategias puras). Si existen tres posibles estrategias
para un jugador, una estrategia mixta es una distribución de probabilidad (q,r,1-q-r) sobre las estrategias
del jugador. (¿cómo se representa una estrategia pura, en términos de estrategia mixta?.

Existencia del Equilibrio de Nash: Lo primero es ampliar la definición de equilibrio de Nash para incluir
las estrategias mixtas. Recordemos que la definición de equilibrio de Nash presentada anteriormente
requería que la estrategia pura de cada jugador constituyera una mejorrespuesta a las estrategias puras de
los restantes jugadores. Ahora necesitamos que la estrategia mixta de cada jugador sea una mejor respuesta
a las estrategias mixtas de los otros jugadores. Puesto que cada estrategia pura puede ser expresada como
una estrategia mixta, esta nueva definición ampliada incluye a la anterior.

Definición: En el juego en forma normal G={S1,S2;u1,u2}, las estrategias mixtas (p1*,p2*)forman un
equilibrio de Nash si la estrategia mixta de cada jugador es una mejor respuesta a la estrategia mixta del
jugador. Debe cumplirse que:

v1(p1*,p2*)≥ v1(p1,p2*)

v2(p1*,p2*)≥ v2(p1*,p2)

Es decir la ganancia esperada para cada jugador utilizando la estrategia mixta de equilibrio debe ser
superior a la que obtendría utilizando una estrategia mixta distinta.

Veamos en un ejemplo como encontrar el EN en estrategias mixtas.

Ejemplo 5: Equilibrio de Nash con estrategias mixtas en el juego Matching Pennies.

J2
Cara Cruz
Cara -1,1 1,-1 r
J1
Cruz 1,-1 -1,1 (1-r)
q (1-q)

Llamamos a r*(q) y q*(r) las correspondencias de mejor respuesta. La intersección de las correspondencias
de mejor respuesta nos da el equilibrio de Nash. En este juego la estrategia mixta (1/2, 1/2), (1/2,1/2) es un
equilibrio de Nash en estrategias mixtas y no existe como ya vimos equilibrio de Nash en estrategias puras.

Recomendación: Hacer el mismo ejercicio para el juego de la batalla de los sexos y constatar la existencia
de equilibrio en estrategias puras bajo este procedimiento.

v1(cara)=-1*q+1*(1-q) = 1-2q
v1(cruz)=1*q-1*(1-q) = -1+2q
Igualamos: 1-2q=-1+2q
q=1/2

v2(cara)=1*r-1*(1-r) = -1+2r
v2(cruz)=-1*r+1*(1-r) = 1-2r

Igualamos: -1+2r = 1-2r
r=1/2
Ahora graficamos.
r*(q)
r
1/2
q
q*(r)
1
1
Teorema Nash 1950: En el juego en forma normal de n jugadores G= {S1, .....Sn; u1,.....un}, si n es un
número finito y Si es finito para cada i, existe al menos un equilibrio de Nash, que posiblemente incluye
estrategias mixtas. (Se demuestra mediante el teorema de punto fijo de Kakutani)

II.- Juegos Dinámicos con Información Completa:

Ahora veremos los juegos dinámicos, aún bajo el contexto de información completa, es decir las funciones
de ganancia de los jugadores son de dominio público. Además se analizan los juegos dinámicos con
información perfecta que significa que en cada momento del juego, el jugador a quien le corresponde
decidir conoce la historia completa de todas las decisiones tomadas hasta ese momento. El tema central en
este tipo de juegos es la credibilidad.

2.1.- Juegos dinámicos con información completa y perfecta.

Las características claves de un juego dinámico con información completa y perfecta son que las
decisiones se toman de manera sucesiva, todas las decisiones anteriores son conocidas antes de tomar la
decisión siguiente y las ganancias de los jugadores para cada combinación posible de jugadas son
información de dominio público. Esta descripción corresponde a la forma extensiva del juego.

Una forma de resolver este tipo de juegos es por inducción hacia atrás. Cuando el jugador 2 debe decidir
toma la acción del jugador 1 como dada, por lo que se enfrenta al siguiente problema:

max u2(a1,a2)
a2∈A2

Suponiendo que este problema de optimización tiene una única solución, la podemos denotar a través de
una función de reacción: R2(a1). El jugador 1 resuelve el siguiente problema:

max u1(a1,R2(a1))
a1∈A1

Supongamos que este problema también tiene una solución única. Llamamos a a(a1*,R2(a1*))el resultado por
inducción hacia atrás de este juego. Este resultado ignora las amenazas no creíbles, sólo considera
respuestas óptimas.

En este tipo de juegos pueden existir múltiples equilibrios de Nash pero el único equilibrio de Nash
perfecto en subjuegos será aquel asociado con el resultado obtenido por inducción hacia atrás. Recordar
que el argumento de inducción hacia atrás implica supuestos de racionalidad que de no cumplirse pueden
invalidar la predicción del juego.

Ejemplo 6: Inducción hacia atrás.

Por inducción hacia atrás el jugador 1 juega I y el juego termina ahí.

Ejemplo 7: El modelo de duopolio de Stackelberg.

Este es un modelo dinámico de duopolio en el cual la empresa dominante (o líder) decide primero y una
empresa seguidora decide en segundo lugar. Las empresas escogen cantidades como en el caso del modelo
de Cournot. (Recordar que en el modelo de Bertrand escogen precios).

El juego: (i) La empresa 1 escoge una cantidad q1 ≥0; (ii)la empresa 2 observa q1 y escoge entonces una
cantidad q2 ≥0; (iii)las ganancias de la empresa i vienen dadas por la función de beneficio:

πi(qi,qj) = qi(P(Q) - c)

Donde P(Q)=a-Q es el precio de equilibrio de mercado función de la cantidad agregada y c es el costo
marginal constante de producción, siendo cero los costos fijos.

Buscamos el resultado por inducción hacia atrás de este juego. Lo primero es buscar R2(q1)que es una
solución de:
Max π2(q1,q2) = Max q2(a- q1 - q2 - c)
q2≥0

Lo que resulta en: R2(q1)= (a - q1 - c)/2
Siempre que a - c > q1
El problema de la empresa 1 es:
Max π1(q1,R2(q1)) = Max q1(a- q1 - R2(q1) - c)= = Max q1(a- q1 - c)/2
q1≥0 q1≥0 q1≥0

El resultado por inducción hacia atrás del juego de duopolio de Stackelberg por lo tanto es:

q1*=(a-c)/2
R2 (q1*)=(a-c)/4
Recomendación: Comparar con el resultado del juego de Cournot y notar que en este caso la empresa 2 se
encuentra peor, a pesar de tener más información ya que conoce q1, pero a la vez la empresa 1 sabe que la
2 conoce q1.
1,1
1
2
1
2,0
3,0 0,2
I D
I´ D´
I D

2.2.- Juegos en dos etapas con información completa pero imperfecta.

En esta sección permitiremos que hayan decisiones simultáneas en cada etapa, lo que implica que la
información es imperfecta.

Perfección en Subjuegos: Analicemos el siguiente juego:

(i)Los jugadores 1 y 2 escogen simultáneamente las acciones a1 y a2 de los conjuntos factibles A1 y A2
respectivamente.
(ii)Los jugadores 3 y 4 observan el resultado de la primera etapa (a1 , a2) y escogen simultáneamente las
acciones a3 y a4 de los conjuntos factibles A3 y A4 respectivamente.
(iii)Las ganancias son u(a1,a2,a3,a4) para 1=1,2,3,4.

Cómo resolver: muy parecido a la inducción hacia atrás pero ahora al final del juego resolvemos un juego
simultáneo, no el problema de optimización de un jugador.

Los jugadores 1 y 2 prevén que el comportamiento en la segunda etapa de los jugadores 3 y 4 será:
(a3*(a1,a2),a4*(a1,a2)). En base a esto los jugadores 1 y 2 escogen simultáneamente a1 y a2. Supongamos que a1*,
a2* es el único equilibrio de Nash de este juego de decisiones simultáneas. Llamamos a (a1*, a2*,a3*(a1*, a2*),
a4*(a1*, a2*))el resultado perfecto en subjuegos de este juego en dos etapas.

2.3.- Juegos Repetidos.

2.3.1.- Juegos repetidos en dos etapas.

Ejemplo 8: Juego repetido del dilema del prisionero en dos etapas.

J2
I2 D2
I1 1,1 5,0
J1
D1 0,5 4,4

J2
I2 D2
I1 2,2 6,1
J1
D1 1,6 5,5

En este caso se cumple que en la segunda etapa existe un único equilibrio de Nash y en este ejemplo el
resultado de la segunda etapa es independiente del resultado de la primera. El único resultado de
equilibrio de la segunda etapa es (I1, I2). Ahora analizamos la primera etapa teniendo en cuenta que en la
segunda etapa el EN será (I1, I2), y también encontramos que existe un único EN (I1, I2). Por lo tanto el
único resultado perfecto en subjuegos de este juego es (I1, I2) en la primera etapa seguido de (I1, I2) en la
segunda etapa.

A partir de un juego estático con información completa en que los jugadores escogen de manera
simultanea denotamos al juego G, como el juego de etapa del juego repetido.

Definición: Dado un juego de etapa G, G(T) denota el juego repetido finitamente en el que G se juega T
veces, habiendolos jugadores observado los resultados de todas las jugadas anteriores antes de que
empiece la siguiente. Las ganancias de G(T) son simplemente la suma de las ganancias de los T juegos de
etapa.

Además si el juego de etapa G tiene un único EN, entonces, para cualquier T finito, el juego repetido G(T)
tiene un único resultado perfecto en subjuegos: en cada etapa se juega el equilibrio de Nash de G.

Veamos ahora que el resultado es diferente cuando el juego de etapa G tiene múltiples equilibrios de
Nash. Pensemos en base al siguiente juego de etapa que se juega dos veces. Vamos a demostrar que existe
un único resultado perfecto en subjuegos de este juego en que el par de estrategias (C1,C2) se juega en la
primera etapa.

J2
I2 C2 D2
I1 1,1 5,0 0,0
C1 0,5 4,4 0,0
J1
D1 0,0 0,0 3,3

Supongamos que en la primera etapa los jugadores prevén que (D1,D2)será el resultado de la segunda etapa
si el de la primera etapa es (C1,C2),pero que (I1, I2) será el resultado de la segunda etapa si el de la primera
etapa es cualquiera de los restantes. La interacción de los jugadores en la primera etapa se concreta
entonces en el siguiente juego de una etapa:

J2
I2 C2 D2
I1 2,2 6,1 1,1
C1 1,6 7,7 1,1
J1
D1 1,1 1,1 4,4

Existen tres equilibrios de Nash en este juego, que implican a su vez resultados perfectos en subjuegos del
juego repetido. El EN (I1,I2) corresponde al resultado perfecto en subjuegos((I1,I2),(I1,I2))del juego repetido.
Lo mismo ocurre con el EN (D1,D2). Pero el tercer EN (C1,C2)es mejor, y corresponde al resultado perfecto
en subjuegos (C1,C2) ((D1,D2))del juego repetido.

Lo importante: se puede alcanzar la cooperación en la primera etapa de un resultado perfecto en
subjuegos del juego repetido. Es decir las amenazas o las promesas creíbles sobre el comportamiento
futuro pueden influir en el comportamiento presente.

Resultado: Si G=A1, ......,An;u1, ....un es un juego estático con información completa que tiene múltiples
equilibrios, pueden existir resultados perfectos en subjuego del juego repetido G(T) en los que, para
cualquier t<T, el resultado de la etapa t no es un equilibrio de Nash de G.

Es importante notar que puede que el concepto de perfección en subjuegos no utilice una definición de
credibilidad lo suficientemente fuerte. Asumimos lo que los jugadores preveían para la segunda etapa sin
analizar si esto era o no creíble o podía dar origen a una renegociación. Puede ocurrir que los castigos o
recompensas no sean creíbles ex-post lo que no está considerado aquí. Es decir puede ocurrir que se
requiera de una penalización, pero exista otro equilibrio del juego de etapa preferido por el jugador que
castiga, lo que llevaría a la posibilidad de persuadir al jugador que castiga de que renegocie la
penalización.

Ejemplo 9: Equilibrio perfecto en subjuego con equilibrios múltiples.

t=1
J2
I´ D´
A´ 5,6 0,7
J1
B´ 0,0 1,1
t=2
J2
I D
A 10,10 0,0
J1
B 0,0 3,3

En este ejemplo podemos alcanzar cooperación y lograr el resultado perfecto en subjuegos ((A,I),(A´,I´)),
utilizando las siguientes estrategias:

Jugar A´en t=1
S1 = Jugar A en t=2 si (A´,I´)
Jugar B en t=2 si otra cosa

Jugar I´en t=1
S2 = Jugar I en t=2 si (A´,I´)
Jugar D en t=2 si otra cosa

2.3.2.- Aplicaciones a juegos dinámicos.

Algunas críticas a la inducción hacia atrás: Si bien este concepto parece adecuado en juegos simples de dos
etapas con información perfecta, las cosas son más complicadas cuando existen muchos jugadores o
períodos.

En primer lugar largas cadenas de inducción hacia atrás presumen largas cadenas de la hipótesis de
conocimiento común "el jugador 1 sabe que el jugador sabe, que el jugador 3 sabe que........los pagos". En
estos casos si se asumen pequeñas probabilidades que algún jugador juegue incorrectamente esto puede
modificar el equilibrio. Es decir el argumento de inducción hacia atrás cuando existen largas cadenas de
inducción es más sensible a pequeños cambios en la estructura de información del juego.

Otra complicación ocurre cuando el mismo jugador debe jugar varias veces en la sucesión. Esto se
presenta en el ejemplo que sigue a continuación.

Ejemplo 10: El ciempiés.

Por inducción hacia atrás encontramos un único equilibrio perfecto en subjuegos y es que el jugador juega
D1 y el juego se acaba. Sin embargo si el jugador 2 se formara alguna creencia respecto de movidas
distintas a las de equilibrio (A1 en el caso del jugador 1)podría ocurrir para una determinada probabilidad
que se alcance un equilibrio distinto. Lo que predice en este caso la inducción hacia atrás no es lo que
ocurre normalmente en los experimentos.

En la teoría más avanzada existen otro tipo conceptos de equilibrio alternativos que abordan este tipo de
aspectos. Esto quedará para más adelante. Por ejemplo una definición de Fudenberg y Kreps
(1988)extiende este principio pero exige que se asigne probabilidad positiva a cualquier secuencia de
juego.

Algunas críticas a la perfección en subjuegos:

Como la perfección en subjuegos es una extensión de la inducción hacia atrás es vulnerable a las críticas
que ya discutimos. Pero más aún la perfección en subjuegos exige que los jugadores estén de acuerdo en
un juego incluso si ese juego no es predicho a través de argumentos de inducción hacia atrás. El punto es
que la perfección en subjuegos supone que todos los jugadores esperan el mismo equilibrio en cada
subjuego. La plausibilidad de este supuesto dependerá de las razones por las cuales se crea que un
equilibrio se alcanzará en primer lugar.

(iv) Introducción a los juegos repetidos infinitamente.

El paso que sigue es extender la repetición infinitamente. De nuevo el tema será que las amenazas o las
promesas creíbles sobre el comportamiento futuro pueden influir en el comportamiento presente. Pero en
el caso de repetición infinita encontraremos un resultado aún más poderoso. Incluso si en el juego de
etapa existe un único equilibrio de Nash, pueden existir muchos resultados perfectos en subjuegos, en los
que ninguno de los resultados en cada etapa sea un equilibrio de Nash de G.

2 1 2 11
(1,0) (0,1) (3,0) (2,4) (6,3)
(5,5) A1 A2 A3 A4 A5
D1 D2 D3 D4 D5