Logo Studenta

Juegos Dinaümicos

¡Este material tiene más páginas!

Vista previa del material en texto

Organización Industrial
Competencia Imperfecta y Poder de Mercado
April 7, 2021
1 / 25
Competencia Imperfecta y Poder de Mercado
Teoría de juegos: juegos dinámicos
2 / 25
1
$1000 $0 Las funciones de pago
son de conocimiento común
.2
2
Eg Neg Eg Neg
Pago 1
( II ) ( Loo) (II ) (rqgoyyvoao
( pagoz ) → Función de
final pago
La amenaza del 2 no es creíble . si 1 le pasa 1000 el 2
tiene dos posibles acciones entre -8
y 0 el z elije no explotar
Cuando le toque jugar independiente de la amenaza no explota la
granada . Como hay info completa 1 decide entregar $0 porque
sabe
que el 2 no explotará la granada .
Teoría de juegos: juegos dinámicos
I En esta clase introduciremos los juegos dinámicos. Restringiremos nuestra
atención a juegos con información completa, esto es, juegos en los que las
funciones de pago de todos los juagadores son de común conocimiento.
I A su vez, asumiremos que existe información perfecta, esto es, cuando a
un jugador le toca mover sabe la historia completa de jugadas que se han
hecho hasta el momento.
I Parte central de nuestro estudio será la credibilidad de los jugadores, para
ilustrar mejor esto considere el siguiente juego.
3 / 25
Juegos de forma secuencial .
¡
funciones de pago
conocidas
conocemos las posibles estrategias ( info completa) . Los jugadores
saben
que hicieron la trayectoria de los otros
,
saben
que hicieron
antes (info perfecta)
1 Nodo
inicial
Entrega
Entrega
$1.000 $0
2
2
Explotar No
gatea "
"
granada granada
Asigno t de pago
[ %) ¥9000)) [%) ¿ {¡°O° )) Nodo final contiene pagos
cuando termina el juego
Amenaza
: 2 le dice
9 1
que si no le entrega los $1.000 yo exploto
la granada .
^ sabe que 2 siempre va a elegir no exploto la granada . Se anticipa y sabe
lo que hará 2
.
1 elige no entrego los mil porque no cree en la
amenaza
. La amenaza no es creíble . El equilibrio es entrega
°
y
no exploto granada . Nodo final : nodo que tiene pagos . partimos del
nodo final al inicial ( inducción hacia atrás )
1
• Derecha
Izquierda
2 2
/
-
- d . d
\ 1
1 d !
i I )
p .
3
. .
4
1 I I
i
-
d i - d d
3 3 3
3
3 3 3 .
- - j d
.
i d j ' d ' . l '
\
-
d
i d
i d d
3 va a saber en que nodo estará porque hay info perfecta y completa .
1
\
^
| d
Si no observa el 2
2
- ? d
¡ q i no sabe que hace el 1
1 2 1(2) ( j ) ( 2, ) ( z )
si
no observa no sabe
cual elegir .
NO sabría en que nodo está
parado .
.
1
' d
2 2
¡
al i Discreto : conjunto de
d
(E) (G) (4) (g)
acciones finito
R2 ( an ) = argmax U2 ( a 1. a2)
cuando r haya jugado , 2 hará
a2 E A2
su mejor respuesta posible según
eso .
R2 (ar -- i ) = i
No siempre es necesario derivar .
R2 ( al = d) = d
Max 02 ( an = i.az)
a2 e { iid }
-
M""
{ U2 ( ap si , a2 = i ) , U2 ( anti , a2 =D )}a2 C- { i. a }
= 2 = 1
aki
→ Rz ( al = i ) = i
Teoría de juegos: juegos dinámicos
El juego de la granada:
I Considere un juego de dos movidas.
I El jugador 1 elige entre dar al jugador 2 $1,000 o $0.
I Luego, el jugador 2 observa lo que eligió 1 y elige entre explotar o no una
granada. Si la granada explota ambos mueren.
I Suponga que el jugador 2 amenaza al jugador 1 diciéndole que hará
explotar la granada si no le pasa los $1,000.
I Si el jugador 1 cree la amenaza su mejor respuesta será entregarle los
$1,000. Sin embargo, el jugador 1 no debería creer la amenaza, ya que
sabe que el jugador 2 no tiene ningún incentivo para hacer explotar la
granada. Esto se debe a que entre recibir $0 o morir el jugador 2 eligirá
recibir $0.
4 / 25
Es creíble ?
Teoría de juegos: juegos dinámicos
Vamos ahora con un par de definiciones:
Definición: Juegos Dinámicos de información completa y perfecta
I El juego de la granada pertenece al conjunto de juegos de información
completa y perfecta. Estos juegos son del tipo:
(1) Jugador 1 elige una acción a1 dentro de su conjunto posible de acciones A1.
(2) Jugador 2 observa la acción del jugador 1 y luego elige acción a2 dentro de
su conjunto de acciones A2.
(3) Una vez realizadas las acciones a1 y a2 los jugadores reciben los pagos
u1(a1, a2) y u2(a1, a2), respectivamente.
I Las características centrales de los juegos dinámicos de información
completa y perfecta, más en específico, son:
(1) Los movimientos ocurren de forma secuencial.
(2) Todos los movimientos previos son observados antes de que un nuevo
movimiento sea elegido.
(3) Los pagos todos los jugadores para todas las posibles combinaciones de
movimientos son de conocimiento común.
5 / 25
1 va a poder predecir lo
que hace 2 porque sabe los pagos de las
acciones
.
Teoría de juegos: juegos dinámicos
Definición: Inducción hacia atrás
I Los juegos dinámicos típicamente los resolveremos mediante lo que se
denomina inducción hacia atrás. La forma de proceder es la siguiente.
I Cuando al jugador 2 le toca mover en su turno se enfrentará al siguiente
problema, dada la elección que previamente realizó el jugador 1:
max
a22A2
u2(a1, a2)
Supongamos que el problema de 2 tiene solución y llamémosla por
R2(a1) 2 A2. Esto es, para cualquier acción que haya elegido el jugador 1,
el jugador 2 tendrá una respuesta óptima.
6 / 25
al
[
Función de mejor respuesta de 2 para cualquier
cosa que haga 1 .
Dos tiene una posible reacción para cada acción de 1 .
Teoría de juegos: juegos dinámicos
I Dado que la información es completa y perfecta el jugador 1 puede
anticiparse a la respuesta de 2 cuando juega a1. En otras palabras, el
jugador 1 sabe que si juega a1, entonces el jugador 2 jugará R2(a1).
I Teniendo en mente lo anterior, el problema del jugador 1 será:
max
a12A1
u1(a1,R2(a1))
Supongamos que este problema tiene una solución: a⇤1 .
I Llamaremos por (a⇤1 ,R2(a⇤1)) la solución obtenida por inducción hacia
atrás del juego.
7 / 25
1 juega primero
Equilibrio : las *
,
a2
*
)
2 juega segundo
El juego se termina con dos
1 conoce la f de
reacción de 2
.
Max
an e { i. a } { " ( al = i , R2 ( an -- i ) = i ) , un ( an = d , R2 ( a2 =D) =D )}
= p
= 2
Teoría de juegos: juegos dinámicos
Ejemplo
Ejemplo: Modelo de competencia de Stackelberg con precios discretos:
I Firma 1 (líder) juega primero y elige precio p1 2 {1, 2}.
I Firma 2 (seguidora) juega segundo, observa el precio p1 y luego elige su
precio p2 2 {2, 3}.
I Después de que los precios son elegidos, la demanda para cada firma es
qi (p1, p2), i = 1, 2.
I Y las utilidades son ⇡i (p1, p2) = (pi � ci )qi (p1, p2).
8 / 25
Una elige primero y otros
precios continuosdespués .
Cp = (2=0
qilpr ,
=
1-2 Pi + pj
Pelo
,
• C
inducción hacia atrás
Dado P , el 2 hace Pzlpr) = argmax ñz (Pp , Pa )
Max T2
( PZE (0,8 )
.
P2 . qzfps , pa ) )
P2 e [0,8 )
CPO
. . .
Hacer cuando
eligen cantidades
P2 ( pr ) =p
4
Teoría de juegos: juegos dinámicos
Ejemplo
¿Cómo resolver el ejemplo anterior?
I Podemos aplicar inducción hacia atrás
I Por tanto, debemos partir por la firma seguidora. La firma seguidora
deberá tener una respuesta óptima para todos los posibles precios que
pueda fijar la firma 1, formalmente:
p2(p1) = argmax
p22{1,2}
⇡2(p1, p2) = (p2 � c2)q2(p1, p2)
Nota: no puede ocurrir que le preguntemos a la firma 2 qué precio fijará
cuando la firma 1 fija p1 = 1 y nos responda: no tengo idea.
9 / 25
×
{ 2,3 }
Siempre tienen una BR frente a lo que elija otro .
La firma 1 sabe cuál es el problema que resuelve la firma 2 y
se anticipa a ello
. Esto es porque hay información completa Y
perfecta . La firma 1 conoce la función de reacción de la 2 .
3 Jugadores 1 primero
Z segundo
3 tercero
Pasos : Dado (ai
, az ) az resuelve : máx Uz ( ar , a2 , a. 3)
a 3 EA 3
+ ( al
,
a2 ) e Ar x A- 2 123 ( al , a2 ) E A 3 , H ( as
,
a2 ) e Ar × AZ
Paso 2 :
Dado la1 )
,
2 anticipa respuesta de 3
, por lo
tanto resolverá
max U2 ( an , a2
,
123 ( al , a2 ))
a2 E A2
122 ( an ) C- A2
,
Val E AI
f : para todo
Paso 3
"
1 se anticipará a lo que hará 2
,
lo que a su vez le
permite anticiparse a lo que hará 3
. Entonces 1 resolverá
Max un ( as
,
Ra ( an )
,
Rz ( an
,aa ) )
al C- A1
Podemos reescribirlo para que me quede en términos de an
Max
un ( an , R2 ( ar )
,
Rz ( ai , R2 la1 ))
al C- Al
*Saldrá el al
. Esto
puede ser una o varias acciones
Con al * obtengo a2
#
=
122 ( an * ) y finalmente con a2 * Obtengo
as
'
= pz (al *
,
az
*
)
.
El equilibrio será : ( ar *
, az
*
,
aztt )
De otra forma se
puede escribir como
:
= (art , R2 ( an ' ) , 123 ( ar
'
,
R2 ( ar
* )) : Equilibrio
- -
*
A
a2 93
Juego de Stackelberg en precios
Cuando las acciones son continuas y no discretas .
Suponga 2 firmas : una firma libre
y otra seguidora
Firma líder actúa primero y la seguidora actúa segunda .
Firma lider (1) Firma seguidora (2)
( Mgs = cng 2 = O
An = A2 = [ 0 , 8)
, eligen precios
9- ilpi
, pj )
=
n - zpit pj La demanda depende del precio de
uno
y del otro .
Ni ( pi
, pj ) = pi - qi ( pi
, Pj )
NO podemos hacer arbol porque el conjunto de acciones es
infinito . Cómo resuelvo el stalckerberg ? Inducción hacia atrás
Paso 1 : encontrar mejor respuesta de 2
Paso 2 : encontrar acción
que maximiza la utilidad de 1 .
( n ) Pz ( pr ) =
org mata Itz ( pa
,
Pr ) = Pa q2 ( pr , Pa )
pr e [ 0 , D )
pa (pr) = rt Pr
(2) Resolver 4- } Con la demanda
que me dieron
Pr
*
=
argmax Tp (Pp
,
P2 (Pr ) ) = Pp qn ( pr
,
P2 ( Pr ) )
Pi e [O , d) Palpa ' ) = " 9/56
.
Equilibrio = ( pr *
,
pz ( p , # ))
Pr # = 5- con la demanda que
14
me dieron .
Teoría de juegos: juegos dinámicos
Ejemplo
Continuando con el ejemplo . . .
I La firma líder sabe que la firma seguidora reaccionará óptimamente frente
al precio que ella elija, esto es, la firma líder conoce la función de reacción
de la firma seguidora p2(p1), por lo tanto, la firma líder resuelve:
p⇤1 = argmax
p12{2,3}
⇡1(p1, p2(p1)) = (p1 � c1)q1 (p1, p2(p1))
I En consecuencia, la solución al problema será (p⇤1 , p2(p⇤1 )).
10 / 25
×
{ 1,4
Teoría de juegos: juegos dinámicos
Ejemplo
I Si tuvieramos valores para los pagos podríamos resolver el problema de
forma "visual". Esto es lo que llamaremos representación extensiva del
juego.
I Suponga para estos propósitos que:
I Si p1 = 1 y p2 = 2, entonces ⇡1 = 2 y ⇡2 = 1
I Si p1 = 2 y p2 = 2, entonces ⇡1 = 1 y ⇡2 = 1
I Si p1 = 1 y p2 = 3, entonces ⇡1 = 3 y ⇡2 = 0.
I Si p1 = 2 y p2 = 3, entonces ⇡1 = 2 y ⇡2 = 0.5
I ¿Cuál serían los precios de equilibrio? (Dibujar representación extensiva
del juego).
11 / 25
Firmas
Pr =p Pp 2
Firma 2
Firma 2
pz
--2
Pz =3
Pz --2 Pz =3
%
ask.si
Pa ( Pp -- 1) = 2
pafp, = 2) = z } Primero vemos el 2 . Ahora vemos el p .
La firma 1 sabe esta información porque hay
info completa .
1 elige precios para maximizar su utilidad .
(Pr ' = 1
,
( Pa ( pr ' -- e) = 2) Equilibrio .
Teoría de juegos: juegos dinámicos
Definición
Definición: Juego extensivo.
Los juegos extensivos poseen los siguientes componentes:
I Una lista de jugadores {1, 2, ...,N}.
I Un árbol que tiene un nodo inicial, nodos intermedios y nodos finales.
I Links que conectan a los nodos.
I Para cada nodo que no sea final, el nombre del jugador que tiene que
tomar una acción.
I Para cada jugador en un nodo, un conjunto de acciones.
I Una función de pagos para cada jugador para cada nodo final.
12 / 25
Acciones
Teoría de juegos: juegos dinámicos
Definición
Figure: Ejemplo de forma extensiva de un juego dinámico cualquiera.
¿Cuál será su solución?
13 / 25
Teoría de juegos: juegos dinámicos
Definición
I Una estrategia en los juegos extensivos para un jugador i es un plan
completo de acciones, esto es, una acción por cada nodo en donde tenga
que elegir una acción.
I Diferencia radical con respecto a los juegos estáticos, en donde una
estrategia era solo una acción.
I Juego Stackelberg
I Firma 1: Elegir un precio p1.
I Firma 2: Elige un precio dado el precio que observa, esto es, p2(p1).
14 / 25
Teoría de juegos: juegos dinámicos
En lo que sigue considere el siguiente juego dinámico:
(i) Jugador 1 elige una acción a1 2 A1 = {L,R}.
(ii) Jugador 2 observa la acción a1 y luego elige una acción
a2 2 A2 = {L0,R 0}.
(iii) Para cada combinación (a1, a2) existe una función de pagos, u1(a1, a2) y
u2(a1, a2). Para facilitar la comprensión se provee el juego en su forma
extensiva.
Figure: Forma extensiva del juego, ¿cuál será la solución?
15 / 25
tt ( ai
,
a2 ) e An × A2 existen funciones de pago .
Si 1 juega L la mejor respuesta de 2 es R
"
.
Si 1 juega R 2
juega l
'
. Función de mejor respuesta de 2 es que va a elegir
BR z ( L ) = R
'
BRZ ( R ) =L
'
1 conoce la función de mejor respuesta de 2- Por esto 1 elige R
Para transformar el
juego en estático el jugador 2 tiene que
tener muchas alternativas ( plan contingente )
:
R
2
2
L
'
R
'
á R
'
ll Cil l :) l :)
Estrategias 1 : { L , R }
Estrategias a :{ fin ) , ICR )
, } { L ' ( 4
,
R
'
CR ) } { R ' (4. L ' CR ) ) lRY4.HR ')
matriz de
pago -
Jugador 2
(
'
ll ) LYR) L ' ll ) R ' CR) RYLILYR) RÍL ) R ' CR )
L ( 3,1 ) (3,1 ) ( 1,2 ) ( 1,2 )
Jugador 1
-
- _
-
-
R ( 2,1 10,0 ) (II) ( 0,0)
Estrategia 1 2 3 4
E
. Nash
La intuición económica de este EN es
1) { " { RYL ) , R ' CR ) } } que 2 dice que juega R' juega independiente
,
de lo
que 1 haga es una amenaza .
Este equilibrio se sustenta en una amenaza no creíble
No es racional
2) { R , { RYLI , l ' ( R ) } }
.
Este equilibrio es racional . Tiene sentido .
porque es compatible con inducción hacia atrás
.
Para
comprobar si tienen sentido sigo el ATBOI . Si n juega R
Sabemos
que 2 juega L .
Con inducción a la inversa
(Ric ' ) es el EN
BRZ ( L ) = R
'
BR
, ( R ) = L
' } ° { R ' ll ) , L ' CR ) }
Teoría de juegos: juegos dinámicos
Es posible representar un juego dinámico como un juego estático. Esto será útil
cuando veamos las predicciones. Para esto recuerde que debemos especificar un
plan completo de acciones contingentes para cada jugador cuando le toque
mover.
Tenemos entonces que:
I Jugadores: 1 y 2
I Conjunto de estrategias:
I Jugador 1: {L,R}
I Jugador 2: {{L’(L),L’(R)}, {L’(L), R’(R)}, {R’(L), L’(R)}, {R’(L), R’(R)}}
¿¿¿Cómo leemos el conjunto de estrategias del jugador 2???
No es difícil . . . recuerde que el jugador 2 tiene que estar preparado para
cualquier evento, esto es, tiene que tener una respuesta si 1 llega a jugar L
y una por si juega R. Cada elemento dentro del conjunto de estrategias de
2 son simplemente las posibles combinaciones de lo que haría si 1 juega L
o R.
I Por ejemplo: {L0(R), L0(L)} simplemente nos dice que el jugador 2 jugará
L’, indepediente de si 1 juega R o L.
16 / 25
Planes contingentes
Teoría de juegos: juegos dinámicos
I Con todo lo anterior ya estamos listos para representar nuestro juego
dinámico como un juego estático y construir nuestra matriz de pagos.
Figure: Matriz de pagos del juego en su forma normal
I ¿Cuántos equilibrios de Nash tiene el juego? ¿Hacen sentido todos los
equilibrios encontrados?
I ¿Por qué con inducción hacia atrás encontramos solo un equilibrio? ¿Tenía
este equilibrio sentido?
17 / 25
Teoría de juegos: juegos dinámicos
Ejemplo
Veamos el juego de Stackelberg: c1 = c2 = 0, qi (pi , pj) = (1 � 2pi + pj):
I Pensemos como la firma 1
I ¿Si elige p1 � 0, que hará la firma 2?
I Firma 2 es racional, por lo que maximizará sus utilidades. Luego firma 2
resolverá:
max
p2
⇡2(p1, p2) = p2(1 � 2p2 + p1)
I Calculando su mejor respuesta:
p2(p1) = R2(p1) = (1 + p1)/4
I Luego, la firma 2 tiene solo una estrategia consistente con inducción
inversa para cada p1 que pudiera elegir firma 1: p2(p1) = (1 + p1)/4.
18 / 25
Teoría de juegos: juegos dinámicos
Ejemplo
I Si la firma 1 es racional, se debiera anticipar a este comportamiento.
I Si elige p1, entonces sabe que la firma 2 eligira p2(p1) = (1 + p1)/4.
I En consecuencia, resolverá:
max
p1
⇡1(p1, p2(p1)) = p1(1 � 2p1 + p2(p1)) = p1(1 � 2p1 + (1 + p1)/4)
I Si maximizamos la funcion anterior con respecto a p1, se obtiene p1 = 514
I Las únicas estrategias consistente con inducción hacia atrás son:
I Firma 1: p1 = 5/14.
I Firma 2: p2 = (1 + p1)/4= 19/56
19 / 25
Teoría de juegos: juegos dinámicos
Ejemplo
I Es posible verificar que esto corresponde a un EN.
I Si la firma 1 elige p1, entonces la firma 2 elige óptimamente
p2 = (1 + p1)/4.
I Si la firma 2 elige p2 = (1 + p1)/4, entonces la firma 1 elige óptimamente
p1 = 5/14
I También podemos encontrar otros EN que no sobreviven a la prueba de
inducción hacia atras, por ejemplo:
p1 = 1/3 y p2 = 1/3
Recuerde que este fue el EN cuando habia competencia imperfecta con
productos diferenciados. Si bien, este es también un EN en este juego
dinámico expresado en su forma normal, no sobrevive la prueba de inducción
hacia atrás.
20 / 25
Teoría de juegos: juegos dinámicos
Resumen
Resumen:
I EN predice equilibrios que no tienen sentido en juegos dinámicos.
I El resultado de inducción inversa elimina los equilibrios que no tienen
sentido en el juego dinámico y a su vez es siempre un EN.
I Por tanto, un equilibrio de inducción inversa o hacia atrás es siempre un
EN, pero no al revés.
Estos conceptos de equilibrio se pueden generalizar para juegos con muchos
jugadores, nodos de decisión y múltiples periodos.
21 / 25
Teoría de juegos: juegos dinámicos
Subjuego
Definición: Subjuego
I Para un juego dinámico con múltiples periodos definimos un subjuego
como el árbol que parte de un nodo de decisión.
I Se considera desde el nodo de decisión y todo lo que tenga el árbol en
adelante.
22 / 25
1
El '
juego completo es un
L R
subjuego
2
2
L
'
R '
L
'
R
'
Subjuegos
Y 1H Col
EPS :
siempre son EN ( no viceversa)
Hay 3 subjuegos
le '
subjvego es el juego original
p
L
R Hay 2 EN
EN :
2
2
{ i. {RYLIR ' CR }} l ? ) ( 'al (4) (8)
{ R , { R' ll ) , l' CR ) } }
Segundo subjuego
L EN dicen
2
juega R
"
¡
2 { L , { R ' ( L ) R ' ( p ✓Hace sentido
p
'
-1? ) ( b )
s , { R . { Rich , UCR ) } } v
" il !:/
-
R
'
Tercer svbjvego
Jr
R
Jz R Los EN dicen .
"
2
¡
① { Little ) R ' CR ×
R
'
(7) (g) ② { R . { Rich , UCR ) } }G-
El primer EN no induce un EN en el tercer
subjuego
.
En el juego completo los dos EN inducen EN en el juego completo
pero en cada subjuego evaluamos cada EN . En el tercer
svbjorgo , cuando 1 juega R el EN en este sub juego es jugar l
'
.
Sin
embargo el primer EN me dice
que va a jugar R
'
lo
que es
incorrecto
. Por esto el EN ① no induce un EN en todos los
subjurgos . Este EN : { R , { p ' ( L )
,
L
'
( R ) } } induce EN en todos
los sub juegos . Esto
implica que es un Eps
,
también es el
resultado de inducción hacia atrás
.
Teoría de juegos: juegos dinámicos
Equilibrio perfecto en subjuegos
Luego, podemos construir un nuevo concepto de equilibrio para juegos
dinámicos: Equilibrio Perfecto en Subjuegos (EPS)
I Una lista de estrategias es un equilibrio perfecto en subjuegos (EPS) si
induce un EN es todos sus subjuegos.
I Por lo mismo que vimos anteriormente, un EPS es un EN, pero no al revés.
I Para juegos simples como los analizados, EPS es simplemente inducción
inversa o inducción hacia atrás.
23 / 25
Teoría de juegos: juegos dinámicos
Equilibrio perfecto en subjuegos
Tenemos entonces que, por ejemplo:
I (R, {R 0(L), L0(R)}) es el único EPS del juego de la diapositiva 15.
I (p1 = 5/14, p2(p1) = 1+p14 = 19/56) es el único EPS del juego de
Stackelberg en precios.
24 / 25
Teoría de juegos: juegos dinámicos
Resumen
Resumen:
I Juegos estáticos: Jugadores, acciones y función de pagos
I Concepto equilibrio: Equilibrio de Nash.
I ¿Cómo encontrar los EN?
I Ver todas las posibilidades.
I Ver mejores respuestas de todos los jugadores e intersectar.
I Juegos dinámicos en forma extensiva: Jugadores, árbol con un nodo
inicial, nodos intermedios y nodos finales, acciones en cada nodo y
funciones de pago en cada nodo final.
I Concepto de equilibrio: Equilibrio perfecto en subjuegos.
I Esto último no permite eliminar EN que tienen amenazas no creíbles.
I ¿Cómo encontrar los EPS?
I Inducción inversa
25 / 25
mamar

Continuar navegando