Teoria de Juegos No Cooperativos_2009_2

•
Outros

Apuntes Generales
3/6/2022
¡Este material tiene más páginas!
Vista previa del material en texto
PONTIFICIA UNIVERSIDAD CATÓLICA DE CHILE
INSTITUTO DE ECONOMÍA
Teoŕıa de Juegos No Cooperativos
Profesor: José Miguel Sánchez Octubre de 2009
Introducción
Se busca modelar situaciones estratégicas entre agentes racionales (maximizadores de
utilidad o utilidad esperada) e “inteligentes” (entienden el juego, en particular su estructura
informacional).
Gibbons (1992)1 clasifica los juegos en cuatro clases, que serán estudiados en el mismo
orden a lo largo del apunte.
1. Juegos estáticos de información completa.
2. Juegos dinámicos de información completa.
3. Juegos estáticos de información incompleta.
4. Juegos dinámicos de información incompleta.
donde cada uno de ellos posee un concepto de estrategia y de equilibrio asociado.
1Gibbons, R. (1992) “A Primer in Game Theory”, Prentice Hall.
1
Parte 1
Juegos Estáticos de Información
Completa
Existen dos conceptos muy importantes en la teoŕıa de juegos, siendo éstos las acciones
disponibles y las estrategias. El conjunto de acciones de un jugador corresponde a lo que
éste puede hacer en el momento en el que le corresponda decidir. Dicho conjunto se escri-
birá como S = {a1, ..., an} donde ai es la i-ésima acción disponible para el jugador. Por otro
lado, las estrategias de un jugador especifican un plan de acción completo para cada posible
escenario en el cual le pueda jugar. Aśı informalmente las acciones indican qué es lo que
se hace, mientras que las estrategias implican un plan de acción completo que estipula una
acción para cada contingencia en la cual el jugador le pueda tocar mover.
En los juegos estáticos de información completa las estrategias de los jugadores son iguales
a las posibles acciones que ellos puedan emprender, por lo que se hablará indistintamente de
uno u otra forma sólo para este tipo de juego.
Definición 1.1
La representación en forma normal o estratégica de un juego con n jugadores especifica
los espacios de estrategias de los jugadores S1, S2, ..., Sn y sus funciones de pago u1, ..., un
donde ui(a1, a2, ..., an) y ai es la acción del jugador i. Dicho juego se expresa como:
G = {S1, S2, ..., Sn ; u1, ..., un}
Ejemplo 1
Cuando las dimensiones de los espacios de estrategias y el número de jugadores lo permi-
tan, es posible representar el juego usando una matriz de pagos. Usando esto, se expresa
sucintamente en forma normal el dilema del prisionero con la matriz del cuadro 1.1
2
Cuadro 1.1: Dilema del Prisionero
Preso 1 \Preso 2 No Confesar (NC) Confesar (C)
No Confesar (NC) (-1,-1) (-9,0)
Confesar C (0,-9) (-6,-6)
1.1. Equilibrio Estrategias Dominadas
Una estrategia se le dice dominada si el pago por usarla es menor que con otra indepen-
diente de lo que hagan los otros jugadores. La importancia que tienen estas estrategias es que
permite descartar ciertos desenlaces que jamás se producirán, dado el supuesto de jugadores
racionales. Formalmente:
Definición 1.2
En el juego en forma normal G = {S1, S2, ..., Sn ; u1, ..., un}, sean s′i y s′′i posibles estrategias
del jugador i, esto es s′i, s
′′
i ∈ Si. La estrategia s′i está estrictamente dominada por la
estrategia s′′i si para cada combinación de las estrategias de los jugadores restantes el pago
de i al usar s′i es estrictamente menor que el obtenido al usar s
′′
i :
ui(s1, ..., si−1, s
′
i, si+1, ..., sn) < ui(s1, ..., si−1, s
′′
i , si+1, ..., sn)
para cualquier sj ∈ Sj con j 6= i.
En el cuadro 1.1 se ve que para el jugador 1 la estrategia de no confesar está dominada
por la de confesar y de igual forma ocurre para el jugador 2. De esta forma, el equilibrio en
estrategias dominadas (EED) del dilema del prisionero anterior1 es:
EED={ (Confesar, Confesar) }
La definición 1.2 permite llevar a cabo la eliminación iterativa de estrategias estrictamente
dominadas, tal como se verá más adelante en el ejemplo 2. Sin embargo, el problema es que
en algunos juegos este procedimiento no puede llevarse a cabo, especialmente en juegos donde
el conjunto de estrategias es grande como el del cuadro 1.2 en donde EED={∅} pero śı existe
un equilibrio de Nash2.
Cuadro 1.2: Problemas con el Criterio de Dominancia
J1\J2 I C D
A (0,4) (4,0) (5,3)
M (4,0) (0,4) (5,3)
B (3,5) (3,5) (6,6)
Ejemplo 2
Considere el juego del cuadro 1.3. Como puede apreciarse, la estrategia “Derecha” para
1Es importante notar que los equilibrios siempre se definen en base a estrategias y no en base a pagos.
2Más adelante se define este concepto, pero dicho equilibrio es EN(G)={(B,D)}.
3
Cuadro 1.3: Estrategias Dominadas: Juego Original
J1 \J2 Izquierda Centro Derecha
Alta (1,0) (1,2) (0,1)
Baja (0,3) (0,1) (2,0)
el jugador 2 está estrictamente dominada por la estrategia “Centro”, debido a lo cual se
tachó la columna respectiva.
Debido a la eliminación de la estrategia “Derecha”, el juego se puede reducir al del cua-
dro 1.4, ya que la estrategia “Baja” está dominada por la estrategia “Alta” para el jugador 1.
Cuadro 1.4: Estrategias Dominadas: Segunda Iteración
J1 \J2 Izquierda Centro
Alta (1,0) (1,2)
Baja (0,3) (0,1)
Por último, dado que el juego se resume en el del cuadro 1.5 se tiene que EED={Alta,Centro}.
Cuadro 1.5: Estrategias Dominadas: Tercera Iteración
J1 \J2 Izquierda Centro
Alta (1,0) (1,2)
1.2. Equilibrio de Nash
Definición 1.3
En el juego en forma normal G = {S1, S2, ..., Sn ; u1, ..., un} las estrategias (S∗1 , S∗2 , ..., S∗n)
forman un equilibrio de Nash si para cada jugador i, S∗i es la mejor respuesta del jugador i
3
(o al menos una de ellas) a las estrategias de los otros n−1 jugadores (S∗1 , ..., S∗i−1, S∗i+1, ...S∗n).
Esto es:
ui(S
∗
1 , ..., S
∗
i−1, S
∗
i , S
∗
i+1, ...S
∗
n) ≥ ui(S∗1 , ..., S∗i−1, Si, S∗i+1, ...S∗n)
para todo Si ∈ Si por lo que S∗i soluciona el problema
máx
{Si∈Si}
ui(S
∗
1 , ..., S
∗
i−1, Si, S
∗
i+1, ...S
∗
n)
3Esto es, que maximiza la función de utilidad.
4
El equilibrio de Nash tiene la gran ventaja que es un equilibrio estable; esto es, una vez
alcanzado nadie tiene incentivos a desviarse de éste. A modo de desventaja es que puede no
existir (en estrategias puras) y puede no ser único.
El equilibrio de Nash es un concepto más poderoso que el equilibrio de estrategias domi-
nadas, en el siguiente sentido:
Si las estrategias (s∗1, ..., s
∗
n) constituyen un equilibrio de Nash, entonces sobreviven a la
eliminación iterativa de estrategias dominadas. Sin embargo, pueden existir estrategias que
sobreviven a la eliminación iterativa de estrategias dominadas y que no son parte de un
equilibrio de Nash4.
Por tanto si para el juego G se denota EED(G) al conjunto de estrategias que sobreviven
a la eliminación iterativa de estrategias dominadas y por EN(G) al conjunto de equilibrios
de Nash se tiene que
EN(G) ⊂ EED(G)
tal como muestra el siguiente resultado.
Teorema 1.1
En el juego en forma normal con n jugadores G = {S1, S2, ..., Sn ; u1, ..., un}, si las estrategias
(s∗1, s
∗
2, ..., s
∗
n) forman un equilibrio de Nash, entonces sobreviven a la eliminación iterativa
de estrategias estrictamente dominadas.
Demostración: Se procede por contradicción. Supóngamos que no se cumple, i.e. que
existe un equilibrio de Nash que es eliminado por la eliminación iterativa de estrategias
dominadas. Sea (s∗1, s
∗
2, ..., s
∗
n) el equilibrio de Nash descartado. Sea s
∗
i la primera estrategia
en ser descartada por ser estrictamente dominada. Entonces debe existir una estrategia s∗
′
i
que no ha sido eliminada de Si que domina estrictamente a s
∗
i por lo que
ui(s1, ..., si−1, s
∗
i , si+1, ..., sn)
para cada
(s1, ..., si−1, si+1, ..., sn)
que esté en las estrategias disponibles para los demás jugadores (las que no han sido aun
eliminadas). Como s∗i es la primera estrategia en ser eliminada, entonces se cumple que
ui(s
∗
1, ..., s
∗
i−1, s
∗
i , s
∗
i+1, ..., sn) < ui(s
∗
1, ..., s
∗
i−1, s
∗′
i , s
∗
i+1, ..., sn)
lo que contradice la definición 1.3 de equilibrio de Nash. Esto concluye la demostración.
Sin embargo, existe unconverso parcial al teorema anterior:
4Esto es, el equilibrio de Nash es un refinamiento del equilibrio de estrategias dominadas.
5
Teorema 1.2
En el juego en formal normal con n jugadores G = {S1, S2, ..., Sn; u1, ..., un}, si la eliminación
iterativa de las estrategias estrictamente dominadas descarta todas las estrategias excepto
(s∗1, s
∗
2, ..., s
∗
n), entonces estas últimas estrategias constituyen el único equilibrio de Nash del
juego G.
Demostración: Ver Gibbons (1992)5, pág 14.
1.3. Estrategias Mixtas
Se busca modelar la incertidumbre en juegos donde las estrategias a usar por parte
de los jugadores son aleatorias. Supongamos que el jugador i cuenta con K estrategias
puras Si = {si1, si2, ..., siK}. En este caso, se dice que una estrategia mixta para el jugador
i es una distribución de probabilidad (pi1, ..., piK) en donde pik es la probabilidad que el
jugador i escoja la estrategia sik para k = 1, ..., K. Como (pi1, ..., piK) es una distribución de
probabilidades, ésta debe satisfacer que 0 ≤ pik ≤ 1 para k = 1, ..., K y que pi1+· · ·+piK = 1.
Se usará pi para denotar una estrategia mixta del conjunto de distribuciones de probabilidad
sobre Si. Lo anterior se resume formalmente en la siguiente definición.
Definición 1.4
Considere el juego en forma normal G = {S1, ..., Sn;u1, ..., un} en donde Si = {si1, ..., siK}.
Una estrategia mixta para el jugador i es una distribución de probabilidad pi = (pi1, ..., piK)
sobre el espacio de estrategias Si con 0 ≤ pik ≤ 1 para k = 1, ..., K y que pi1 + · · ·+ piK = 1.
Teorema 1.3
(Nash, 1950) En el juego en forma normal de n jugadores, G = {S1, ..., Sn;u1, ..., un}, si
n es un número finito de jugadores y Si es un conjunto finito para i = 1, 2, ..., n, entonces
existe al menos un equilibrio de Nash, el cual posiblemente incluye estrategias mixtas.
Demostración: Emplea el teorema de punto fijo de Kakutani6 para correspondencias.
Ver Nash (1950)7.
Ejemplo 3
Considérese el juego de la batalla de los sexos, descrito en el cuadro 1.6. Dicho juego posee
dos equilibrios de Nash en estrategias puras, dados por
EN(G)={(Ópera,Ópera) ; (Boxeo,Boxeo)}
5Op. cit.
6Kakutani, S. (1941) “A Generalization of Brouwer’s Fixed Point Theorem” Duke Mathematical Journal
No 8, págs 457-459.
7Nash, J. “Equilibrium Points in n−person Games” Proceedings of the National Academy of Sciences,
No 36, págs. 48-49.
6
Cuadro 1.6: Batalla de los Sexos
Ella (J1)\Él (J2) Boxeo (p2) Ópera (1− p2)
Boxeo (p1) (1,2) (0,0)
Ópera (1− p1) (0,0) (2,1)
Supóngase que con probabilidad p2 él escoge boxeo y que ella lo cree aśı. De igual manera
él cree que ella escoge boxeo con probabilidad p1.
Jugador 1 (Ella):
Ella escoge ópera o boxeo de acuerdo a la maximización de la utilidad esperada. Aśı:
u1(boxeo) = 1 · p2 + (1− p2) · 0 = p2
u1(ópera) = 0 · p2 + 2 · (1− p2) = 2 · (1− p2)
por lo que para p2 = 2/3 ella estará indiferente entre ópera y boxeo, con p2 > 2/3 escoge
siempre boxeo (p1 = 1) y con p2 < 2/3 ella siempre escoge ópera (p1 = 0).
Jugador 2 (Él):
Análogamente a lo que ocurre con el jugador 1:
u2(boxeo) = 2 · p1 + 0 · (1− p1) = 2 · p1
u2(ópera) = 0 · p1 + 1 · (1− p1) = (1− p1)
por lo que para p1 = 1/3 él estará indiferente entre ópera y boxeo, con p1 > 1/3 escoge
siempre boxeo (p2 = 1) y con p2 < 1/3 él siempre escoge ópera (p2 = 0).
Aśı, los equilibrios de Nash, representados gráficamente en la figura 1.1, de este juego
son:
EN(G) =
(ópera,ópera) ; (boxeo,boxeo) ;
[2/3 ópera, 1/3 boxeo]︸ ︷︷ ︸
Estrategia Jugador 1
, [1/3 ópera, 2/3 boxeo]︸ ︷︷ ︸
Estrategia Jugador 2

7
1
3
2
3
p1
p2
1
1
Figura 1.1: Equilibrios de Nash de juego de la batalla de los sexos
8
Parte 2
Juegos Dinámicos de Información
Completa
En este tipo de juegos ocurre la primera (importante) distinción entre acción y estrategia.
En los juegos estáticos de información completa eran conceptos equivalentes, pero en los
juegos dinámicos una estrategia de un jugador debe especificar una acción para cualquier
desarrollo posible del juego en donde algún jugador deba decidir.
2.1. Representación en Forma Extensiva de un Juego
La representación en forma extensiva contiene toda la información de la representación
normal, más el orden de interacción entre los jugadores; esto es, especifica qué decisiones se
toman secuencial o simultáneamente.
Definición 2.1
Un nodo es un punto del juego en el cual algún jugador (el cual puede ser la naturaleza
también) decide una acción o donde el juego termina. A continuación se describen ciertos
nodos especiales.
1. Nodo Sucesor al nodo x: Es un nodo que puede ser alcanzado si se ha llegado al
nodo x.
2. Nodo Predecesor al Nodo x: Es un nodo que debe ser alcanzado antes de que el
nodo x sea alcanzado.
3. Nodo Inicial: Es el nodo sin predecesores.
4. Nodo Terminal: Es un nodo sin sucesores.
Definición 2.2
La rama de un nodo es una acción del conjunto de acciones posibles para el jugador en
9
dicho nodo dado. Una senda es una secuencia de nodos y ramas que llevan del nodo inicial
a un nodo terminal.
Definición 2.3
Un conjunto de información de un jugador es una colección de nodos de decisión que
satisface:
i) A dicho jugador le corresponde jugar.
ii) Cuando en el transcurso del juego se llega a un nodo de esta colección, al jugador que
le corresponde decidir no sabe a que nodo de este conjunto ha llegado con certeza.
Definición 2.4
Un árbol del juego consiste en:
i) Configuración de nodos que corren sin loops cerrados1 de un nodo inicial a los nodos
finales o terminales.
ii) Una indicación de qué nodo pertenece cada jugador (quién decide).
iii) Una indicación de si juega la naturaleza y si ésta juega, indica las probabilidades con
las que se determina la rama a seguir.
iv) Conjuntos de información en los que se dividen los nodos de los jugadores.
v) Los pagos del juego para cada jugador en cada nodo terminal.
Definición 2.5
La representación en su forma extensiva de un juego especifica los jugadores, el
timing de los turnos de cada jugador, las ramas que existen en cada nodo de decisión y los
pagos recibidos para cada jugador en cada nodo terminal.
Ejemplo 1
(Representación Extensiva del Dilema del Prisionero) El juego del cuadro 1.1 puede
representarse en forma extensiva mediante la figura 2.1. La elipse de color negro rodea los
nodos del conjunto de información del jugador 2. El hecho que haya más de un nodo dentro
de esta elipse se debe a que la estructura informacional del juego señala que al momento
de que al jugador 2 le toca mover no sabe si el jugador 1 coopera o no. Debido a que el
conjunto de información del jugador dos contiene más de un elemento, este juego se le dice
de información imperfecta.
1Esto quiere decir que no es posible avanzar desde un nodo cualquiera y llegar a este mismo nodo.
10
Figura 2.1: Forma Extensiva del Dilema del Prisionero
Jugador 1
Jugador 2
C NC
C NC C NC
(−6,−6)(0,−9) (−9, 0) (−1,−1)
Definición 2.6
Un juego se le dice de información imperfecta si al menos un jugador posee un conjunto
de información con más de un elemento.
2.2. Equilibrio de Nash Perfecto en Subjuegos
Considérese el siguiente ejemplo de un juego dinámico con información completa de la
figura 2.2.
Figura 2.2: Ejemplo Juego Dinámico de Información Completa
Jugador 1
Jugador 2
I D
I ′ D′ I ′ D′
(3, 1) (1, 2) (2, 1) (0, 0)
En este juego, el jugador 1 tiene un conjunto de información con un sólo elemento, mientras
que el jugador 2 tiene dos conjuntos de información con un sólo elemento (uno para cada
curso de acción que emprenda el jugador 1).
Definición 2.7
Una estrategia es un plan completo de acción que especifica una acción factible del ju-
gador en cada contingencia (cada conjunto de información) en la que el jugador le pudiese
corresponder decidir.
En el juego de la figura 2.2, las acciones factibles para el jugador 1 son
A1 = {I,D}
y el espacio de estrategias es
{I,D}11
Por su parte, las acciones para el jugador 2 son
A2 = {I ′, D′}
y debido a que hay dos conjuntos de información y dos posibles acciones, hay cuatro estra-
tegias posibles. Ellas son
{(I ′, I ′) , (I ′, D′) , (D′, I ′) , (D′, D′)}
donde la estrategia E = (x, y) se lee como “jugar x si el jugador 1 juega I y jugar y si el
jugador 1 juega D”. La representación en forma normal del juego es la del cuadro 2.1 y, como
se puede deducir de la discusión de la sección 2.1, hay información valiosa que se pierde y
ello provoca obtener equilibrios poco razonables.
Cuadro 2.1: Representación en Forma Normal Juego de la figura 2.2.
J1\J2 (I ′, I ′) (I ′, D′) (D′, I ′) (D′, D′)
I (3, 1) (3, 1) (1, 2) (1, 2)
D (2, 1) (0, 0) (2, 1) (0, 0)
En particular, del cuadro 2.1 se desprende que hay dos equilibrios de Nash en estrategias
puras.
EN(G) =
{(
D, (D′, I ′)
)
;
(
I, (D′, D′)
)}
Sin embargo, el equilibrio
(
D, (I ′, D′)
)
es poco razonable, pues si el jugador 1 se desv́ıa y
usa la estrategia I, la mejor respuesta del jugador 2 es D′ y no I ′. Debido a esto, se busca
refinar el concepto de equilibrio de Nash mediante la búsqueda de equilibrios de Nash que
sean perfectos en subjuegos ; i.e. que en cada nodo de decisión, el jugador realiza su mejor
respuesta.
Definición 2.8
Se define un subjuego como un juego en forma extensiva que cumple tres requisitos.
i) Empieza en un nodo de decisión n que es un conjunto de información en śı mismo2.
ii) Incluye todos los nodos de decisión (incluyendo los finales) que son subsecuentes del
nodo n.
iii) No intersecta (o particiona) a ningún conjunto de información3
2Esto es, contiene un sólo elemento.
3Es decir, si un nodo de decisión n′ sucede a n en el árbol, entonces todos los nodos que estén en el mismo
conjunto de información que contiene a n′ son también sucesores de n y, por tanto, deben incluirse en el
subjuego.
12
Definición 2.9
(Reinhard Selten, 1965) Un perfil de estrategias es un equilibrio perfecto en subjuegos
si éste cumple con dos condiciones:
i) Es un equilibrio de Nash del juego completo.
ii) Las reglas de acción relevantes son equilibrios de Nash para cada subjuego.
Notar que de acuerdo a la definición 2.8, el juego completo es también un subjuego.
Para obtener los equilibrios de Nash en cada subjuego se usa la inducción hacia atrás. Esto
consiste en determinar cual es la decisión óptima en los nodos predecesores a los finales y
con esta información resolver el juego reducido que resulta. Repitiendo el proceso se puede
encontrar el equilibrio perfecto en subjuegos.
Volviendo al juego de la figura 2.2, se aplica el refinamiento de la inducción hacia atrás.
El equilibrio perfecto en subjuegos se ilustra en la figura 2.3, en donde las ĺıneas gruesas
representan la mejor respuesta del jugador que decide en el nodo en el cual éstas comienzan,
explicitándose como se descarta el equilibrio
(
I, (D′, D′)
)
. El resultado del juego es(
D, (D′, I ′)
)
Figura 2.3: Inducción hacia atrás
Jugador 1
Jugador 2
I D
I ′ D′ I ′ D′
(3, 1) (1, 2) (2, 1) (0, 0)
Consideremos el juego de la figura 2.4. En dicho juego las estrategias disponibles para
cada individuo son
Agente 1: (D,D′′), (D, I ′′), (I,D′′), (I, I ′′)
Agente 2: D′, I ′
En donde la estrategia (I,D′′) significa jugar I en la primera etapa y usar D′′ en la segunda
etapa (si eventualmente se diera tal etapa). La resolución de dicho juego se ilustra en la
figura 2.5.
13
Figura 2.4: Ejemplo de Inducción hacia Atrás
D′
D
′′
I
I ′
I
′′
1
1
2
(0, 2)
(3, 0)
(1, 1)
(2, 0)
2.3. Juegos Repetidos
Un juego repetido es un juego estático que se juega con las mismas reglas durante varios
peŕıodos. En este sentido, existen de dos tipos:
i) Juegos Repetidos Finitos.
ii) Juegos Repetidos Infinitos.
De la inducción hacia atrás se sigue que si el juego que se repite posee un único equilibrio
de Nash, entonces el único equilibrio de Nash perfecto en subjuegos de este juego repetido
finitamente es que en cada repetición se juege el equilibrio de Nash del juego estático.
A continuación se estudian los juegos repetidos infinitamente. Considérese el dilema del
prisionero del cuadro 2.2 y supóngase que si los pagos en cada peŕıodo del preso i son
{Ui(1), Ui(2), ...} entonces el pago total es:
Πi =
Ui(1)
(1 + r)0
+
Ui(2)
(1 + r)1
+ · · ·
Supóngase que el preso 1 tiene la siguiente estrategia: juega s1 mientras el preso 2 juega
t1. Pero si el preso 2 usa t2, entonces el preso 1 usa s2 ad inf́ınitum. Ahora se busca la mejor
respuesta del jugador 2 frente a esta estrategia. Ella puede tomar sólo la siguiente forma:
i) Jugar t1 siempre.
14
Figura 2.5: Resolución Ejemplo de Inducción hacia Atrás
Tercera Etapa
D′
D
′′
I
I ′
I
′′
1
1
2
(0, 2)
(3, 0)
(1, 1)
(2, 0)
D
D′
I
I ′
1
2
(3, 0)
(1, 1)
(2, 0)
D
I
1
(1, 1)
(2, 0)
Segunda Etapa
Primera Etapa
15
Cuadro 2.2: Dilema del Prisionero
Preso 1 \Preso 2 t1 t2
s1 (5,5) (-3,8)
s2 (8,-3) (0,0)
ii) Desviarse una vez, jugando t2, y por tanto juega t2 de alĺı en adelante.
Notar que estas son las únicas posibilidades debido a que el juego de la etapa siguiente
es igual al original y si, en algún instante le conviene cooperar, entonces siempre le conviene
y de manera inversa, si en un instante tiene incentivos a desviarse, nunca querŕıa cooperar
y por tanto se desviaŕıa el primer turno.
Los pagos de la estrategia i) son
Π1 =
5
(1 + r)0
+
5
(1 + r)1
+
5
(1 + r)2
+ · · · = 5 · r + 1
r
En cambio, los pagos de la estrategia ii) son
8
(1 + r)0
+
0
(1 + r)1
+ · · · = 8
por lo que el jugador 2 coopera (i.e. usa la estrategia i)) para siempre en tanto
5 · r + 1
r
> 8⇔ r < 5
3
Sin embargo, el equilibrio de Nash de este juego no es único. Por ejemplo4 los siguientes
dos pares de estrategias configuran un equilibrio de Nash perfecto en subjuegos:
Equilibrio 2 El preso 1 alterna entre s1 y s2 mientras que el preso 2 usa t1 siempre. Si el
preso 2 se desv́ıa y juega t2, entonces el preso 1 juega s2 para siempre.
Equilibrio 3 El preso 2 alterna entre t1 y t2 mientras que el preso 1 usa s1 siempre. Si el
preso 1 se desv́ıa y juega s2, entonces el preso 2 juega t2 para siempre.
La razón de la existencia de equilibrios múltiples se haya en el siguiente teorema.
Teorema 2.1
(Teorema de Folk) Cualquier pago descontado factible puede ser sustentado como un
equilibrio en tanto cada jugador tenga un pago esperado que sea al menos tan grande como
el que el jugador puede asegurarse para śı mismo, aún cuando todos los jugadores juegen en
contra de él (castigo).
4Se deja de ejercicio la demostración.
16
Parte 3
Juegos Estáticos de Información
Incompleta
Supóngase que en un juego estático con dos jugadores, el jugador uno (J1) no sabe frente
a quién está jugando, pero sabe que es uno de dos tipos. En particular, sea S2 y N2 los
tipos que puede ser el jugador dos. Las matrices de pagos para ambas situaciones son las del
cuadro 3.1.
Cuadro 3.1: Ejemplo Juego Estático de Información Incompleta
Tipo S2 Tipo N2
J1\J2 O B
O (2,1) (0,0)
B (0,0) (1,2)
J1\J2 O B
O (2,0) (0,2)
B (0,1) (1,0)
La idea es modelar este tipo de situaciones donde el jugador uno no conoce las preferencias
del jugador 2.
3.1. Información Privada o Asimétrica
Definición 3.1
En un juego con información simétrica, el conjunto de información de un jugador ya
sea en cualquier nodo en el que el jugador elige una acción o en un nodo terminal contiene
los mismos elementos que los conjuntos de información de cualquier otro jugador. En caso
contrario, el juego es uno de información asimétrica.
3.2. Juegos Estáticos Bayesianos
En estos juegos existe incertidumbre respecto al tipo del otro jugador, donde “tipo”
denota aquello que es información privada. Sean ti el tipo del jugador i y Ti el conjunto de
17
tipos posibles para el jugador i, entonces se puede escribir la función de pagos como:
ui(a1, ..., an; ti) ti ∈ Ti
Se supondrá que si bien el jugadoruno no sabe que tipo es el jugador dos, él posee una
distribución de creencias con respecto a ello. De esta manera el análisis se lleva a cabo para
una estructura de probabilidades.
Bajo la definición 3.1 es posible que la información privada de un jugador sea algo que
afecta la función de pagos del otro jugador. Un ejemplo de esto es el caso de dos empresas
en donde sólo una de ellas conoce con certeza la demanda y la otra no. En este caso, es claro
que la demanda afecta la función de pagos de ambas firmas. Para el caso de n jugadores, esto
se captura permitiendo que la función de pagos del jugador i dependa no sólo de su propio
tipo, sino que del tipo de todos los jugadores (t1, t2, ..., tn), en cuyo caso la función de pagos
seŕıa:
ui(a1, ..., an; t1, t2, ..., tn) ∀ tj ∈ Tj con j = 1, 2, ..., n
Como el juego es estático, no hay información nueva que permita alterar el equilibrio
del juego. Esto no ocurre en juegos dinámicos bayesianos, en donde a medida que se repite
el juego hay aprendizaje sobre el tipo de los otros jugadores que se refleja en creencias a
posteriori que difieren de las a priori.
Sea pi(t−i|ti) la distribución de probabilidad que denota la creencia (a priori) que tiene
el jugador i respecto del tipo de los demás jugadores t−i dado su propio tipo. Usualmente,
se supone, a fin de simplificar notación más que nada, que ti y t−i son independientes y aśı:
pi(t−i|ti) = pi(t−i)
Definición 3.2
La representación en forma normal de un juego estático bayesiano de n jugadores
especifica:
Los espacios de acciones de los jugadores A1, A2, ..., An.
Sus espacios de tipos T1, T2, ..., Tn
Las creencias p1, p2, ..., pn
Las funciones de pago u1, u2, ..., un.
El tipo del jugador i, ti es conocido privadamente por el propio jugador i y determina la
función de pagos ui(a1, ..., an; ti) donde ti ∈ Ti.
El juego se denota de la siguiente forma:
G =
{
A1, ..., An ; T1, ..., Tn ; p1, ..., pn ; u1, ..., un
}
18
3.3. Transformación de Harsanyi1
La transformación de Harsanyi permite transformar un juego de información incompleta
en un juego con información completa pero imperfecta. Se enuncia, nuevamente y adecuándo-
la a nuestro contexto, la definición 2.6 de información perfecta e imperfecta.
Definición 3.3
Un juego se le dice de información perfecta si todos los jugadores saben, en cualquier
ronda, todos los movimientos que se han hecho a lo largo del juego. En caso contrario se le
dice de información imperfecta.
Para hacer la transformación se introduce un nuevo jugador, la naturaleza, el cual decide
inicialmente los tipos de los jugadores y luego se los revela a algunos participantes del juego.
El juego de información incompleta del cuadro 3.1 puede transformarse en un juego de
información imperfecta de acuerdo a la figura 3.1.
Figura 3.1: Juego del cuadro 3.1 Transformado según Harsanyi
O B
O B O B
(2, 1) (0, 0) (0, 0) (1, 2)
O B
O B O B
(2, 0) (0, 2) (0, 2) (1, 0)
1 1 1 1
2 2
S2 N2
Naturaleza
Pr[S2] = 0,5 Pr[N2] = 0,5
De manera general, la dinámica de la transformación de Harsanyi es la siguiente:
1) La naturaleza saca aleatoriamente un vector de tipos t = (t1, t2, ..., tn) con ti ∈ Ti para
todo i = 1, 2, ..., n.
2) La naturaleza revela ti sólo al jugador i (información privada del jugador i).
3) Los jugadores simultáneamente escogen acciones. Cada jugador i = 1, 2, ..., n elige algún
ai ∈ Ai.
4) Se reciben los pagos ui(a1, ..., an; ti).
Definición 3.4
Una estrategia (pura) para el jugador i debe especificar una acción factible para cada uno
de los posibles tipos de i. En particular, en un juego estático bayesiano
G =
{
A1, ..., An ; T1, ..., Tn ; p1, ..., pn ; u1, ..., un
}
1Desarrollada por John Harsanyi, quien fue premio Nobel de Economı́a en 1994.
19
una estrategia para el jugador i es una función si(ti) donde para cada tipo ti ∈ Ti especifica
una acción del conjunto factible Ai que el tipo ti elegiŕıa si es elegido por la naturaleza.
Definición 3.5
Una estrategia se le dice separadora si para cada ti ∈ Ti la función si(ti) especifica una
acción distinta ai ∈ Ai. Análogamente, una estrategia se le dice agrupadora si todos los
tipos ti ∈ Ti eligen la misma acción.
Definición 3.6
Un equilibrio de Nash Bayesiano en el juego estático bayesiano
G =
{
A1, ..., An ; T1, ..., Tn ; p1, ..., pn ; u1, ..., un
}
son las estrategias S∗ = (s∗1, s
∗
2, ..., s
∗
n) y creencias
(
p1(t−1), p2(t−2), ..., pn(t−n)
)
tales que
para cada jugador i y cada uno de sus tipos posibles ti ∈ Ti, la estrategia s∗i (ti) es una
solución a
máx
{ai∈Ai}
∑
t−i∈T−i
ui
(
s∗1(t1), ..., s
∗
i−1(ti−1), ai, s
∗
i+1(ti+1), ..., s
∗
n(tn)
)
· pi(t−i|ti)
donde T−i es el conjunto de posibles tipos de todos los jugadores menos el i−ésimo.
3.4. Ejemplo 1
Considérese el cuadro 3.1, en donde las creencias del jugador 1 son
Pr(t2 = S2) = 0,5. Aśı Pr(t2 = N2) = 1− 0,5 = 0,5.
Tipo S2 Tipo N2
J1\J2 O B
O (2,1) (0,0)
B (0,0) (1,2)
J1\J2 O B
O (2,0) (0,2)
B (0,1) (1,0)
En este ejemplo, las estrategias posibles del jugador 2 son:
Separadora: Tipo S2 juega O y un tipo N2 juega B. Esto se denota con:
(O
S2
, B
N2
)
Separadora: Tipo S2 juega B y un tipo N2 juega O. Esto se escribe como:
(B
S2
, O
N2
)
20
Agrupadora: Tipo S2 juega O y un tipo N2 juega O. Es decir:
(O,O)
Agrupadora: Tipo S2 juega B y un tipo N2 juega B.
(B,B)
Si, por ejemplo, el jugador 2 juega (O,O), entonces el pago esperado del jugador 1 si
juega O es
1
2
· 2 + 1
2
· 2 = 2
y si jugase B el pago esperado seŕıa
1
2
· 0 + 1
2
· 0 = 0
Repitiendo el proceso para cada una de las cuatro estrategias anteriores, se puede construir
la tabla 3.2.
Cuadro 3.2: Pagos Esperados Jugador 1
(O,O) (O,B) (B,O) (B,B)
O 2 1 1 0
B 0 1/2 1/2 1
Se tiene que en este juego hay un único equilibrio de Nash bayesiano. Considere el perfil
de estrategias
(
O, (O,O)
)
. Del cuadro 3.2 se sabe que la mejor respuesta del jugador 1 frente
a (O,O) es O, por lo que sólo hay que verificar si (O,O) es la mejor respuesta del jugador 2
frente a O.
Si el jugador 2 es de tipo S2, frente a O la acción óptima es O.
Si el jugador 2 es de tipo N2, frente a O la acción óptima es B.
De esta manera, al no ser (O,O) es la mejor respuesta del jugador 2 frente a O, se tiene
que el perfil de estrategias
(
O, (O,O)
)
no forman parte del equilibrio de Nash bayesiano. Sin
embargo, ya que (O,B) es la mejor respuesta del jugador 2 a O y gracias al cuadro 3.2 se
sabe que O es la mejor respuesta del jugador 1 frente a (O,B). De esta manera, se tiene el
siguiente equilibrio de Nash separador:
ENB(G) =
{(
O, (O,B)
)
; Pr[t2 = S2] = 0,5
}
3.5. Ejemplo 2
Considere un juego en donde ninguno de los jugadores conoce los tipos del otro de acuerdo
al cuadro 3.3.
21
Cuadro 3.3: Juego con Información Privada en ambos Jugadores
Tipo S2 Tipo N2
Tipo S1
J1\J2 O B
O (2,1) (0,0)
B (0,0) (1,2)
Tipo S1
J1\J2 O B
O (2,0) (0,2)
B (0,1) (1,0)
Tipo S2 Tipo N2
Tipo N1
J1\J2 O B
O (0,1) (2,0)
B (1,0) (0,2)
Tipo N1
J1\J2 O B
O (0,0) (2,2)
B (1,1) (0,0)
En donde las creencias de cada jugador son:
Jugador 1: Pr[t2 = S2] = 1/2 y Pr[t2 = N2] = 1/2
Jugador 2: Pr[t1 = S1] = 2/3 y Pr[t1 = N1] = 1/3
En este ejemplo, cada jugador puede usar las siguientes estrategias:
(O,O) (O,B) (B,O) (B,B)
Los cuadros siguientes expresan los pagos esperados de cada jugador y de cada tipo de éste
y se construyen de manera análoga al cuadro 3.2, explicando como obtener uno de los pagos
a modo de ilustración.
Pagos Jugador 1
Si el jugador 1 es de tipo S1, el jugador 2 usa la estrategia (B,B) entonces el pago
esperado de jugar B es:
1
2
· 1 + 1
2
· 1 = 1
Cuadro 3.4: Pagos Esperados para S1
J1\J2 (O,O) (O,B) (B,O) (B,B)
O 2 1 1 0
B 0 1/2 1/2 1
Si el jugador 1 es de tipo N1, el jugador 2 usa la estrategia (O,B) entonces el pago
esperado de jugar B es:
1
2
· 1 + 1
2
· 0 = 1
2
22
Cuadro 3.5: Pagos Esperados para N1
J1\J2 (O,O) (O,B) (B,O) (B,B)
O 0 1 1 2
B 1 1/2 1/2 0
Pagos Jugador 2Si el jugador 2 es de tipo S2, el jugador 1 usa la estrategia (B,O) entonces el pago
esperado de jugar O es:
2
3
· 0 + 1
3
· 1 = 1
3
Cuadro 3.6: Pagos Esperados para S2
J2\J1 (O,O) (O,B) (B,O) (B,B)
O 1 2/3 1/3 0
B 0 2/3 4/3 2
Como último ejemplo, si el jugador 2 es de tipo N2, el jugador 1 usa la estrategia (O,O)
entonces el pago esperado de jugar B es:
2
3
· 2 + 1
3
· 2 = 2
Cuadro 3.7: Pagos Esperados para N2
J2\J1 (O,O) (O,B) (B,O) (B,B)
O 0 1/3 2/3 1
B 2 4/3 2/3 0
Equilibrio de Nash Bayesiano
En este juego se tiene que:
A1 = {O,B} A2 = {O,B}
T1 = {S1, N1} T2 = {S2, N2}
p1 = {1/2, 1/2} p1 = {2/3, 1/3}
u1(a1, a2; t1) u2(a1, a2; t2)
Para encontrar el equilibrio de Nash bayesiano sólo se puede proceder mediante prueba
y error. Dadas las creencias, se procede a evaluar si tres candidatos a equilibrios son o no
23
equilibrios de Nash bayesianos.
Candidato 1
(
(O,B), (O,B)
)
Si el jugador 2 juega (O,B), un jugador 1 tipo S1 juega O, gracias al cuadro 3.4, pero un
jugador 1 tipo N1 frente a esta estrategia del jugador 2 prefiere jugar O por el cuadro 3.5.
De esta forma
(
(O,B), (O,B)
)
no forma parte de un equilibrio de Nash bayesiano.
Candidato 2
(
(O,O), (O,B)
)
Del análisis del candidato 1, se sabe que la mejor respuesta del jugador 1 frente a (O,B)
es (O,O). Hay que verificar que (O,B) es la mejor respuesta del jugador 2 frente a (O,O).
Si el jugador 2 es de tipo S2, frente a (O,B) escoge O gracias al cuadro 3.6. Por otro lado,
un jugador 2 tipo N2 escogeŕıa B frente a (O,B), gracias al cuadro 3.7. Aśı, este par de
estrategias forma parte de un equilibrio de Nash bayesiano.
Candidato 3
(
(B,O), (B,B)
)
Frente a (B,B), un jugador 1 tipo S1 escoge B (ver cuadro 3.4) mientras que uno de
tipo N1 elige O. Luego, en efecto, la mejor respuesta del jugador 1 a (B,B) es (B,O) y sólo
falta determinar que la mejor respuesta del jugador 2 frente a (B,O) es (B,B). Un jugador
2 tipo S2 frente a (B,O), del cuadro 3.6, escoge B y uno tipo N2 escoge O
2. De esta forma,
este perfil de estrategias conforma parte de un equilibrio de Nash bayesiano.
Finalmente, los equilibrios de Nash del juego son:
ENB(G) =
{(
(O,O), (O,B)
)
con creencias Pr[t1 = S1] = 2/3; Pr[t2 = S2] = 0,5(
(B,O), (B,B)
)
con creencias Pr[t1 = S1] = 2/3; Pr[t2 = S2] = 0,5
}
2Si bien hay indiferencia en este caso, de todas formas ella apoya al equilibrio de Nash bayesiano.
24
Parte 4
Juegos Dinámicos de Información
Incompleta
En este tipo de juegos se puede dar el aprendizaje; esto es, un jugador puede inferir
el tipo de otro a través del comportamiento del otro a lo largo del juego, modificando sus
creencias a priori a unas a posteriori sobre el tipo del otro jugador. Para que ello ocurra,
lógicamente este otro jugador ha de usar estrategias separadoras (o h́ıbridas) para que el
aprendizaje en efecto modifique las creencias. Este aprendizaje se lleva a cabo mediante el
teorema de Bayes:
Pr[A|B] = Pr[A ∩B]
Pr[B]
Para ilustrar los juegos dinámicos de información incompleta, se inicia con un ejemplo.
4.1. Siguiendo al Ĺıder
Suponga una situación en la que el jugador J no conoce con exactitud los pagos del
juego en forma precisa. En particular, el tiene una distribución a priori que representa las
creencias sobre la estructura de los pagos (distintos juegos) representadas en el cuadro 4.1.
Por su parte, el jugador R śı conoce que juego se está jugando. Los juegos se representan en
el cuadro 4.2. Para resolver el juego se realiza la transformación de Harsanyi que se aprecia
en el cuadro 4.3. De este modo, se modela como si la naturaleza moviese primero y eligiese
los pagos del juego de acuerdo a los juegos A, B o C según las probabilidades subjetivas del
jugador J. Luego el jugador R observa la movida de la naturaleza (pero no J).
25
Cuadro 4.1: Creencias del Jugador J
Creencias Juego
0.7 A
0.1 B
0.2 C
Cuadro 4.2: Creencia de los Pagos
R
L
S
J
J
L
L
S
S
(2, 2)
(−1,−1)
(−1,−1)
(1, 1)
Juego A
R
L
S
J
J
L
L
S
S
(5, 1)
(0, 2)
(−1,−1)
(2, 3)
Juego B
R
L
S
J
J
L
L
S
S
(0, 0)
(−1,−1)
(−1,−1)
(4, 4)
Juego C
26
Cuadro 4.3: Juego Completo Transformado
R
L
S
J
J
L
L
S
S
(2, 2)
(−1,−1)
(−1,−1)
(1, 1)
R
L
S
J
J
L
L
S
S
(5, 1)
(0, 2)
(−1,−1)
(2, 3)
R
L
S
J
J
L
L
S
S
(0, 0)
(−1,−1)
(−1,−1)
(4, 4)
A
B
C
N
0,7
0,2
0,1
27
En este último cuadro, se aprecia que el jugador J posee dos conjuntos de información,
consistentes en los nodos con puntos rojos o azules, debido a que el jugador J observa la
movida de R pero no la de la naturaleza. Por su parte, el jugador R posee tres conjuntos de
información con un sólo elemento (uno para cada estado de la naturaleza).
Definición 4.1
El tipo de un jugador es el conjunto de estrategias, partición de información y función
de pagos que escoge la naturaleza para algún jugador al inicio de un juego de información
incompleta. Un estado de la naturaleza es la elección del tipo hecha por la naturaleza.
Al igual que en la parte 3, las estrategias deben especificar un plan de acción para
cada contingencia que pueda enfrentar el jugador. Por ejemplo, considerando el juego del
cuadro 4.3, una estrategia posible del jugador R es la tripleta:
(LLS) =

Jugar L si A
Jugar L si B
Jugar S si C
Notar que esta estrategia especifica una acción a emprender para cada conjunto de informa-
ción del jugador R. Una estrategia para el jugador J es el par:
(LS) =
{
Jugar L si el jugador R usa L
Jugar S si el jugador R usa S
Un jugador tiene creencias acerca de los tipos de los demás jugadores y a medida
que los ve tomar decisiones, las actualiza bajo el supuesto de que están siguiendo un com-
portamiento de equilibrio. Luego, un equilibrio Bayesiano perfecto se usa para denotar un
equilibrio perfecto en subjuegos en donde los jugadores actualizan sus creencias de acuerdo
a la regla de Bayes. De manera informal, para determinar la existencia de un equilibrio se
debe realizar lo siguiente:
1. Se propone un candidato a equilibrio (un perfil de estrategias).
2. Obtener las creencias actualizadas según la regla de Bayes.
3. Dadas las creencias y dada la estrategia del otro, cada jugador debe elegir su mejor
respuesta simultáneamente.
A continuación se determina si
(
(LLS); (LS)
)
forma parte o no de un equilibrio bayesiano
perfecto.
28
Actualización de Creencias de cada Jugador
Dado que los conjuntos de información del jugador R tienen un sólo elemento, al mover
la naturaleza éste sabe con certeza el estado de la naturaleza prevaleciente, por lo que su
actualización resulta trivial. Para el jugador J, se requiere calcular:
Pr [A|L] Pr [B|L] Pr [C|L]
Pr [A|S] Pr [B|S] Pr [C|S]
•Pr[A|L]
Del teorema de Bayes, se tiene que
Pr[A|L] = Pr[L|A] · Pr[A]
Pr[L]
y por el teorema de la probabilidad total
Pr[L] = Pr[L|A] · Pr[A] + Pr[L|B] · Pr[B] + Pr[L|C] · Pr[C]
Dado que el jugador R usa la estrategia (LLS) es claro que
Pr[L|A] = 1 Pr[L|B] = 1 Pr[L|C] = 0
y dadas las creencias del cuadro 4.1 se tiene que
Pr[A|L] = 1 · 0,7
1 · 0,7 + 1 · 0,1 + 0
= 0,875
•Pr[B|L]
Pr[B|L] = Pr[L|B] · Pr[B]
Pr[L]
=
1 · 0,1
1 · 0,1 + 1 · 0,7 + 0
= 0,125
•Pr[C|L]
Pr[C|L] = Pr[L|C] · Pr[C]
Pr[L]
=
0 · 0,2
Pr[L]
= 0
De manera análoga se calcula el resto de las probabilidades.
Pr[A|S] = 0 Pr[B|S] = 0 Pr[C|S] = 1
Como último ejemplo se calcula Pr[C|S]
Pr[C|S] = Pr[S|C] · Pr[C]
Pr[S]
=
1 · 0,2
0 · Pr[S|A] + 0 · Pr[S|B] + 1 · 0,2
= 1
29
Mejor Respuesta de J dado (LLS) y las Creencias Actualizadas.
Los pagos al emplear cada acción posible, dado que el jugador R jugó L, son:
Pago esperado de Jugar L Pago esperado de Jugar S
2 · 0,875 + 1 · 0, 125 = 1,1875 −1 · 0,875 + 0,125 · 2 = −1,635
Aśı, la mejor respuesta de J dado que el jugador R usa L es L.
Si el jugador R usa S, el jugador J cree que, con probabilidad uno, la naturaleza jugó C.
La mejor respuesta de J ante S es emplear S.
De este modo, (LS) es la mejor respuesta del jugador J ante (LLS).
Mejor Respuestade R dado (LS) y las Creencias Actualizadas.
Dado que la naturaleza escoge A y que el jugador J usa la estrategia (LS), los pagos de
usar L o S son:
Pago esperado de Jugar L Pago esperado de Jugar S
2 1
Aśı, la mejor respuesta del jugador R ante (LS) en el estado A es L.
Si la naturaleza escoge B y el jugador J usa (LS), los pagos para cada acción son:
Pago esperado de Jugar L Pago esperado de Jugar S
5 2
Aśı, la mejor respuesta del jugador R ante (LS) en el estado B es L.
Finalmente, si la naturaleza escoge C y el jugador J usa (LS), los pagos para cada acción
son:
Pago esperado de Jugar L Pago esperado de Jugar S
0 4
En este caso, la mejor respuesta del jugador R ante (LS) es S.
De esta forma, (LLS) es la mejor respuesta del jugador R ante (LS).
30
Debido a que simultáneamente las estrategias del jugador R, (LLS), y la del jugador J,
(LS), son mejor respuesta una de otra, el par {(LLS) ; (LS)} forma parte de un equilibrio
bayesiano perfecto1.
4.2. Equilibrio de Nash Bayesiano Perfecto
Este concepto de equilibrio es un refinamiento del equilibrio de Nash Bayesiano que
elimina las promesas o amenazas no créıbles. Este punto es ilustrado por el siguiente juego
con información completa, pero imperfecta. El jugador 1 escoge entre tres acciones I, C y D.
Si el jugador 1 escoge D el juego termina sin que el jugador 2 mueva. Si el jugador 1 escoge
I o C, entonces el jugador 2 sabe que D no fue escogido, pero no sabe si I o C fue jugado, y
escoge entre dos acciones I ′ y D′ tras lo cual el juego termina. La representación extensiva se
haya en la figura 4.1, donde p es la creencia de que, dado que el jugador 2 juega, el jugador 1
haya usado la acción I. Por otro lado, la representación normal está en el cuadro 4.4, donde
los números subrayados indican la mejor respuesta de cada jugador donde haya un equilibrio
de Nash.
Figura 4.1: Representación en forma extensiva
Jugador 2
Jugador 1
(1, 3)
(2, 1) (0, 0) (0, 2) (0, 1)
D
I C
I ′ D′ D
′
I ′
(1− p)p
Cuadro 4.4: Representación normal del juego
Jugador 1\Jugador 2 I’ D’
I (2,1) (0,0)
C (0,2) (0,1)
D (1,3) (1,3)
El cuadro 4.4 señala que
EN(G) =
{
(I, I ′) ; (D,D′)
}
= EPS(G)
En este caso, los equilibrios de Nash son a su vez equilibrios perfectos en subjuegos debido
a que el único subjuego del juego es el juego completo. Sin embargo, el equilibrio (D,D′)
se sustenta en una amenaza no créıble. Esto se debe a que si el jugador llegara a mover, la
estrategia I ′ domina a D′ de manera que el jugador 1 no se verá inducido a jugar D bajo la
1Se resalta la palabra parte, pues más adelante se define formalmente un equilibrio bayesiano perfecto, el
cual no sólo consta de un par de estrategias, al igual que el equilibrio de Nash Bayesiano.
31
amenaza de que el jugador 2 jugará D′. De esta manera se requiere refinar el concepto de
equilibrio para eliminar el equilibrio de Nash (D,D′).
4.2.1. Requisitos para el Equilibrio Perfecto Bayesiano
Requisito 1
En cada conjunto de información, al jugador que le toca decidir debe tener una creencia
acerca del nodo en el conjunto de información que se ha alcanzado.
Notar que en este caso, una creencia es una distribución de probabilidad sobre los nodos
del conjunto de información. En particular, en conjuntos de información con un sólo elemento,
las creencias del jugador asignarán una probabilidad uno en el único nodo de decisión.
Requisito 2
Dadas sus creencias, las estrategias de los jugadores deben ser secuencialmente racio-
nales; esto es, en cada conjunto de información la acción tomada por el jugador al que le
toca mover y las estrategias del jugador de ah́ı en adelante (estrategias subsecuentes) deben
ser óptimas dada las creencias de ese jugador en ese conjunto de información y dada las
estrategias siguientes de los otros jugadores.
En la figura 4.1 el requisito 1 implica que si le toca mover al jugador 2, éste debe poseer
ciertas creencias respecto a si el jugador 1 jugó I o si jugó C. Dichas creencias están repre-
sentadas por las probabilidades p y (1− p). Luego, dadas las creencias, el pago esperado de
jugar D′ es
0 · p+ (1− p) · 1 = 1− p
mientras que el pago esperado de jugar I ′ es
1 · p+ 2 · (1− p) = 2− p
y debido a que 2 − p > 1 − p para cualquier p ∈ [0, 1], entonces el requisito 2 evita que se
elija D′. Por tanto, los requisitos 1 y 2 eliminan a (D,D′) como equilibrio.
Definición 4.2
Para un equilibrio dado en un juego en forma extensiva, se dice que un conjunto de informa-
ción está en la trayectoria de equilibrio si éste conjunto de información será alcanzado
con probabilidad positiva si el juego se juega con las estrategias de equilibrio. Análogamen-
te, un conjunto de información está fuera de la trayectoria de equilibrio si de forma
segura no será alcanzado si se juegan las estrategias de equilibrio.
Requisito 3
En los conjuntos de información en las trayectorias de equilibrio, las creencias están deter-
minadas por la regla de Bayes y las estrategias de equilibrio de los jugadores.
32
De este modo, en el juego de la figura 4.1, en el equilibrio perfecto en subjuegos (I, I ′),
debe ser el caso que p = 1 para el jugador 2. Es decir, dada la estrategia de equilibrio del
jugador 1, entonces el jugador 2 sabe en que nodo están.
Formalmente, un equilibrio consiste no sólo de una estrategia para cada jugador sino que
también incluye una creencia de cada jugador en cada conjunto de información en el cual al
jugador le toca decidir.
Requisito 4
En los conjuntos de información fuera de la trayectoria de equilibrio, las creencias se deter-
minan por la regla de Bayes y las estrategias de equilibrio de los otros jugadores cuando es
posible.
Definición 4.3
Un equilibrio perfecto bayesiano consiste en estrategias y creencias que satisfacen los
requisitos 1 al 4.
Ejemplo 1
Considérese el juego en su forma extensiva del la figura 4.2.
Figura 4.2: Ejemplo Equilibrio Perfecto Bayesiano
Jugador 3
Jugador 2
D
(1, 2, 1) (3, 3, 3) (0, 1, 2) (0, 1, 1)
L R
L′ R′ R′L′
(1− p)p
Jugador 1
A
(2, 0, 0)
Considerando el subjuego donde decide el jugador 2, la representación en forma normal
es la del cuadro 4.5.
Para este subjuego, se tiene que
EN(G) =
{
(L,R′)
}
⇒ EPS(G) =
{
(D,L,R′)
}
Estas estrategias, con las creencias p = 1 satisfacen los requisitos 1 al 3 y también satisfacen,
trivialmente, el requisito 4 porque no hay conjuntos de información fuera de la trayectoria
33
Cuadro 4.5: Subjuego en forma normal
Jugador 2\Jugador 3 L′ R′
L (2, 1) (3, 3)
R (1, 2) (1, 1)
de equilibrio, luego de acuerdo a la definición 4.3 (D,L,R′) con la creencia p = 1 es un
equilibrio perfecto bayesiano.
Considere ahora las estrategias (A,L, L′) junto a la creencia p = 0. Se tiene que ellas
también configuran un equilibrio de Nash y satisface los requisitos 1 al 3. El jugador 3 tiene
una creencia y actúa óptimamente de acuerdo a ella. Dado esto, los jugadores 1 y 2 actúan
óptimamente dada las estrategias subsecuentes de los otros jugadores. Pero este equilibrio
de Nash no es perfecto en subjuegos, ya que la creencia del jugador 3, p = 0 ,es incongruente
con la estrategia de 2 (no resulta óptima), pero los requerimientos 1 al 3 no imponen restric-
ciones en las creencias del jugador 3, ya que el conjunto de información de dicho jugador no
se alcanza con las estrategias predeterminadas. No obstante, el requisito 4 fuerza a que las
creencias del jugador 3 estén determinadas por la estrategia del jugador 2: si la estrategia
del jugador 2 es R entonces p = 0, pero si p = 1, entonces el requisito 2 obliga a que la
estrategia del jugador 3 sea R′, luego las estrategias (A,L, L′) con la creencia p = 0 no es un
equilibrio perfecto bayesiano.
Ejemplo 2
Considere el juego en su forma extensiva de la figura 4.3, en donde se omiten los pagos
intencionalmente.
Figura 4.3: Juego Ejemplo 2
Jugador 3
Jugador 2
D
L R
L′ R′ L′
(1− p)p
Jugador 1
A
A′
R′
Si la estrategia de equilibrio del jugador 1 es A, entonces elconjunto de información del
jugador 3 está fuera de la senda de equilibrio, pero ahora el requisito 4 no puede determinar
34
las creencias del jugador 3 a partir de la estrategia del jugador 2. Esto se debe a que si la
estrategia del jugador 2 es A′, entonces el requisito 4 no impone restricciones en las creencias
del jugador 3, pero si la estrategia del jugador 2 es L con probabilidad q1, R con probabilidad
q2 y A
′ con probabilidad 1− q1 − q2, entonces el requisito 4 dice que la creencia del jugador
3 debe ser:
p =
q1
q1 + q2
4.3. Juegos de Señalización
Existen situaciones, dentro de la economı́a de la información2, donde se quiere modelar
la interacción estratégica entre dos partes y en donde una de ellas trata de informar a la
otra acerca de su tipo a través de una señal. Un ejemplo de esta interacción es la decisión de
educación de las personas al saber que el nivel de ésta comunica, de manera más o menos
créıble, las competencias y habilidades de las personas.
Definición 4.4
Un juego de señalización es un juego dinámico de información incompleta con dos jugadores:
un emisor (S) y un receptor (R) en donde se cumplen los siguientes requisitos:
i) La naturaleza escoge un tipo ti para el emisor de un conjunto de tipos factibles T =
{t1, ..., tI} de acuerdo a la distribución de probabilidad p(ti), donde p(ti) > 0 para todo
i y
p(t1) + p(t2) + · · ·+ p(tI) = 1
ii) El emisor observa ti y elige un mensaje mj de un conjunto de mensajes factibles M =
{m1, ...,mJ}.
iii) El receptor observa mj, pero no ti, y luego escoge una acción ak del conjunto de acciones
factibles A = {a1, ...a,k }.
iv) Los pagos de cada jugador están dados por uS(mj, ak; ti) y aR(mj, ak; ti).
Un ejemplo de juegos de esta clase se haya en la figura 4.4, en donde se omiten los pagos.
En este juego se tiene que
T = {t1, t2} M = {m1,m2} A = {a1, a2} p(t1) = p
2Será estudiado en la siguiente parte del curso.
35
Figura 4.4: Forma Extensiva Juego de Señalización
p
(1− p)
Naturaleza
Emisor
Emisor
t1
t2
Receptor Receptor
m1
m1
m2
m2
Definición 4.5
Una estrategia para el emisor en un juego de señalización es una función m(ti) que es-
pecifica el mensaje elegido para cada tipo que la naturaleza puede haber escogido. Por otro
lado, una estrategia para el receptor es una función a(mj) que indica la acción emprendida
para cada mensaje que el emisor pueda enviar.
De acuerdo a la definición 4.5, en el ejemplo de la figura 4.4 cada jugador tiene cuatro
estrategias posibles.
Estrategias para el emisor
1) Jugar m1 si la naturaleza escogiese t1 o t2.
2) Jugar m1 si la naturaleza determina t1 y jugar m2 si la naturaleza escoge t2.
3) Jugar m2 si la naturaleza determina t1 y jugar m1 si la naturaleza escoge t2.
4) Jugar m2 si la naturaleza escogiese t1 o t2.
Estrategias para el receptor
1) Jugar a1 si el emisor env́ıa m1 o si env́ıa m2.
2) Jugar a1 si el emisor env́ıa m1 y jugar a2 si env́ıa m2.
3) Jugar a2 si el emisor env́ıa m1 y jugar a1 si env́ıa m2.
4) Jugar a2 si el emisor env́ıa m1 o si env́ıa m2.
Ahora se procede a reescribir los requisitos 1 al 4 para el juego de señalización. Debido
a que el emisor conoce la historia completa del juego cuando elige un mensaje, su elección
ocurre en un set de información singleton (con un sólo elemento) por lo que el requisito 1 se
cumple de manera trivial para el emisor. Para el receptor en cambio, su elección ocurre en
un conjunto de información no-singleton.
Requisito de Señalización 1
Después de observar cualquier mensaje mj ∈M, el receptor debe tener una creencia acerca
de que tipos pueden haber enviado mj. Se llama a esta creencia la distribución de probabilidad
36
µ(ti|mj) donde
µ(ti|mj) ≥ 0 ∀ ti ∈ T y
∑
ti∈T
µ(ti|mj) = 1
Requisito de Señalización 2
(Receptor) Para cada mensaje mj ∈ M, la acción del receptor a∗j(mj) debe maximizar
la utilidad esperada dada su creencia µ(ti|mj) acerca de que tipos puede haber emitido el
mensaje. Esto es, a∗j(mj) resuelve el problema
máx
{ak∈A}
∑
ti∈T
µ(ti|mj) · uR(ak; ti)
(Emisor) Simultáneamente con lo anterior, para todo ti ∈ T, el mensaje m∗(ti) debe maxi-
mizar la utilidad del emisor dada la estrategia a∗(mj); es decir, m
∗(ti) resuelve:
máx
{mj∈M}
uS(ak,mj; ti)
Requisito de Señalización 3
Para mj ∈M, si existe ti ∈ T tal que m∗(ti) = mj,3 entonces la creencia del receptor en el
conjunto de información correspondiente a mj deben derivarse usando la regla de Bayes y la
estrategia del emisor:
µ(ti|mj)
Definición 4.6
Un equilibrio perfecto bayesiano en estrategias puras en un juego de señalización con-
siste en un par de estrategias
(
m∗(ti) , a
∗(mj)
)
y en una creencia µ(ti|mj) que satisfacen los
requisitos de señalización 1, 2 y 3.
Ejemplo 3
Considere el juego de la figura ??. Sean (p, 1− p) y (q, 1− q) las creencias del receptor en
sus dos conjuntos de información. Este juego posee cuatro candidatos a equilibrios perfectos
bayesianos en estrategias puras.
1. Agrupador en L.
2. Agrupador en R.
3. Separador (L,R).
3Esto es; para cada conjunto de información en la senda de equilibrio.
37
4. Separador (R,L).
donde (m′,m′′) indica que un individuo tipo t1 env́ıa la señal m
′ y uno tipo t2 env́ıa la señal
m′′.
Figura 4.5: Ejemplo Juego de Señalización
0,5
0,5
Naturaleza
Emisor
Emisor
t1
t2
Receptor Receptor
L
L
R
R
u
d
u
d
u
d
u
d
(2, 1)
(0, 0)
(1, 0)
(1, 2)
(1, 3)
(4, 0)
(2, 4)
(0, 1)
p
(1− p)
q
(1− q)
Candidato 1: (L,L)
Estrategia del Receptor
Supóngase que existe un equilibrio en el cual la estrategia del emisor es (L,L), luego el
conjunto de información correspondiente a L está en la senda de equilibrio de manera que
las creencias
(
p, 1 − p
)
se determinan por la regla de Bayes. Intuitivamente, el recibir la
señal L no entrega información al receptor, pues ambos tipos env́ıan la misma, por lo que la
distribución a priori es igual a la a posteriori. Anaĺıticamente, esto se demuestra según:
Pr [t1|L] =
Pr [L|t1] · Pr [t1]
Pr [L]
⇒ Pr [t1|L] =
1 · 0,5
1
= 0,5
Dadas la estrategia (L,L) y las creencias p = 0,5 se busca la mejor respuesta de el
receptor frente a la acción L (en la senda de equilibrio).
Pago esperado de Jugar u Pago esperado de Jugar d
3 · 0,5 + 4 · 4 = 3,5 0 · 0,5 + 0,5 · 1 = 0,5
De este modo, frente a L la mejor respuesta del receptor es jugar u. Ahora se procede
a estudiar que hace el receptor en los conjuntos de información fuera de la trayectoria de
equilibrio. Sea q la probabilidad de que el emisor sea de tipo t1 dado que env́ıa la señal R.
Con esto, la utilidad esperada de jugar cada estrategia viene dado por lo siguiente.
E[UR(u|R)] = q · 1 + (1− q) · 0 = q
E[UR(d|R)] = q · 0 + (1− q) · 2 = 2(1− q)
38
Aśı, el receptor juega u si
q > 2− 2q ⇔ q > 2
3
y juega d si
q <
2
3
Estrategia del Emisor
La mejor respuesta del receptor frente a (L,L) es (u, u) si q >
2
3
y es (u, d) si q <
2
3
. Hay
que ver si la mejor respuesta del emisor frente a estas estrategias es o no (L,L).
Un emisor tipo t1 que juega R recibe los pagos
Pago esperado si q <
2
3
Pago esperado si q >
2
3
0 2
por lo que la acción L es la mejor respuesta sólo si q <
2
3
, pues en caso contrario un
emisor tipo t1 tiene incentivos a jugar R.
Un emisor tipo t2 que juega L, con lo que el receptor juega u, recibe los pagos el pago
de 2 que es mayor que el pago de jugar R para cualquier valor de q.
De esta manera, se ha probado que4:{
(L,L) , (u, d) , p = 0,5 , q ≤ 2
3
}
es un equilibrio perfecto bayesiano agrupador.
Candidato 2: (R,R)
Estrategia del Receptor
Supóngase que la estrategia de equilibrio del emisor es (R,R). De manera análoga al caso
anterior, la probabilidad revisada es q = 0,5 < 2/3 de manera que la mejor respuesta del
receptor a R es d, la cual otorga los pagos siguientes al emisor.
Pago tipo t1 Pago tipo t2
0 1
Pero, un individuo t1 puede obtener un pago de 1 jugando L, debido a que la mejor
respuesta del receptor a L es u para cualquier valor de p,de manera que no hay un equilibrio
perfecto bayesiano donde el emisor usa la estrategia (R,R).
4Cuando q = 2/3 el receptor está indiferente entre jugar u o d por lo que bien sustenta este equilibrio
bayesiano perfecto
39
Candidato 3: (L,R)
Si el emisor usa la estrategia (L,R) entonces ambos conjuntos de información estarán
en la trayectoria de equilibrio, por lo que ambas creencias (determinadas por p y q) vienen
dadas por la regla de Bayes. De hecho, en este caso:
p = Pr[t1|L] =
Pr[L|t1] · Pr[t1]
Pr[L]
=
1 · 0,5
1 · 0,5 + 0 · 0,5
= 1
ya que Pr[L] = Pr[L|t1] · Pr[t1] + Pr[L|t2] · Pr[t2]. Análogamente:
q = Pr[t1|R] =
Pr[R|t1] · Pr[t1]
Pr[R]
=
0 · 0,5
0 · 0,5 + 1 · 0,5
= 0
Las mejores respuestas del receptor frente a estas creencias son u y d respectivamente de
manera que el emisor recibe 1 independiente de su tipo, de manera que sólo puede chequearse
si las estrategias del emisor es óptima dada la estrategia del receptor (u, d). Sin embargo,
este no es el caso. Si el tipo t2 se desv́ıa usando L en vez de R, entonces el receptor responde
con u y t2 recibe 2 que es mayor que el pago de usar R.
Candidato 4: (R,L)
De igual manera que para el candidato anterior, la revisión de las creencias del receptor
dada la estrategia del emisor señala que p = 0 y que q = 1. Aśı, la mejor respuesta del
receptor es (u, u) y ambos tipos reciben un pago de 2. Si t1 se desviase jugando L, entonces
el receptor respondeŕıa con u y el pago del emisor t1 seŕıa 1. Luego no hay incentivos, para
un tipo t1, para desviarse de jugar R. Asimismo, si un tipo t2 se desviara y jugara R, el
receptor respondeŕıa con u y el tipo t2 obtendŕıa un pago de 1, por lo que tampoco tiene
incentivos a desviarse. De esta manera:{
(R,L) , (u, u) , p = 0 , q = 1
}
configura un equilibrio bayesiano perfecto separador.
40
	Juegos Estáticos de Información Completa
	Equilibrio Estrategias Dominadas
	Equilibrio de Nash
	Estrategias Mixtas
	Juegos Dinámicos de Información Completa
	Representación en Forma Extensiva de un Juego
	Equilibrio de Nash Perfecto en Subjuegos
	Juegos Repetidos
	Juegos Estáticos de Información Incompleta
	Información Privada o Asimétrica
	Juegos Estáticos Bayesianos
	Transformación de HarsanyiDesarrollada por John Harsanyi, quien fue premio Nobel de Economía en 1994.
	Ejemplo 1
	Ejemplo 2
	Juegos Dinámicos de Información Incompleta
	Siguiendo al Líder
	Equilibrio de Nash Bayesiano Perfecto
	Requisitos para el Equilibrio Perfecto Bayesiano
	Juegos de Señalización