Logo Studenta
¡Este material tiene más páginas!

Vista previa del material en texto

PONTIFICIA UNIVERSIDAD CATÓLICA DE CHILE
INSTITUTO DE ECONOMÍA
Teoŕıa de Juegos No Cooperativos
Profesor: José Miguel Sánchez Octubre de 2009
Introducción
Se busca modelar situaciones estratégicas entre agentes racionales (maximizadores de
utilidad o utilidad esperada) e “inteligentes” (entienden el juego, en particular su estructura
informacional).
Gibbons (1992)1 clasifica los juegos en cuatro clases, que serán estudiados en el mismo
orden a lo largo del apunte.
1. Juegos estáticos de información completa.
2. Juegos dinámicos de información completa.
3. Juegos estáticos de información incompleta.
4. Juegos dinámicos de información incompleta.
donde cada uno de ellos posee un concepto de estrategia y de equilibrio asociado.
1Gibbons, R. (1992) “A Primer in Game Theory”, Prentice Hall.
1
Parte 1
Juegos Estáticos de Información
Completa
Existen dos conceptos muy importantes en la teoŕıa de juegos, siendo éstos las acciones
disponibles y las estrategias. El conjunto de acciones de un jugador corresponde a lo que
éste puede hacer en el momento en el que le corresponda decidir. Dicho conjunto se escri-
birá como S = {a1, ..., an} donde ai es la i-ésima acción disponible para el jugador. Por otro
lado, las estrategias de un jugador especifican un plan de acción completo para cada posible
escenario en el cual le pueda jugar. Aśı informalmente las acciones indican qué es lo que
se hace, mientras que las estrategias implican un plan de acción completo que estipula una
acción para cada contingencia en la cual el jugador le pueda tocar mover.
En los juegos estáticos de información completa las estrategias de los jugadores son iguales
a las posibles acciones que ellos puedan emprender, por lo que se hablará indistintamente de
uno u otra forma sólo para este tipo de juego.
Definición 1.1
La representación en forma normal o estratégica de un juego con n jugadores especifica
los espacios de estrategias de los jugadores S1, S2, ..., Sn y sus funciones de pago u1, ..., un
donde ui(a1, a2, ..., an) y ai es la acción del jugador i. Dicho juego se expresa como:
G = {S1, S2, ..., Sn ; u1, ..., un}
Ejemplo 1
Cuando las dimensiones de los espacios de estrategias y el número de jugadores lo permi-
tan, es posible representar el juego usando una matriz de pagos. Usando esto, se expresa
sucintamente en forma normal el dilema del prisionero con la matriz del cuadro 1.1
2
Cuadro 1.1: Dilema del Prisionero
Preso 1 \Preso 2 No Confesar (NC) Confesar (C)
No Confesar (NC) (-1,-1) (-9,0)
Confesar C (0,-9) (-6,-6)
1.1. Equilibrio Estrategias Dominadas
Una estrategia se le dice dominada si el pago por usarla es menor que con otra indepen-
diente de lo que hagan los otros jugadores. La importancia que tienen estas estrategias es que
permite descartar ciertos desenlaces que jamás se producirán, dado el supuesto de jugadores
racionales. Formalmente:
Definición 1.2
En el juego en forma normal G = {S1, S2, ..., Sn ; u1, ..., un}, sean s′i y s′′i posibles estrategias
del jugador i, esto es s′i, s
′′
i ∈ Si. La estrategia s′i está estrictamente dominada por la
estrategia s′′i si para cada combinación de las estrategias de los jugadores restantes el pago
de i al usar s′i es estrictamente menor que el obtenido al usar s
′′
i :
ui(s1, ..., si−1, s
′
i, si+1, ..., sn) < ui(s1, ..., si−1, s
′′
i , si+1, ..., sn)
para cualquier sj ∈ Sj con j 6= i.
En el cuadro 1.1 se ve que para el jugador 1 la estrategia de no confesar está dominada
por la de confesar y de igual forma ocurre para el jugador 2. De esta forma, el equilibrio en
estrategias dominadas (EED) del dilema del prisionero anterior1 es:
EED={ (Confesar, Confesar) }
La definición 1.2 permite llevar a cabo la eliminación iterativa de estrategias estrictamente
dominadas, tal como se verá más adelante en el ejemplo 2. Sin embargo, el problema es que
en algunos juegos este procedimiento no puede llevarse a cabo, especialmente en juegos donde
el conjunto de estrategias es grande como el del cuadro 1.2 en donde EED={∅} pero śı existe
un equilibrio de Nash2.
Cuadro 1.2: Problemas con el Criterio de Dominancia
J1\J2 I C D
A (0,4) (4,0) (5,3)
M (4,0) (0,4) (5,3)
B (3,5) (3,5) (6,6)
Ejemplo 2
Considere el juego del cuadro 1.3. Como puede apreciarse, la estrategia “Derecha” para
1Es importante notar que los equilibrios siempre se definen en base a estrategias y no en base a pagos.
2Más adelante se define este concepto, pero dicho equilibrio es EN(G)={(B,D)}.
3
Cuadro 1.3: Estrategias Dominadas: Juego Original
J1 \J2 Izquierda Centro Derecha
Alta (1,0) (1,2) (0,1)
Baja (0,3) (0,1) (2,0)
el jugador 2 está estrictamente dominada por la estrategia “Centro”, debido a lo cual se
tachó la columna respectiva.
Debido a la eliminación de la estrategia “Derecha”, el juego se puede reducir al del cua-
dro 1.4, ya que la estrategia “Baja” está dominada por la estrategia “Alta” para el jugador 1.
Cuadro 1.4: Estrategias Dominadas: Segunda Iteración
J1 \J2 Izquierda Centro
Alta (1,0) (1,2)
Baja (0,3) (0,1)
Por último, dado que el juego se resume en el del cuadro 1.5 se tiene que EED={Alta,Centro}.
Cuadro 1.5: Estrategias Dominadas: Tercera Iteración
J1 \J2 Izquierda Centro
Alta (1,0) (1,2)
1.2. Equilibrio de Nash
Definición 1.3
En el juego en forma normal G = {S1, S2, ..., Sn ; u1, ..., un} las estrategias (S∗1 , S∗2 , ..., S∗n)
forman un equilibrio de Nash si para cada jugador i, S∗i es la mejor respuesta del jugador i
3
(o al menos una de ellas) a las estrategias de los otros n−1 jugadores (S∗1 , ..., S∗i−1, S∗i+1, ...S∗n).
Esto es:
ui(S
∗
1 , ..., S
∗
i−1, S
∗
i , S
∗
i+1, ...S
∗
n) ≥ ui(S∗1 , ..., S∗i−1, Si, S∗i+1, ...S∗n)
para todo Si ∈ Si por lo que S∗i soluciona el problema
máx
{Si∈Si}
ui(S
∗
1 , ..., S
∗
i−1, Si, S
∗
i+1, ...S
∗
n)
3Esto es, que maximiza la función de utilidad.
4
El equilibrio de Nash tiene la gran ventaja que es un equilibrio estable; esto es, una vez
alcanzado nadie tiene incentivos a desviarse de éste. A modo de desventaja es que puede no
existir (en estrategias puras) y puede no ser único.
El equilibrio de Nash es un concepto más poderoso que el equilibrio de estrategias domi-
nadas, en el siguiente sentido:
Si las estrategias (s∗1, ..., s
∗
n) constituyen un equilibrio de Nash, entonces sobreviven a la
eliminación iterativa de estrategias dominadas. Sin embargo, pueden existir estrategias que
sobreviven a la eliminación iterativa de estrategias dominadas y que no son parte de un
equilibrio de Nash4.
Por tanto si para el juego G se denota EED(G) al conjunto de estrategias que sobreviven
a la eliminación iterativa de estrategias dominadas y por EN(G) al conjunto de equilibrios
de Nash se tiene que
EN(G) ⊂ EED(G)
tal como muestra el siguiente resultado.
Teorema 1.1
En el juego en forma normal con n jugadores G = {S1, S2, ..., Sn ; u1, ..., un}, si las estrategias
(s∗1, s
∗
2, ..., s
∗
n) forman un equilibrio de Nash, entonces sobreviven a la eliminación iterativa
de estrategias estrictamente dominadas.
Demostración: Se procede por contradicción. Supóngamos que no se cumple, i.e. que
existe un equilibrio de Nash que es eliminado por la eliminación iterativa de estrategias
dominadas. Sea (s∗1, s
∗
2, ..., s
∗
n) el equilibrio de Nash descartado. Sea s
∗
i la primera estrategia
en ser descartada por ser estrictamente dominada. Entonces debe existir una estrategia s∗
′
i
que no ha sido eliminada de Si que domina estrictamente a s
∗
i por lo que
ui(s1, ..., si−1, s
∗
i , si+1, ..., sn)
para cada
(s1, ..., si−1, si+1, ..., sn)
que esté en las estrategias disponibles para los demás jugadores (las que no han sido aun
eliminadas). Como s∗i es la primera estrategia en ser eliminada, entonces se cumple que
ui(s
∗
1, ..., s
∗
i−1, s
∗
i , s
∗
i+1, ..., sn) < ui(s
∗
1, ..., s
∗
i−1, s
∗′
i , s
∗
i+1, ..., sn)
lo que contradice la definición 1.3 de equilibrio de Nash. Esto concluye la demostración.
Sin embargo, existe unconverso parcial al teorema anterior:
4Esto es, el equilibrio de Nash es un refinamiento del equilibrio de estrategias dominadas.
5
Teorema 1.2
En el juego en formal normal con n jugadores G = {S1, S2, ..., Sn; u1, ..., un}, si la eliminación
iterativa de las estrategias estrictamente dominadas descarta todas las estrategias excepto
(s∗1, s
∗
2, ..., s
∗
n), entonces estas últimas estrategias constituyen el único equilibrio de Nash del
juego G.
Demostración: Ver Gibbons (1992)5, pág 14.
1.3. Estrategias Mixtas
Se busca modelar la incertidumbre en juegos donde las estrategias a usar por parte
de los jugadores son aleatorias. Supongamos que el jugador i cuenta con K estrategias
puras Si = {si1, si2, ..., siK}. En este caso, se dice que una estrategia mixta para el jugador
i es una distribución de probabilidad (pi1, ..., piK) en donde pik es la probabilidad que el
jugador i escoja la estrategia sik para k = 1, ..., K. Como (pi1, ..., piK) es una distribución de
probabilidades, ésta debe satisfacer que 0 ≤ pik ≤ 1 para k = 1, ..., K y que pi1+· · ·+piK = 1.
Se usará pi para denotar una estrategia mixta del conjunto de distribuciones de probabilidad
sobre Si. Lo anterior se resume formalmente en la siguiente definición.
Definición 1.4
Considere el juego en forma normal G = {S1, ..., Sn;u1, ..., un} en donde Si = {si1, ..., siK}.
Una estrategia mixta para el jugador i es una distribución de probabilidad pi = (pi1, ..., piK)
sobre el espacio de estrategias Si con 0 ≤ pik ≤ 1 para k = 1, ..., K y que pi1 + · · ·+ piK = 1.
Teorema 1.3
(Nash, 1950) En el juego en forma normal de n jugadores, G = {S1, ..., Sn;u1, ..., un}, si
n es un número finito de jugadores y Si es un conjunto finito para i = 1, 2, ..., n, entonces
existe al menos un equilibrio de Nash, el cual posiblemente incluye estrategias mixtas.
Demostración: Emplea el teorema de punto fijo de Kakutani6 para correspondencias.
Ver Nash (1950)7.
Ejemplo 3
Considérese el juego de la batalla de los sexos, descrito en el cuadro 1.6. Dicho juego posee
dos equilibrios de Nash en estrategias puras, dados por
EN(G)={(Ópera,Ópera) ; (Boxeo,Boxeo)}
5Op. cit.
6Kakutani, S. (1941) “A Generalization of Brouwer’s Fixed Point Theorem” Duke Mathematical Journal
No 8, págs 457-459.
7Nash, J. “Equilibrium Points in n−person Games” Proceedings of the National Academy of Sciences,
No 36, págs. 48-49.
6
Cuadro 1.6: Batalla de los Sexos
Ella (J1)\Él (J2) Boxeo (p2) Ópera (1− p2)
Boxeo (p1) (1,2) (0,0)
Ópera (1− p1) (0,0) (2,1)
Supóngase que con probabilidad p2 él escoge boxeo y que ella lo cree aśı. De igual manera
él cree que ella escoge boxeo con probabilidad p1.
Jugador 1 (Ella):
Ella escoge ópera o boxeo de acuerdo a la maximización de la utilidad esperada. Aśı:
u1(boxeo) = 1 · p2 + (1− p2) · 0 = p2
u1(ópera) = 0 · p2 + 2 · (1− p2) = 2 · (1− p2)
por lo que para p2 = 2/3 ella estará indiferente entre ópera y boxeo, con p2 > 2/3 escoge
siempre boxeo (p1 = 1) y con p2 < 2/3 ella siempre escoge ópera (p1 = 0).
Jugador 2 (Él):
Análogamente a lo que ocurre con el jugador 1:
u2(boxeo) = 2 · p1 + 0 · (1− p1) = 2 · p1
u2(ópera) = 0 · p1 + 1 · (1− p1) = (1− p1)
por lo que para p1 = 1/3 él estará indiferente entre ópera y boxeo, con p1 > 1/3 escoge
siempre boxeo (p2 = 1) y con p2 < 1/3 él siempre escoge ópera (p2 = 0).
Aśı, los equilibrios de Nash, representados gráficamente en la figura 1.1, de este juego
son:
EN(G) =
(ópera,ópera) ; (boxeo,boxeo) ;
[2/3 ópera, 1/3 boxeo]︸ ︷︷ ︸
Estrategia Jugador 1
, [1/3 ópera, 2/3 boxeo]︸ ︷︷ ︸
Estrategia Jugador 2

7
1
3
2
3
p1
p2
1
1
Figura 1.1: Equilibrios de Nash de juego de la batalla de los sexos
8
Parte 2
Juegos Dinámicos de Información
Completa
En este tipo de juegos ocurre la primera (importante) distinción entre acción y estrategia.
En los juegos estáticos de información completa eran conceptos equivalentes, pero en los
juegos dinámicos una estrategia de un jugador debe especificar una acción para cualquier
desarrollo posible del juego en donde algún jugador deba decidir.
2.1. Representación en Forma Extensiva de un Juego
La representación en forma extensiva contiene toda la información de la representación
normal, más el orden de interacción entre los jugadores; esto es, especifica qué decisiones se
toman secuencial o simultáneamente.
Definición 2.1
Un nodo es un punto del juego en el cual algún jugador (el cual puede ser la naturaleza
también) decide una acción o donde el juego termina. A continuación se describen ciertos
nodos especiales.
1. Nodo Sucesor al nodo x: Es un nodo que puede ser alcanzado si se ha llegado al
nodo x.
2. Nodo Predecesor al Nodo x: Es un nodo que debe ser alcanzado antes de que el
nodo x sea alcanzado.
3. Nodo Inicial: Es el nodo sin predecesores.
4. Nodo Terminal: Es un nodo sin sucesores.
Definición 2.2
La rama de un nodo es una acción del conjunto de acciones posibles para el jugador en
9
dicho nodo dado. Una senda es una secuencia de nodos y ramas que llevan del nodo inicial
a un nodo terminal.
Definición 2.3
Un conjunto de información de un jugador es una colección de nodos de decisión que
satisface:
i) A dicho jugador le corresponde jugar.
ii) Cuando en el transcurso del juego se llega a un nodo de esta colección, al jugador que
le corresponde decidir no sabe a que nodo de este conjunto ha llegado con certeza.
Definición 2.4
Un árbol del juego consiste en:
i) Configuración de nodos que corren sin loops cerrados1 de un nodo inicial a los nodos
finales o terminales.
ii) Una indicación de qué nodo pertenece cada jugador (quién decide).
iii) Una indicación de si juega la naturaleza y si ésta juega, indica las probabilidades con
las que se determina la rama a seguir.
iv) Conjuntos de información en los que se dividen los nodos de los jugadores.
v) Los pagos del juego para cada jugador en cada nodo terminal.
Definición 2.5
La representación en su forma extensiva de un juego especifica los jugadores, el
timing de los turnos de cada jugador, las ramas que existen en cada nodo de decisión y los
pagos recibidos para cada jugador en cada nodo terminal.
Ejemplo 1
(Representación Extensiva del Dilema del Prisionero) El juego del cuadro 1.1 puede
representarse en forma extensiva mediante la figura 2.1. La elipse de color negro rodea los
nodos del conjunto de información del jugador 2. El hecho que haya más de un nodo dentro
de esta elipse se debe a que la estructura informacional del juego señala que al momento
de que al jugador 2 le toca mover no sabe si el jugador 1 coopera o no. Debido a que el
conjunto de información del jugador dos contiene más de un elemento, este juego se le dice
de información imperfecta.
1Esto quiere decir que no es posible avanzar desde un nodo cualquiera y llegar a este mismo nodo.
10
Figura 2.1: Forma Extensiva del Dilema del Prisionero
Jugador 1
Jugador 2
C NC
C NC C NC
(−6,−6)(0,−9) (−9, 0) (−1,−1)
Definición 2.6
Un juego se le dice de información imperfecta si al menos un jugador posee un conjunto
de información con más de un elemento.
2.2. Equilibrio de Nash Perfecto en Subjuegos
Considérese el siguiente ejemplo de un juego dinámico con información completa de la
figura 2.2.
Figura 2.2: Ejemplo Juego Dinámico de Información Completa
Jugador 1
Jugador 2
I D
I ′ D′ I ′ D′
(3, 1) (1, 2) (2, 1) (0, 0)
En este juego, el jugador 1 tiene un conjunto de información con un sólo elemento, mientras
que el jugador 2 tiene dos conjuntos de información con un sólo elemento (uno para cada
curso de acción que emprenda el jugador 1).
Definición 2.7
Una estrategia es un plan completo de acción que especifica una acción factible del ju-
gador en cada contingencia (cada conjunto de información) en la que el jugador le pudiese
corresponder decidir.
En el juego de la figura 2.2, las acciones factibles para el jugador 1 son
A1 = {I,D}
y el espacio de estrategias es
{I,D}11
Por su parte, las acciones para el jugador 2 son
A2 = {I ′, D′}
y debido a que hay dos conjuntos de información y dos posibles acciones, hay cuatro estra-
tegias posibles. Ellas son
{(I ′, I ′) , (I ′, D′) , (D′, I ′) , (D′, D′)}
donde la estrategia E = (x, y) se lee como “jugar x si el jugador 1 juega I y jugar y si el
jugador 1 juega D”. La representación en forma normal del juego es la del cuadro 2.1 y, como
se puede deducir de la discusión de la sección 2.1, hay información valiosa que se pierde y
ello provoca obtener equilibrios poco razonables.
Cuadro 2.1: Representación en Forma Normal Juego de la figura 2.2.
J1\J2 (I ′, I ′) (I ′, D′) (D′, I ′) (D′, D′)
I (3, 1) (3, 1) (1, 2) (1, 2)
D (2, 1) (0, 0) (2, 1) (0, 0)
En particular, del cuadro 2.1 se desprende que hay dos equilibrios de Nash en estrategias
puras.
EN(G) =
{(
D, (D′, I ′)
)
;
(
I, (D′, D′)
)}
Sin embargo, el equilibrio
(
D, (I ′, D′)
)
es poco razonable, pues si el jugador 1 se desv́ıa y
usa la estrategia I, la mejor respuesta del jugador 2 es D′ y no I ′. Debido a esto, se busca
refinar el concepto de equilibrio de Nash mediante la búsqueda de equilibrios de Nash que
sean perfectos en subjuegos ; i.e. que en cada nodo de decisión, el jugador realiza su mejor
respuesta.
Definición 2.8
Se define un subjuego como un juego en forma extensiva que cumple tres requisitos.
i) Empieza en un nodo de decisión n que es un conjunto de información en śı mismo2.
ii) Incluye todos los nodos de decisión (incluyendo los finales) que son subsecuentes del
nodo n.
iii) No intersecta (o particiona) a ningún conjunto de información3
2Esto es, contiene un sólo elemento.
3Es decir, si un nodo de decisión n′ sucede a n en el árbol, entonces todos los nodos que estén en el mismo
conjunto de información que contiene a n′ son también sucesores de n y, por tanto, deben incluirse en el
subjuego.
12
Definición 2.9
(Reinhard Selten, 1965) Un perfil de estrategias es un equilibrio perfecto en subjuegos
si éste cumple con dos condiciones:
i) Es un equilibrio de Nash del juego completo.
ii) Las reglas de acción relevantes son equilibrios de Nash para cada subjuego.
Notar que de acuerdo a la definición 2.8, el juego completo es también un subjuego.
Para obtener los equilibrios de Nash en cada subjuego se usa la inducción hacia atrás. Esto
consiste en determinar cual es la decisión óptima en los nodos predecesores a los finales y
con esta información resolver el juego reducido que resulta. Repitiendo el proceso se puede
encontrar el equilibrio perfecto en subjuegos.
Volviendo al juego de la figura 2.2, se aplica el refinamiento de la inducción hacia atrás.
El equilibrio perfecto en subjuegos se ilustra en la figura 2.3, en donde las ĺıneas gruesas
representan la mejor respuesta del jugador que decide en el nodo en el cual éstas comienzan,
explicitándose como se descarta el equilibrio
(
I, (D′, D′)
)
. El resultado del juego es(
D, (D′, I ′)
)
Figura 2.3: Inducción hacia atrás
Jugador 1
Jugador 2
I D
I ′ D′ I ′ D′
(3, 1) (1, 2) (2, 1) (0, 0)
Consideremos el juego de la figura 2.4. En dicho juego las estrategias disponibles para
cada individuo son
Agente 1: (D,D′′), (D, I ′′), (I,D′′), (I, I ′′)
Agente 2: D′, I ′
En donde la estrategia (I,D′′) significa jugar I en la primera etapa y usar D′′ en la segunda
etapa (si eventualmente se diera tal etapa). La resolución de dicho juego se ilustra en la
figura 2.5.
13
Figura 2.4: Ejemplo de Inducción hacia Atrás
D′
D
′′
I
I ′
I
′′
1
1
2
(0, 2)
(3, 0)
(1, 1)
(2, 0)
2.3. Juegos Repetidos
Un juego repetido es un juego estático que se juega con las mismas reglas durante varios
peŕıodos. En este sentido, existen de dos tipos:
i) Juegos Repetidos Finitos.
ii) Juegos Repetidos Infinitos.
De la inducción hacia atrás se sigue que si el juego que se repite posee un único equilibrio
de Nash, entonces el único equilibrio de Nash perfecto en subjuegos de este juego repetido
finitamente es que en cada repetición se juege el equilibrio de Nash del juego estático.
A continuación se estudian los juegos repetidos infinitamente. Considérese el dilema del
prisionero del cuadro 2.2 y supóngase que si los pagos en cada peŕıodo del preso i son
{Ui(1), Ui(2), ...} entonces el pago total es:
Πi =
Ui(1)
(1 + r)0
+
Ui(2)
(1 + r)1
+ · · ·
Supóngase que el preso 1 tiene la siguiente estrategia: juega s1 mientras el preso 2 juega
t1. Pero si el preso 2 usa t2, entonces el preso 1 usa s2 ad inf́ınitum. Ahora se busca la mejor
respuesta del jugador 2 frente a esta estrategia. Ella puede tomar sólo la siguiente forma:
i) Jugar t1 siempre.
14
Figura 2.5: Resolución Ejemplo de Inducción hacia Atrás
Tercera Etapa
D′
D
′′
I
I ′
I
′′
1
1
2
(0, 2)
(3, 0)
(1, 1)
(2, 0)
D
D′
I
I ′
1
2
(3, 0)
(1, 1)
(2, 0)
D
I
1
(1, 1)
(2, 0)
Segunda Etapa
Primera Etapa
15
Cuadro 2.2: Dilema del Prisionero
Preso 1 \Preso 2 t1 t2
s1 (5,5) (-3,8)
s2 (8,-3) (0,0)
ii) Desviarse una vez, jugando t2, y por tanto juega t2 de alĺı en adelante.
Notar que estas son las únicas posibilidades debido a que el juego de la etapa siguiente
es igual al original y si, en algún instante le conviene cooperar, entonces siempre le conviene
y de manera inversa, si en un instante tiene incentivos a desviarse, nunca querŕıa cooperar
y por tanto se desviaŕıa el primer turno.
Los pagos de la estrategia i) son
Π1 =
5
(1 + r)0
+
5
(1 + r)1
+
5
(1 + r)2
+ · · · = 5 · r + 1
r
En cambio, los pagos de la estrategia ii) son
8
(1 + r)0
+
0
(1 + r)1
+ · · · = 8
por lo que el jugador 2 coopera (i.e. usa la estrategia i)) para siempre en tanto
5 · r + 1
r
> 8⇔ r < 5
3
Sin embargo, el equilibrio de Nash de este juego no es único. Por ejemplo4 los siguientes
dos pares de estrategias configuran un equilibrio de Nash perfecto en subjuegos:
Equilibrio 2 El preso 1 alterna entre s1 y s2 mientras que el preso 2 usa t1 siempre. Si el
preso 2 se desv́ıa y juega t2, entonces el preso 1 juega s2 para siempre.
Equilibrio 3 El preso 2 alterna entre t1 y t2 mientras que el preso 1 usa s1 siempre. Si el
preso 1 se desv́ıa y juega s2, entonces el preso 2 juega t2 para siempre.
La razón de la existencia de equilibrios múltiples se haya en el siguiente teorema.
Teorema 2.1
(Teorema de Folk) Cualquier pago descontado factible puede ser sustentado como un
equilibrio en tanto cada jugador tenga un pago esperado que sea al menos tan grande como
el que el jugador puede asegurarse para śı mismo, aún cuando todos los jugadores juegen en
contra de él (castigo).
4Se deja de ejercicio la demostración.
16
Parte 3
Juegos Estáticos de Información
Incompleta
Supóngase que en un juego estático con dos jugadores, el jugador uno (J1) no sabe frente
a quién está jugando, pero sabe que es uno de dos tipos. En particular, sea S2 y N2 los
tipos que puede ser el jugador dos. Las matrices de pagos para ambas situaciones son las del
cuadro 3.1.
Cuadro 3.1: Ejemplo Juego Estático de Información Incompleta
Tipo S2 Tipo N2
J1\J2 O B
O (2,1) (0,0)
B (0,0) (1,2)
J1\J2 O B
O (2,0) (0,2)
B (0,1) (1,0)
La idea es modelar este tipo de situaciones donde el jugador uno no conoce las preferencias
del jugador 2.
3.1. Información Privada o Asimétrica
Definición 3.1
En un juego con información simétrica, el conjunto de información de un jugador ya
sea en cualquier nodo en el que el jugador elige una acción o en un nodo terminal contiene
los mismos elementos que los conjuntos de información de cualquier otro jugador. En caso
contrario, el juego es uno de información asimétrica.
3.2. Juegos Estáticos Bayesianos
En estos juegos existe incertidumbre respecto al tipo del otro jugador, donde “tipo”
denota aquello que es información privada. Sean ti el tipo del jugador i y Ti el conjunto de
17
tipos posibles para el jugador i, entonces se puede escribir la función de pagos como:
ui(a1, ..., an; ti) ti ∈ Ti
Se supondrá que si bien el jugadoruno no sabe que tipo es el jugador dos, él posee una
distribución de creencias con respecto a ello. De esta manera el análisis se lleva a cabo para
una estructura de probabilidades.
Bajo la definición 3.1 es posible que la información privada de un jugador sea algo que
afecta la función de pagos del otro jugador. Un ejemplo de esto es el caso de dos empresas
en donde sólo una de ellas conoce con certeza la demanda y la otra no. En este caso, es claro
que la demanda afecta la función de pagos de ambas firmas. Para el caso de n jugadores, esto
se captura permitiendo que la función de pagos del jugador i dependa no sólo de su propio
tipo, sino que del tipo de todos los jugadores (t1, t2, ..., tn), en cuyo caso la función de pagos
seŕıa:
ui(a1, ..., an; t1, t2, ..., tn) ∀ tj ∈ Tj con j = 1, 2, ..., n
Como el juego es estático, no hay información nueva que permita alterar el equilibrio
del juego. Esto no ocurre en juegos dinámicos bayesianos, en donde a medida que se repite
el juego hay aprendizaje sobre el tipo de los otros jugadores que se refleja en creencias a
posteriori que difieren de las a priori.
Sea pi(t−i|ti) la distribución de probabilidad que denota la creencia (a priori) que tiene
el jugador i respecto del tipo de los demás jugadores t−i dado su propio tipo. Usualmente,
se supone, a fin de simplificar notación más que nada, que ti y t−i son independientes y aśı:
pi(t−i|ti) = pi(t−i)
Definición 3.2
La representación en forma normal de un juego estático bayesiano de n jugadores
especifica:
Los espacios de acciones de los jugadores A1, A2, ..., An.
Sus espacios de tipos T1, T2, ..., Tn
Las creencias p1, p2, ..., pn
Las funciones de pago u1, u2, ..., un.
El tipo del jugador i, ti es conocido privadamente por el propio jugador i y determina la
función de pagos ui(a1, ..., an; ti) donde ti ∈ Ti.
El juego se denota de la siguiente forma:
G =
{
A1, ..., An ; T1, ..., Tn ; p1, ..., pn ; u1, ..., un
}
18
3.3. Transformación de Harsanyi1
La transformación de Harsanyi permite transformar un juego de información incompleta
en un juego con información completa pero imperfecta. Se enuncia, nuevamente y adecuándo-
la a nuestro contexto, la definición 2.6 de información perfecta e imperfecta.
Definición 3.3
Un juego se le dice de información perfecta si todos los jugadores saben, en cualquier
ronda, todos los movimientos que se han hecho a lo largo del juego. En caso contrario se le
dice de información imperfecta.
Para hacer la transformación se introduce un nuevo jugador, la naturaleza, el cual decide
inicialmente los tipos de los jugadores y luego se los revela a algunos participantes del juego.
El juego de información incompleta del cuadro 3.1 puede transformarse en un juego de
información imperfecta de acuerdo a la figura 3.1.
Figura 3.1: Juego del cuadro 3.1 Transformado según Harsanyi
O B
O B O B
(2, 1) (0, 0) (0, 0) (1, 2)
O B
O B O B
(2, 0) (0, 2) (0, 2) (1, 0)
1 1 1 1
2 2
S2 N2
Naturaleza
Pr[S2] = 0,5 Pr[N2] = 0,5
De manera general, la dinámica de la transformación de Harsanyi es la siguiente:
1) La naturaleza saca aleatoriamente un vector de tipos t = (t1, t2, ..., tn) con ti ∈ Ti para
todo i = 1, 2, ..., n.
2) La naturaleza revela ti sólo al jugador i (información privada del jugador i).
3) Los jugadores simultáneamente escogen acciones. Cada jugador i = 1, 2, ..., n elige algún
ai ∈ Ai.
4) Se reciben los pagos ui(a1, ..., an; ti).
Definición 3.4
Una estrategia (pura) para el jugador i debe especificar una acción factible para cada uno
de los posibles tipos de i. En particular, en un juego estático bayesiano
G =
{
A1, ..., An ; T1, ..., Tn ; p1, ..., pn ; u1, ..., un
}
1Desarrollada por John Harsanyi, quien fue premio Nobel de Economı́a en 1994.
19
una estrategia para el jugador i es una función si(ti) donde para cada tipo ti ∈ Ti especifica
una acción del conjunto factible Ai que el tipo ti elegiŕıa si es elegido por la naturaleza.
Definición 3.5
Una estrategia se le dice separadora si para cada ti ∈ Ti la función si(ti) especifica una
acción distinta ai ∈ Ai. Análogamente, una estrategia se le dice agrupadora si todos los
tipos ti ∈ Ti eligen la misma acción.
Definición 3.6
Un equilibrio de Nash Bayesiano en el juego estático bayesiano
G =
{
A1, ..., An ; T1, ..., Tn ; p1, ..., pn ; u1, ..., un
}
son las estrategias S∗ = (s∗1, s
∗
2, ..., s
∗
n) y creencias
(
p1(t−1), p2(t−2), ..., pn(t−n)
)
tales que
para cada jugador i y cada uno de sus tipos posibles ti ∈ Ti, la estrategia s∗i (ti) es una
solución a
máx
{ai∈Ai}
∑
t−i∈T−i
ui
(
s∗1(t1), ..., s
∗
i−1(ti−1), ai, s
∗
i+1(ti+1), ..., s
∗
n(tn)
)
· pi(t−i|ti)
donde T−i es el conjunto de posibles tipos de todos los jugadores menos el i−ésimo.
3.4. Ejemplo 1
Considérese el cuadro 3.1, en donde las creencias del jugador 1 son
Pr(t2 = S2) = 0,5. Aśı Pr(t2 = N2) = 1− 0,5 = 0,5.
Tipo S2 Tipo N2
J1\J2 O B
O (2,1) (0,0)
B (0,0) (1,2)
J1\J2 O B
O (2,0) (0,2)
B (0,1) (1,0)
En este ejemplo, las estrategias posibles del jugador 2 son:
Separadora: Tipo S2 juega O y un tipo N2 juega B. Esto se denota con:
(O
S2
, B
N2
)
Separadora: Tipo S2 juega B y un tipo N2 juega O. Esto se escribe como:
(B
S2
, O
N2
)
20
Agrupadora: Tipo S2 juega O y un tipo N2 juega O. Es decir:
(O,O)
Agrupadora: Tipo S2 juega B y un tipo N2 juega B.
(B,B)
Si, por ejemplo, el jugador 2 juega (O,O), entonces el pago esperado del jugador 1 si
juega O es
1
2
· 2 + 1
2
· 2 = 2
y si jugase B el pago esperado seŕıa
1
2
· 0 + 1
2
· 0 = 0
Repitiendo el proceso para cada una de las cuatro estrategias anteriores, se puede construir
la tabla 3.2.
Cuadro 3.2: Pagos Esperados Jugador 1
(O,O) (O,B) (B,O) (B,B)
O 2 1 1 0
B 0 1/2 1/2 1
Se tiene que en este juego hay un único equilibrio de Nash bayesiano. Considere el perfil
de estrategias
(
O, (O,O)
)
. Del cuadro 3.2 se sabe que la mejor respuesta del jugador 1 frente
a (O,O) es O, por lo que sólo hay que verificar si (O,O) es la mejor respuesta del jugador 2
frente a O.
Si el jugador 2 es de tipo S2, frente a O la acción óptima es O.
Si el jugador 2 es de tipo N2, frente a O la acción óptima es B.
De esta manera, al no ser (O,O) es la mejor respuesta del jugador 2 frente a O, se tiene
que el perfil de estrategias
(
O, (O,O)
)
no forman parte del equilibrio de Nash bayesiano. Sin
embargo, ya que (O,B) es la mejor respuesta del jugador 2 a O y gracias al cuadro 3.2 se
sabe que O es la mejor respuesta del jugador 1 frente a (O,B). De esta manera, se tiene el
siguiente equilibrio de Nash separador:
ENB(G) =
{(
O, (O,B)
)
; Pr[t2 = S2] = 0,5
}
3.5. Ejemplo 2
Considere un juego en donde ninguno de los jugadores conoce los tipos del otro de acuerdo
al cuadro 3.3.
21
Cuadro 3.3: Juego con Información Privada en ambos Jugadores
Tipo S2 Tipo N2
Tipo S1
J1\J2 O B
O (2,1) (0,0)
B (0,0) (1,2)
Tipo S1
J1\J2 O B
O (2,0) (0,2)
B (0,1) (1,0)
Tipo S2 Tipo N2
Tipo N1
J1\J2 O B
O (0,1) (2,0)
B (1,0) (0,2)
Tipo N1
J1\J2 O B
O (0,0) (2,2)
B (1,1) (0,0)
En donde las creencias de cada jugador son:
Jugador 1: Pr[t2 = S2] = 1/2 y Pr[t2 = N2] = 1/2
Jugador 2: Pr[t1 = S1] = 2/3 y Pr[t1 = N1] = 1/3
En este ejemplo, cada jugador puede usar las siguientes estrategias:
(O,O) (O,B) (B,O) (B,B)
Los cuadros siguientes expresan los pagos esperados de cada jugador y de cada tipo de éste
y se construyen de manera análoga al cuadro 3.2, explicando como obtener uno de los pagos
a modo de ilustración.
Pagos Jugador 1
Si el jugador 1 es de tipo S1, el jugador 2 usa la estrategia (B,B) entonces el pago
esperado de jugar B es:
1
2
· 1 + 1
2
· 1 = 1
Cuadro 3.4: Pagos Esperados para S1
J1\J2 (O,O) (O,B) (B,O) (B,B)
O 2 1 1 0
B 0 1/2 1/2 1
Si el jugador 1 es de tipo N1, el jugador 2 usa la estrategia (O,B) entonces el pago
esperado de jugar B es:
1
2
· 1 + 1
2
· 0 = 1
2
22
Cuadro 3.5: Pagos Esperados para N1
J1\J2 (O,O) (O,B) (B,O) (B,B)
O 0 1 1 2
B 1 1/2 1/2 0
Pagos Jugador 2Si el jugador 2 es de tipo S2, el jugador 1 usa la estrategia (B,O) entonces el pago
esperado de jugar O es:
2
3
· 0 + 1
3
· 1 = 1
3
Cuadro 3.6: Pagos Esperados para S2
J2\J1 (O,O) (O,B) (B,O) (B,B)
O 1 2/3 1/3 0
B 0 2/3 4/3 2
Como último ejemplo, si el jugador 2 es de tipo N2, el jugador 1 usa la estrategia (O,O)
entonces el pago esperado de jugar B es:
2
3
· 2 + 1
3
· 2 = 2
Cuadro 3.7: Pagos Esperados para N2
J2\J1 (O,O) (O,B) (B,O) (B,B)
O 0 1/3 2/3 1
B 2 4/3 2/3 0
Equilibrio de Nash Bayesiano
En este juego se tiene que:
A1 = {O,B} A2 = {O,B}
T1 = {S1, N1} T2 = {S2, N2}
p1 = {1/2, 1/2} p1 = {2/3, 1/3}
u1(a1, a2; t1) u2(a1, a2; t2)
Para encontrar el equilibrio de Nash bayesiano sólo se puede proceder mediante prueba
y error. Dadas las creencias, se procede a evaluar si tres candidatos a equilibrios son o no
23
equilibrios de Nash bayesianos.
Candidato 1
(
(O,B), (O,B)
)
Si el jugador 2 juega (O,B), un jugador 1 tipo S1 juega O, gracias al cuadro 3.4, pero un
jugador 1 tipo N1 frente a esta estrategia del jugador 2 prefiere jugar O por el cuadro 3.5.
De esta forma
(
(O,B), (O,B)
)
no forma parte de un equilibrio de Nash bayesiano.
Candidato 2
(
(O,O), (O,B)
)
Del análisis del candidato 1, se sabe que la mejor respuesta del jugador 1 frente a (O,B)
es (O,O). Hay que verificar que (O,B) es la mejor respuesta del jugador 2 frente a (O,O).
Si el jugador 2 es de tipo S2, frente a (O,B) escoge O gracias al cuadro 3.6. Por otro lado,
un jugador 2 tipo N2 escogeŕıa B frente a (O,B), gracias al cuadro 3.7. Aśı, este par de
estrategias forma parte de un equilibrio de Nash bayesiano.
Candidato 3
(
(B,O), (B,B)
)
Frente a (B,B), un jugador 1 tipo S1 escoge B (ver cuadro 3.4) mientras que uno de
tipo N1 elige O. Luego, en efecto, la mejor respuesta del jugador 1 a (B,B) es (B,O) y sólo
falta determinar que la mejor respuesta del jugador 2 frente a (B,O) es (B,B). Un jugador
2 tipo S2 frente a (B,O), del cuadro 3.6, escoge B y uno tipo N2 escoge O
2. De esta forma,
este perfil de estrategias conforma parte de un equilibrio de Nash bayesiano.
Finalmente, los equilibrios de Nash del juego son:
ENB(G) =
{(
(O,O), (O,B)
)
con creencias Pr[t1 = S1] = 2/3; Pr[t2 = S2] = 0,5(
(B,O), (B,B)
)
con creencias Pr[t1 = S1] = 2/3; Pr[t2 = S2] = 0,5
}
2Si bien hay indiferencia en este caso, de todas formas ella apoya al equilibrio de Nash bayesiano.
24
Parte 4
Juegos Dinámicos de Información
Incompleta
En este tipo de juegos se puede dar el aprendizaje; esto es, un jugador puede inferir
el tipo de otro a través del comportamiento del otro a lo largo del juego, modificando sus
creencias a priori a unas a posteriori sobre el tipo del otro jugador. Para que ello ocurra,
lógicamente este otro jugador ha de usar estrategias separadoras (o h́ıbridas) para que el
aprendizaje en efecto modifique las creencias. Este aprendizaje se lleva a cabo mediante el
teorema de Bayes:
Pr[A|B] = Pr[A ∩B]
Pr[B]
Para ilustrar los juegos dinámicos de información incompleta, se inicia con un ejemplo.
4.1. Siguiendo al Ĺıder
Suponga una situación en la que el jugador J no conoce con exactitud los pagos del
juego en forma precisa. En particular, el tiene una distribución a priori que representa las
creencias sobre la estructura de los pagos (distintos juegos) representadas en el cuadro 4.1.
Por su parte, el jugador R śı conoce que juego se está jugando. Los juegos se representan en
el cuadro 4.2. Para resolver el juego se realiza la transformación de Harsanyi que se aprecia
en el cuadro 4.3. De este modo, se modela como si la naturaleza moviese primero y eligiese
los pagos del juego de acuerdo a los juegos A, B o C según las probabilidades subjetivas del
jugador J. Luego el jugador R observa la movida de la naturaleza (pero no J).
25
Cuadro 4.1: Creencias del Jugador J
Creencias Juego
0.7 A
0.1 B
0.2 C
Cuadro 4.2: Creencia de los Pagos
R
L
S
J
J
L
L
S
S
(2, 2)
(−1,−1)
(−1,−1)
(1, 1)
Juego A
R
L
S
J
J
L
L
S
S
(5, 1)
(0, 2)
(−1,−1)
(2, 3)
Juego B
R
L
S
J
J
L
L
S
S
(0, 0)
(−1,−1)
(−1,−1)
(4, 4)
Juego C
26
Cuadro 4.3: Juego Completo Transformado
R
L
S
J
J
L
L
S
S
(2, 2)
(−1,−1)
(−1,−1)
(1, 1)
R
L
S
J
J
L
L
S
S
(5, 1)
(0, 2)
(−1,−1)
(2, 3)
R
L
S
J
J
L
L
S
S
(0, 0)
(−1,−1)
(−1,−1)
(4, 4)
A
B
C
N
0,7
0,2
0,1
27
En este último cuadro, se aprecia que el jugador J posee dos conjuntos de información,
consistentes en los nodos con puntos rojos o azules, debido a que el jugador J observa la
movida de R pero no la de la naturaleza. Por su parte, el jugador R posee tres conjuntos de
información con un sólo elemento (uno para cada estado de la naturaleza).
Definición 4.1
El tipo de un jugador es el conjunto de estrategias, partición de información y función
de pagos que escoge la naturaleza para algún jugador al inicio de un juego de información
incompleta. Un estado de la naturaleza es la elección del tipo hecha por la naturaleza.
Al igual que en la parte 3, las estrategias deben especificar un plan de acción para
cada contingencia que pueda enfrentar el jugador. Por ejemplo, considerando el juego del
cuadro 4.3, una estrategia posible del jugador R es la tripleta:
(LLS) =

Jugar L si A
Jugar L si B
Jugar S si C
Notar que esta estrategia especifica una acción a emprender para cada conjunto de informa-
ción del jugador R. Una estrategia para el jugador J es el par:
(LS) =
{
Jugar L si el jugador R usa L
Jugar S si el jugador R usa S
Un jugador tiene creencias acerca de los tipos de los demás jugadores y a medida
que los ve tomar decisiones, las actualiza bajo el supuesto de que están siguiendo un com-
portamiento de equilibrio. Luego, un equilibrio Bayesiano perfecto se usa para denotar un
equilibrio perfecto en subjuegos en donde los jugadores actualizan sus creencias de acuerdo
a la regla de Bayes. De manera informal, para determinar la existencia de un equilibrio se
debe realizar lo siguiente:
1. Se propone un candidato a equilibrio (un perfil de estrategias).
2. Obtener las creencias actualizadas según la regla de Bayes.
3. Dadas las creencias y dada la estrategia del otro, cada jugador debe elegir su mejor
respuesta simultáneamente.
A continuación se determina si
(
(LLS); (LS)
)
forma parte o no de un equilibrio bayesiano
perfecto.
28
Actualización de Creencias de cada Jugador
Dado que los conjuntos de información del jugador R tienen un sólo elemento, al mover
la naturaleza éste sabe con certeza el estado de la naturaleza prevaleciente, por lo que su
actualización resulta trivial. Para el jugador J, se requiere calcular:
Pr [A|L] Pr [B|L] Pr [C|L]
Pr [A|S] Pr [B|S] Pr [C|S]
•Pr[A|L]
Del teorema de Bayes, se tiene que
Pr[A|L] = Pr[L|A] · Pr[A]
Pr[L]
y por el teorema de la probabilidad total
Pr[L] = Pr[L|A] · Pr[A] + Pr[L|B] · Pr[B] + Pr[L|C] · Pr[C]
Dado que el jugador R usa la estrategia (LLS) es claro que
Pr[L|A] = 1 Pr[L|B] = 1 Pr[L|C] = 0
y dadas las creencias del cuadro 4.1 se tiene que
Pr[A|L] = 1 · 0,7
1 · 0,7 + 1 · 0,1 + 0
= 0,875
•Pr[B|L]
Pr[B|L] = Pr[L|B] · Pr[B]
Pr[L]
=
1 · 0,1
1 · 0,1 + 1 · 0,7 + 0
= 0,125
•Pr[C|L]
Pr[C|L] = Pr[L|C] · Pr[C]
Pr[L]
=
0 · 0,2
Pr[L]
= 0
De manera análoga se calcula el resto de las probabilidades.
Pr[A|S] = 0 Pr[B|S] = 0 Pr[C|S] = 1
Como último ejemplo se calcula Pr[C|S]
Pr[C|S] = Pr[S|C] · Pr[C]
Pr[S]
=
1 · 0,2
0 · Pr[S|A] + 0 · Pr[S|B] + 1 · 0,2
= 1
29
Mejor Respuesta de J dado (LLS) y las Creencias Actualizadas.
Los pagos al emplear cada acción posible, dado que el jugador R jugó L, son:
Pago esperado de Jugar L Pago esperado de Jugar S
2 · 0,875 + 1 · 0, 125 = 1,1875 −1 · 0,875 + 0,125 · 2 = −1,635
Aśı, la mejor respuesta de J dado que el jugador R usa L es L.
Si el jugador R usa S, el jugador J cree que, con probabilidad uno, la naturaleza jugó C.
La mejor respuesta de J ante S es emplear S.
De este modo, (LS) es la mejor respuesta del jugador J ante (LLS).
Mejor Respuestade R dado (LS) y las Creencias Actualizadas.
Dado que la naturaleza escoge A y que el jugador J usa la estrategia (LS), los pagos de
usar L o S son:
Pago esperado de Jugar L Pago esperado de Jugar S
2 1
Aśı, la mejor respuesta del jugador R ante (LS) en el estado A es L.
Si la naturaleza escoge B y el jugador J usa (LS), los pagos para cada acción son:
Pago esperado de Jugar L Pago esperado de Jugar S
5 2
Aśı, la mejor respuesta del jugador R ante (LS) en el estado B es L.
Finalmente, si la naturaleza escoge C y el jugador J usa (LS), los pagos para cada acción
son:
Pago esperado de Jugar L Pago esperado de Jugar S
0 4
En este caso, la mejor respuesta del jugador R ante (LS) es S.
De esta forma, (LLS) es la mejor respuesta del jugador R ante (LS).
30
Debido a que simultáneamente las estrategias del jugador R, (LLS), y la del jugador J,
(LS), son mejor respuesta una de otra, el par {(LLS) ; (LS)} forma parte de un equilibrio
bayesiano perfecto1.
4.2. Equilibrio de Nash Bayesiano Perfecto
Este concepto de equilibrio es un refinamiento del equilibrio de Nash Bayesiano que
elimina las promesas o amenazas no créıbles. Este punto es ilustrado por el siguiente juego
con información completa, pero imperfecta. El jugador 1 escoge entre tres acciones I, C y D.
Si el jugador 1 escoge D el juego termina sin que el jugador 2 mueva. Si el jugador 1 escoge
I o C, entonces el jugador 2 sabe que D no fue escogido, pero no sabe si I o C fue jugado, y
escoge entre dos acciones I ′ y D′ tras lo cual el juego termina. La representación extensiva se
haya en la figura 4.1, donde p es la creencia de que, dado que el jugador 2 juega, el jugador 1
haya usado la acción I. Por otro lado, la representación normal está en el cuadro 4.4, donde
los números subrayados indican la mejor respuesta de cada jugador donde haya un equilibrio
de Nash.
Figura 4.1: Representación en forma extensiva
Jugador 2
Jugador 1
(1, 3)
(2, 1) (0, 0) (0, 2) (0, 1)
D
I C
I ′ D′ D
′
I ′
(1− p)p
Cuadro 4.4: Representación normal del juego
Jugador 1\Jugador 2 I’ D’
I (2,1) (0,0)
C (0,2) (0,1)
D (1,3) (1,3)
El cuadro 4.4 señala que
EN(G) =
{
(I, I ′) ; (D,D′)
}
= EPS(G)
En este caso, los equilibrios de Nash son a su vez equilibrios perfectos en subjuegos debido
a que el único subjuego del juego es el juego completo. Sin embargo, el equilibrio (D,D′)
se sustenta en una amenaza no créıble. Esto se debe a que si el jugador llegara a mover, la
estrategia I ′ domina a D′ de manera que el jugador 1 no se verá inducido a jugar D bajo la
1Se resalta la palabra parte, pues más adelante se define formalmente un equilibrio bayesiano perfecto, el
cual no sólo consta de un par de estrategias, al igual que el equilibrio de Nash Bayesiano.
31
amenaza de que el jugador 2 jugará D′. De esta manera se requiere refinar el concepto de
equilibrio para eliminar el equilibrio de Nash (D,D′).
4.2.1. Requisitos para el Equilibrio Perfecto Bayesiano
Requisito 1
En cada conjunto de información, al jugador que le toca decidir debe tener una creencia
acerca del nodo en el conjunto de información que se ha alcanzado.
Notar que en este caso, una creencia es una distribución de probabilidad sobre los nodos
del conjunto de información. En particular, en conjuntos de información con un sólo elemento,
las creencias del jugador asignarán una probabilidad uno en el único nodo de decisión.
Requisito 2
Dadas sus creencias, las estrategias de los jugadores deben ser secuencialmente racio-
nales; esto es, en cada conjunto de información la acción tomada por el jugador al que le
toca mover y las estrategias del jugador de ah́ı en adelante (estrategias subsecuentes) deben
ser óptimas dada las creencias de ese jugador en ese conjunto de información y dada las
estrategias siguientes de los otros jugadores.
En la figura 4.1 el requisito 1 implica que si le toca mover al jugador 2, éste debe poseer
ciertas creencias respecto a si el jugador 1 jugó I o si jugó C. Dichas creencias están repre-
sentadas por las probabilidades p y (1− p). Luego, dadas las creencias, el pago esperado de
jugar D′ es
0 · p+ (1− p) · 1 = 1− p
mientras que el pago esperado de jugar I ′ es
1 · p+ 2 · (1− p) = 2− p
y debido a que 2 − p > 1 − p para cualquier p ∈ [0, 1], entonces el requisito 2 evita que se
elija D′. Por tanto, los requisitos 1 y 2 eliminan a (D,D′) como equilibrio.
Definición 4.2
Para un equilibrio dado en un juego en forma extensiva, se dice que un conjunto de informa-
ción está en la trayectoria de equilibrio si éste conjunto de información será alcanzado
con probabilidad positiva si el juego se juega con las estrategias de equilibrio. Análogamen-
te, un conjunto de información está fuera de la trayectoria de equilibrio si de forma
segura no será alcanzado si se juegan las estrategias de equilibrio.
Requisito 3
En los conjuntos de información en las trayectorias de equilibrio, las creencias están deter-
minadas por la regla de Bayes y las estrategias de equilibrio de los jugadores.
32
De este modo, en el juego de la figura 4.1, en el equilibrio perfecto en subjuegos (I, I ′),
debe ser el caso que p = 1 para el jugador 2. Es decir, dada la estrategia de equilibrio del
jugador 1, entonces el jugador 2 sabe en que nodo están.
Formalmente, un equilibrio consiste no sólo de una estrategia para cada jugador sino que
también incluye una creencia de cada jugador en cada conjunto de información en el cual al
jugador le toca decidir.
Requisito 4
En los conjuntos de información fuera de la trayectoria de equilibrio, las creencias se deter-
minan por la regla de Bayes y las estrategias de equilibrio de los otros jugadores cuando es
posible.
Definición 4.3
Un equilibrio perfecto bayesiano consiste en estrategias y creencias que satisfacen los
requisitos 1 al 4.
Ejemplo 1
Considérese el juego en su forma extensiva del la figura 4.2.
Figura 4.2: Ejemplo Equilibrio Perfecto Bayesiano
Jugador 3
Jugador 2
D
(1, 2, 1) (3, 3, 3) (0, 1, 2) (0, 1, 1)
L R
L′ R′ R′L′
(1− p)p
Jugador 1
A
(2, 0, 0)
Considerando el subjuego donde decide el jugador 2, la representación en forma normal
es la del cuadro 4.5.
Para este subjuego, se tiene que
EN(G) =
{
(L,R′)
}
⇒ EPS(G) =
{
(D,L,R′)
}
Estas estrategias, con las creencias p = 1 satisfacen los requisitos 1 al 3 y también satisfacen,
trivialmente, el requisito 4 porque no hay conjuntos de información fuera de la trayectoria
33
Cuadro 4.5: Subjuego en forma normal
Jugador 2\Jugador 3 L′ R′
L (2, 1) (3, 3)
R (1, 2) (1, 1)
de equilibrio, luego de acuerdo a la definición 4.3 (D,L,R′) con la creencia p = 1 es un
equilibrio perfecto bayesiano.
Considere ahora las estrategias (A,L, L′) junto a la creencia p = 0. Se tiene que ellas
también configuran un equilibrio de Nash y satisface los requisitos 1 al 3. El jugador 3 tiene
una creencia y actúa óptimamente de acuerdo a ella. Dado esto, los jugadores 1 y 2 actúan
óptimamente dada las estrategias subsecuentes de los otros jugadores. Pero este equilibrio
de Nash no es perfecto en subjuegos, ya que la creencia del jugador 3, p = 0 ,es incongruente
con la estrategia de 2 (no resulta óptima), pero los requerimientos 1 al 3 no imponen restric-
ciones en las creencias del jugador 3, ya que el conjunto de información de dicho jugador no
se alcanza con las estrategias predeterminadas. No obstante, el requisito 4 fuerza a que las
creencias del jugador 3 estén determinadas por la estrategia del jugador 2: si la estrategia
del jugador 2 es R entonces p = 0, pero si p = 1, entonces el requisito 2 obliga a que la
estrategia del jugador 3 sea R′, luego las estrategias (A,L, L′) con la creencia p = 0 no es un
equilibrio perfecto bayesiano.
Ejemplo 2
Considere el juego en su forma extensiva de la figura 4.3, en donde se omiten los pagos
intencionalmente.
Figura 4.3: Juego Ejemplo 2
Jugador 3
Jugador 2
D
L R
L′ R′ L′
(1− p)p
Jugador 1
A
A′
R′
Si la estrategia de equilibrio del jugador 1 es A, entonces elconjunto de información del
jugador 3 está fuera de la senda de equilibrio, pero ahora el requisito 4 no puede determinar
34
las creencias del jugador 3 a partir de la estrategia del jugador 2. Esto se debe a que si la
estrategia del jugador 2 es A′, entonces el requisito 4 no impone restricciones en las creencias
del jugador 3, pero si la estrategia del jugador 2 es L con probabilidad q1, R con probabilidad
q2 y A
′ con probabilidad 1− q1 − q2, entonces el requisito 4 dice que la creencia del jugador
3 debe ser:
p =
q1
q1 + q2
4.3. Juegos de Señalización
Existen situaciones, dentro de la economı́a de la información2, donde se quiere modelar
la interacción estratégica entre dos partes y en donde una de ellas trata de informar a la
otra acerca de su tipo a través de una señal. Un ejemplo de esta interacción es la decisión de
educación de las personas al saber que el nivel de ésta comunica, de manera más o menos
créıble, las competencias y habilidades de las personas.
Definición 4.4
Un juego de señalización es un juego dinámico de información incompleta con dos jugadores:
un emisor (S) y un receptor (R) en donde se cumplen los siguientes requisitos:
i) La naturaleza escoge un tipo ti para el emisor de un conjunto de tipos factibles T =
{t1, ..., tI} de acuerdo a la distribución de probabilidad p(ti), donde p(ti) > 0 para todo
i y
p(t1) + p(t2) + · · ·+ p(tI) = 1
ii) El emisor observa ti y elige un mensaje mj de un conjunto de mensajes factibles M =
{m1, ...,mJ}.
iii) El receptor observa mj, pero no ti, y luego escoge una acción ak del conjunto de acciones
factibles A = {a1, ...a,k }.
iv) Los pagos de cada jugador están dados por uS(mj, ak; ti) y aR(mj, ak; ti).
Un ejemplo de juegos de esta clase se haya en la figura 4.4, en donde se omiten los pagos.
En este juego se tiene que
T = {t1, t2} M = {m1,m2} A = {a1, a2} p(t1) = p
2Será estudiado en la siguiente parte del curso.
35
Figura 4.4: Forma Extensiva Juego de Señalización
p
(1− p)
Naturaleza
Emisor
Emisor
t1
t2
Receptor Receptor
m1
m1
m2
m2
Definición 4.5
Una estrategia para el emisor en un juego de señalización es una función m(ti) que es-
pecifica el mensaje elegido para cada tipo que la naturaleza puede haber escogido. Por otro
lado, una estrategia para el receptor es una función a(mj) que indica la acción emprendida
para cada mensaje que el emisor pueda enviar.
De acuerdo a la definición 4.5, en el ejemplo de la figura 4.4 cada jugador tiene cuatro
estrategias posibles.
Estrategias para el emisor
1) Jugar m1 si la naturaleza escogiese t1 o t2.
2) Jugar m1 si la naturaleza determina t1 y jugar m2 si la naturaleza escoge t2.
3) Jugar m2 si la naturaleza determina t1 y jugar m1 si la naturaleza escoge t2.
4) Jugar m2 si la naturaleza escogiese t1 o t2.
Estrategias para el receptor
1) Jugar a1 si el emisor env́ıa m1 o si env́ıa m2.
2) Jugar a1 si el emisor env́ıa m1 y jugar a2 si env́ıa m2.
3) Jugar a2 si el emisor env́ıa m1 y jugar a1 si env́ıa m2.
4) Jugar a2 si el emisor env́ıa m1 o si env́ıa m2.
Ahora se procede a reescribir los requisitos 1 al 4 para el juego de señalización. Debido
a que el emisor conoce la historia completa del juego cuando elige un mensaje, su elección
ocurre en un set de información singleton (con un sólo elemento) por lo que el requisito 1 se
cumple de manera trivial para el emisor. Para el receptor en cambio, su elección ocurre en
un conjunto de información no-singleton.
Requisito de Señalización 1
Después de observar cualquier mensaje mj ∈M, el receptor debe tener una creencia acerca
de que tipos pueden haber enviado mj. Se llama a esta creencia la distribución de probabilidad
36
µ(ti|mj) donde
µ(ti|mj) ≥ 0 ∀ ti ∈ T y
∑
ti∈T
µ(ti|mj) = 1
Requisito de Señalización 2
(Receptor) Para cada mensaje mj ∈ M, la acción del receptor a∗j(mj) debe maximizar
la utilidad esperada dada su creencia µ(ti|mj) acerca de que tipos puede haber emitido el
mensaje. Esto es, a∗j(mj) resuelve el problema
máx
{ak∈A}
∑
ti∈T
µ(ti|mj) · uR(ak; ti)
(Emisor) Simultáneamente con lo anterior, para todo ti ∈ T, el mensaje m∗(ti) debe maxi-
mizar la utilidad del emisor dada la estrategia a∗(mj); es decir, m
∗(ti) resuelve:
máx
{mj∈M}
uS(ak,mj; ti)
Requisito de Señalización 3
Para mj ∈M, si existe ti ∈ T tal que m∗(ti) = mj,3 entonces la creencia del receptor en el
conjunto de información correspondiente a mj deben derivarse usando la regla de Bayes y la
estrategia del emisor:
µ(ti|mj)
Definición 4.6
Un equilibrio perfecto bayesiano en estrategias puras en un juego de señalización con-
siste en un par de estrategias
(
m∗(ti) , a
∗(mj)
)
y en una creencia µ(ti|mj) que satisfacen los
requisitos de señalización 1, 2 y 3.
Ejemplo 3
Considere el juego de la figura ??. Sean (p, 1− p) y (q, 1− q) las creencias del receptor en
sus dos conjuntos de información. Este juego posee cuatro candidatos a equilibrios perfectos
bayesianos en estrategias puras.
1. Agrupador en L.
2. Agrupador en R.
3. Separador (L,R).
3Esto es; para cada conjunto de información en la senda de equilibrio.
37
4. Separador (R,L).
donde (m′,m′′) indica que un individuo tipo t1 env́ıa la señal m
′ y uno tipo t2 env́ıa la señal
m′′.
Figura 4.5: Ejemplo Juego de Señalización
0,5
0,5
Naturaleza
Emisor
Emisor
t1
t2
Receptor Receptor
L
L
R
R
u
d
u
d
u
d
u
d
(2, 1)
(0, 0)
(1, 0)
(1, 2)
(1, 3)
(4, 0)
(2, 4)
(0, 1)
p
(1− p)
q
(1− q)
Candidato 1: (L,L)
Estrategia del Receptor
Supóngase que existe un equilibrio en el cual la estrategia del emisor es (L,L), luego el
conjunto de información correspondiente a L está en la senda de equilibrio de manera que
las creencias
(
p, 1 − p
)
se determinan por la regla de Bayes. Intuitivamente, el recibir la
señal L no entrega información al receptor, pues ambos tipos env́ıan la misma, por lo que la
distribución a priori es igual a la a posteriori. Anaĺıticamente, esto se demuestra según:
Pr [t1|L] =
Pr [L|t1] · Pr [t1]
Pr [L]
⇒ Pr [t1|L] =
1 · 0,5
1
= 0,5
Dadas la estrategia (L,L) y las creencias p = 0,5 se busca la mejor respuesta de el
receptor frente a la acción L (en la senda de equilibrio).
Pago esperado de Jugar u Pago esperado de Jugar d
3 · 0,5 + 4 · 4 = 3,5 0 · 0,5 + 0,5 · 1 = 0,5
De este modo, frente a L la mejor respuesta del receptor es jugar u. Ahora se procede
a estudiar que hace el receptor en los conjuntos de información fuera de la trayectoria de
equilibrio. Sea q la probabilidad de que el emisor sea de tipo t1 dado que env́ıa la señal R.
Con esto, la utilidad esperada de jugar cada estrategia viene dado por lo siguiente.
E[UR(u|R)] = q · 1 + (1− q) · 0 = q
E[UR(d|R)] = q · 0 + (1− q) · 2 = 2(1− q)
38
Aśı, el receptor juega u si
q > 2− 2q ⇔ q > 2
3
y juega d si
q <
2
3
Estrategia del Emisor
La mejor respuesta del receptor frente a (L,L) es (u, u) si q >
2
3
y es (u, d) si q <
2
3
. Hay
que ver si la mejor respuesta del emisor frente a estas estrategias es o no (L,L).
Un emisor tipo t1 que juega R recibe los pagos
Pago esperado si q <
2
3
Pago esperado si q >
2
3
0 2
por lo que la acción L es la mejor respuesta sólo si q <
2
3
, pues en caso contrario un
emisor tipo t1 tiene incentivos a jugar R.
Un emisor tipo t2 que juega L, con lo que el receptor juega u, recibe los pagos el pago
de 2 que es mayor que el pago de jugar R para cualquier valor de q.
De esta manera, se ha probado que4:{
(L,L) , (u, d) , p = 0,5 , q ≤ 2
3
}
es un equilibrio perfecto bayesiano agrupador.
Candidato 2: (R,R)
Estrategia del Receptor
Supóngase que la estrategia de equilibrio del emisor es (R,R). De manera análoga al caso
anterior, la probabilidad revisada es q = 0,5 < 2/3 de manera que la mejor respuesta del
receptor a R es d, la cual otorga los pagos siguientes al emisor.
Pago tipo t1 Pago tipo t2
0 1
Pero, un individuo t1 puede obtener un pago de 1 jugando L, debido a que la mejor
respuesta del receptor a L es u para cualquier valor de p,de manera que no hay un equilibrio
perfecto bayesiano donde el emisor usa la estrategia (R,R).
4Cuando q = 2/3 el receptor está indiferente entre jugar u o d por lo que bien sustenta este equilibrio
bayesiano perfecto
39
Candidato 3: (L,R)
Si el emisor usa la estrategia (L,R) entonces ambos conjuntos de información estarán
en la trayectoria de equilibrio, por lo que ambas creencias (determinadas por p y q) vienen
dadas por la regla de Bayes. De hecho, en este caso:
p = Pr[t1|L] =
Pr[L|t1] · Pr[t1]
Pr[L]
=
1 · 0,5
1 · 0,5 + 0 · 0,5
= 1
ya que Pr[L] = Pr[L|t1] · Pr[t1] + Pr[L|t2] · Pr[t2]. Análogamente:
q = Pr[t1|R] =
Pr[R|t1] · Pr[t1]
Pr[R]
=
0 · 0,5
0 · 0,5 + 1 · 0,5
= 0
Las mejores respuestas del receptor frente a estas creencias son u y d respectivamente de
manera que el emisor recibe 1 independiente de su tipo, de manera que sólo puede chequearse
si las estrategias del emisor es óptima dada la estrategia del receptor (u, d). Sin embargo,
este no es el caso. Si el tipo t2 se desv́ıa usando L en vez de R, entonces el receptor responde
con u y t2 recibe 2 que es mayor que el pago de usar R.
Candidato 4: (R,L)
De igual manera que para el candidato anterior, la revisión de las creencias del receptor
dada la estrategia del emisor señala que p = 0 y que q = 1. Aśı, la mejor respuesta del
receptor es (u, u) y ambos tipos reciben un pago de 2. Si t1 se desviase jugando L, entonces
el receptor respondeŕıa con u y el pago del emisor t1 seŕıa 1. Luego no hay incentivos, para
un tipo t1, para desviarse de jugar R. Asimismo, si un tipo t2 se desviara y jugara R, el
receptor respondeŕıa con u y el tipo t2 obtendŕıa un pago de 1, por lo que tampoco tiene
incentivos a desviarse. De esta manera:{
(R,L) , (u, u) , p = 0 , q = 1
}
configura un equilibrio bayesiano perfecto separador.
40
	Juegos Estáticos de Información Completa
	Equilibrio Estrategias Dominadas
	Equilibrio de Nash
	Estrategias Mixtas
	Juegos Dinámicos de Información Completa
	Representación en Forma Extensiva de un Juego
	Equilibrio de Nash Perfecto en Subjuegos
	Juegos Repetidos
	Juegos Estáticos de Información Incompleta
	Información Privada o Asimétrica
	Juegos Estáticos Bayesianos
	Transformación de HarsanyiDesarrollada por John Harsanyi, quien fue premio Nobel de Economía en 1994.
	Ejemplo 1
	Ejemplo 2
	Juegos Dinámicos de Información Incompleta
	Siguiendo al Líder
	Equilibrio de Nash Bayesiano Perfecto
	Requisitos para el Equilibrio Perfecto Bayesiano
	Juegos de Señalización

Más contenidos de este tema