Vista previa del material en texto
PONTIFICIA UNIVERSIDAD CATÓLICA DE CHILE INSTITUTO DE ECONOMÍA Teoŕıa de Juegos No Cooperativos Profesor: José Miguel Sánchez Octubre de 2009 Introducción Se busca modelar situaciones estratégicas entre agentes racionales (maximizadores de utilidad o utilidad esperada) e “inteligentes” (entienden el juego, en particular su estructura informacional). Gibbons (1992)1 clasifica los juegos en cuatro clases, que serán estudiados en el mismo orden a lo largo del apunte. 1. Juegos estáticos de información completa. 2. Juegos dinámicos de información completa. 3. Juegos estáticos de información incompleta. 4. Juegos dinámicos de información incompleta. donde cada uno de ellos posee un concepto de estrategia y de equilibrio asociado. 1Gibbons, R. (1992) “A Primer in Game Theory”, Prentice Hall. 1 Parte 1 Juegos Estáticos de Información Completa Existen dos conceptos muy importantes en la teoŕıa de juegos, siendo éstos las acciones disponibles y las estrategias. El conjunto de acciones de un jugador corresponde a lo que éste puede hacer en el momento en el que le corresponda decidir. Dicho conjunto se escri- birá como S = {a1, ..., an} donde ai es la i-ésima acción disponible para el jugador. Por otro lado, las estrategias de un jugador especifican un plan de acción completo para cada posible escenario en el cual le pueda jugar. Aśı informalmente las acciones indican qué es lo que se hace, mientras que las estrategias implican un plan de acción completo que estipula una acción para cada contingencia en la cual el jugador le pueda tocar mover. En los juegos estáticos de información completa las estrategias de los jugadores son iguales a las posibles acciones que ellos puedan emprender, por lo que se hablará indistintamente de uno u otra forma sólo para este tipo de juego. Definición 1.1 La representación en forma normal o estratégica de un juego con n jugadores especifica los espacios de estrategias de los jugadores S1, S2, ..., Sn y sus funciones de pago u1, ..., un donde ui(a1, a2, ..., an) y ai es la acción del jugador i. Dicho juego se expresa como: G = {S1, S2, ..., Sn ; u1, ..., un} Ejemplo 1 Cuando las dimensiones de los espacios de estrategias y el número de jugadores lo permi- tan, es posible representar el juego usando una matriz de pagos. Usando esto, se expresa sucintamente en forma normal el dilema del prisionero con la matriz del cuadro 1.1 2 Cuadro 1.1: Dilema del Prisionero Preso 1 \Preso 2 No Confesar (NC) Confesar (C) No Confesar (NC) (-1,-1) (-9,0) Confesar C (0,-9) (-6,-6) 1.1. Equilibrio Estrategias Dominadas Una estrategia se le dice dominada si el pago por usarla es menor que con otra indepen- diente de lo que hagan los otros jugadores. La importancia que tienen estas estrategias es que permite descartar ciertos desenlaces que jamás se producirán, dado el supuesto de jugadores racionales. Formalmente: Definición 1.2 En el juego en forma normal G = {S1, S2, ..., Sn ; u1, ..., un}, sean s′i y s′′i posibles estrategias del jugador i, esto es s′i, s ′′ i ∈ Si. La estrategia s′i está estrictamente dominada por la estrategia s′′i si para cada combinación de las estrategias de los jugadores restantes el pago de i al usar s′i es estrictamente menor que el obtenido al usar s ′′ i : ui(s1, ..., si−1, s ′ i, si+1, ..., sn) < ui(s1, ..., si−1, s ′′ i , si+1, ..., sn) para cualquier sj ∈ Sj con j 6= i. En el cuadro 1.1 se ve que para el jugador 1 la estrategia de no confesar está dominada por la de confesar y de igual forma ocurre para el jugador 2. De esta forma, el equilibrio en estrategias dominadas (EED) del dilema del prisionero anterior1 es: EED={ (Confesar, Confesar) } La definición 1.2 permite llevar a cabo la eliminación iterativa de estrategias estrictamente dominadas, tal como se verá más adelante en el ejemplo 2. Sin embargo, el problema es que en algunos juegos este procedimiento no puede llevarse a cabo, especialmente en juegos donde el conjunto de estrategias es grande como el del cuadro 1.2 en donde EED={∅} pero śı existe un equilibrio de Nash2. Cuadro 1.2: Problemas con el Criterio de Dominancia J1\J2 I C D A (0,4) (4,0) (5,3) M (4,0) (0,4) (5,3) B (3,5) (3,5) (6,6) Ejemplo 2 Considere el juego del cuadro 1.3. Como puede apreciarse, la estrategia “Derecha” para 1Es importante notar que los equilibrios siempre se definen en base a estrategias y no en base a pagos. 2Más adelante se define este concepto, pero dicho equilibrio es EN(G)={(B,D)}. 3 Cuadro 1.3: Estrategias Dominadas: Juego Original J1 \J2 Izquierda Centro Derecha Alta (1,0) (1,2) (0,1) Baja (0,3) (0,1) (2,0) el jugador 2 está estrictamente dominada por la estrategia “Centro”, debido a lo cual se tachó la columna respectiva. Debido a la eliminación de la estrategia “Derecha”, el juego se puede reducir al del cua- dro 1.4, ya que la estrategia “Baja” está dominada por la estrategia “Alta” para el jugador 1. Cuadro 1.4: Estrategias Dominadas: Segunda Iteración J1 \J2 Izquierda Centro Alta (1,0) (1,2) Baja (0,3) (0,1) Por último, dado que el juego se resume en el del cuadro 1.5 se tiene que EED={Alta,Centro}. Cuadro 1.5: Estrategias Dominadas: Tercera Iteración J1 \J2 Izquierda Centro Alta (1,0) (1,2) 1.2. Equilibrio de Nash Definición 1.3 En el juego en forma normal G = {S1, S2, ..., Sn ; u1, ..., un} las estrategias (S∗1 , S∗2 , ..., S∗n) forman un equilibrio de Nash si para cada jugador i, S∗i es la mejor respuesta del jugador i 3 (o al menos una de ellas) a las estrategias de los otros n−1 jugadores (S∗1 , ..., S∗i−1, S∗i+1, ...S∗n). Esto es: ui(S ∗ 1 , ..., S ∗ i−1, S ∗ i , S ∗ i+1, ...S ∗ n) ≥ ui(S∗1 , ..., S∗i−1, Si, S∗i+1, ...S∗n) para todo Si ∈ Si por lo que S∗i soluciona el problema máx {Si∈Si} ui(S ∗ 1 , ..., S ∗ i−1, Si, S ∗ i+1, ...S ∗ n) 3Esto es, que maximiza la función de utilidad. 4 El equilibrio de Nash tiene la gran ventaja que es un equilibrio estable; esto es, una vez alcanzado nadie tiene incentivos a desviarse de éste. A modo de desventaja es que puede no existir (en estrategias puras) y puede no ser único. El equilibrio de Nash es un concepto más poderoso que el equilibrio de estrategias domi- nadas, en el siguiente sentido: Si las estrategias (s∗1, ..., s ∗ n) constituyen un equilibrio de Nash, entonces sobreviven a la eliminación iterativa de estrategias dominadas. Sin embargo, pueden existir estrategias que sobreviven a la eliminación iterativa de estrategias dominadas y que no son parte de un equilibrio de Nash4. Por tanto si para el juego G se denota EED(G) al conjunto de estrategias que sobreviven a la eliminación iterativa de estrategias dominadas y por EN(G) al conjunto de equilibrios de Nash se tiene que EN(G) ⊂ EED(G) tal como muestra el siguiente resultado. Teorema 1.1 En el juego en forma normal con n jugadores G = {S1, S2, ..., Sn ; u1, ..., un}, si las estrategias (s∗1, s ∗ 2, ..., s ∗ n) forman un equilibrio de Nash, entonces sobreviven a la eliminación iterativa de estrategias estrictamente dominadas. Demostración: Se procede por contradicción. Supóngamos que no se cumple, i.e. que existe un equilibrio de Nash que es eliminado por la eliminación iterativa de estrategias dominadas. Sea (s∗1, s ∗ 2, ..., s ∗ n) el equilibrio de Nash descartado. Sea s ∗ i la primera estrategia en ser descartada por ser estrictamente dominada. Entonces debe existir una estrategia s∗ ′ i que no ha sido eliminada de Si que domina estrictamente a s ∗ i por lo que ui(s1, ..., si−1, s ∗ i , si+1, ..., sn) para cada (s1, ..., si−1, si+1, ..., sn) que esté en las estrategias disponibles para los demás jugadores (las que no han sido aun eliminadas). Como s∗i es la primera estrategia en ser eliminada, entonces se cumple que ui(s ∗ 1, ..., s ∗ i−1, s ∗ i , s ∗ i+1, ..., sn) < ui(s ∗ 1, ..., s ∗ i−1, s ∗′ i , s ∗ i+1, ..., sn) lo que contradice la definición 1.3 de equilibrio de Nash. Esto concluye la demostración. Sin embargo, existe unconverso parcial al teorema anterior: 4Esto es, el equilibrio de Nash es un refinamiento del equilibrio de estrategias dominadas. 5 Teorema 1.2 En el juego en formal normal con n jugadores G = {S1, S2, ..., Sn; u1, ..., un}, si la eliminación iterativa de las estrategias estrictamente dominadas descarta todas las estrategias excepto (s∗1, s ∗ 2, ..., s ∗ n), entonces estas últimas estrategias constituyen el único equilibrio de Nash del juego G. Demostración: Ver Gibbons (1992)5, pág 14. 1.3. Estrategias Mixtas Se busca modelar la incertidumbre en juegos donde las estrategias a usar por parte de los jugadores son aleatorias. Supongamos que el jugador i cuenta con K estrategias puras Si = {si1, si2, ..., siK}. En este caso, se dice que una estrategia mixta para el jugador i es una distribución de probabilidad (pi1, ..., piK) en donde pik es la probabilidad que el jugador i escoja la estrategia sik para k = 1, ..., K. Como (pi1, ..., piK) es una distribución de probabilidades, ésta debe satisfacer que 0 ≤ pik ≤ 1 para k = 1, ..., K y que pi1+· · ·+piK = 1. Se usará pi para denotar una estrategia mixta del conjunto de distribuciones de probabilidad sobre Si. Lo anterior se resume formalmente en la siguiente definición. Definición 1.4 Considere el juego en forma normal G = {S1, ..., Sn;u1, ..., un} en donde Si = {si1, ..., siK}. Una estrategia mixta para el jugador i es una distribución de probabilidad pi = (pi1, ..., piK) sobre el espacio de estrategias Si con 0 ≤ pik ≤ 1 para k = 1, ..., K y que pi1 + · · ·+ piK = 1. Teorema 1.3 (Nash, 1950) En el juego en forma normal de n jugadores, G = {S1, ..., Sn;u1, ..., un}, si n es un número finito de jugadores y Si es un conjunto finito para i = 1, 2, ..., n, entonces existe al menos un equilibrio de Nash, el cual posiblemente incluye estrategias mixtas. Demostración: Emplea el teorema de punto fijo de Kakutani6 para correspondencias. Ver Nash (1950)7. Ejemplo 3 Considérese el juego de la batalla de los sexos, descrito en el cuadro 1.6. Dicho juego posee dos equilibrios de Nash en estrategias puras, dados por EN(G)={(Ópera,Ópera) ; (Boxeo,Boxeo)} 5Op. cit. 6Kakutani, S. (1941) “A Generalization of Brouwer’s Fixed Point Theorem” Duke Mathematical Journal No 8, págs 457-459. 7Nash, J. “Equilibrium Points in n−person Games” Proceedings of the National Academy of Sciences, No 36, págs. 48-49. 6 Cuadro 1.6: Batalla de los Sexos Ella (J1)\Él (J2) Boxeo (p2) Ópera (1− p2) Boxeo (p1) (1,2) (0,0) Ópera (1− p1) (0,0) (2,1) Supóngase que con probabilidad p2 él escoge boxeo y que ella lo cree aśı. De igual manera él cree que ella escoge boxeo con probabilidad p1. Jugador 1 (Ella): Ella escoge ópera o boxeo de acuerdo a la maximización de la utilidad esperada. Aśı: u1(boxeo) = 1 · p2 + (1− p2) · 0 = p2 u1(ópera) = 0 · p2 + 2 · (1− p2) = 2 · (1− p2) por lo que para p2 = 2/3 ella estará indiferente entre ópera y boxeo, con p2 > 2/3 escoge siempre boxeo (p1 = 1) y con p2 < 2/3 ella siempre escoge ópera (p1 = 0). Jugador 2 (Él): Análogamente a lo que ocurre con el jugador 1: u2(boxeo) = 2 · p1 + 0 · (1− p1) = 2 · p1 u2(ópera) = 0 · p1 + 1 · (1− p1) = (1− p1) por lo que para p1 = 1/3 él estará indiferente entre ópera y boxeo, con p1 > 1/3 escoge siempre boxeo (p2 = 1) y con p2 < 1/3 él siempre escoge ópera (p2 = 0). Aśı, los equilibrios de Nash, representados gráficamente en la figura 1.1, de este juego son: EN(G) = (ópera,ópera) ; (boxeo,boxeo) ; [2/3 ópera, 1/3 boxeo]︸ ︷︷ ︸ Estrategia Jugador 1 , [1/3 ópera, 2/3 boxeo]︸ ︷︷ ︸ Estrategia Jugador 2 7 1 3 2 3 p1 p2 1 1 Figura 1.1: Equilibrios de Nash de juego de la batalla de los sexos 8 Parte 2 Juegos Dinámicos de Información Completa En este tipo de juegos ocurre la primera (importante) distinción entre acción y estrategia. En los juegos estáticos de información completa eran conceptos equivalentes, pero en los juegos dinámicos una estrategia de un jugador debe especificar una acción para cualquier desarrollo posible del juego en donde algún jugador deba decidir. 2.1. Representación en Forma Extensiva de un Juego La representación en forma extensiva contiene toda la información de la representación normal, más el orden de interacción entre los jugadores; esto es, especifica qué decisiones se toman secuencial o simultáneamente. Definición 2.1 Un nodo es un punto del juego en el cual algún jugador (el cual puede ser la naturaleza también) decide una acción o donde el juego termina. A continuación se describen ciertos nodos especiales. 1. Nodo Sucesor al nodo x: Es un nodo que puede ser alcanzado si se ha llegado al nodo x. 2. Nodo Predecesor al Nodo x: Es un nodo que debe ser alcanzado antes de que el nodo x sea alcanzado. 3. Nodo Inicial: Es el nodo sin predecesores. 4. Nodo Terminal: Es un nodo sin sucesores. Definición 2.2 La rama de un nodo es una acción del conjunto de acciones posibles para el jugador en 9 dicho nodo dado. Una senda es una secuencia de nodos y ramas que llevan del nodo inicial a un nodo terminal. Definición 2.3 Un conjunto de información de un jugador es una colección de nodos de decisión que satisface: i) A dicho jugador le corresponde jugar. ii) Cuando en el transcurso del juego se llega a un nodo de esta colección, al jugador que le corresponde decidir no sabe a que nodo de este conjunto ha llegado con certeza. Definición 2.4 Un árbol del juego consiste en: i) Configuración de nodos que corren sin loops cerrados1 de un nodo inicial a los nodos finales o terminales. ii) Una indicación de qué nodo pertenece cada jugador (quién decide). iii) Una indicación de si juega la naturaleza y si ésta juega, indica las probabilidades con las que se determina la rama a seguir. iv) Conjuntos de información en los que se dividen los nodos de los jugadores. v) Los pagos del juego para cada jugador en cada nodo terminal. Definición 2.5 La representación en su forma extensiva de un juego especifica los jugadores, el timing de los turnos de cada jugador, las ramas que existen en cada nodo de decisión y los pagos recibidos para cada jugador en cada nodo terminal. Ejemplo 1 (Representación Extensiva del Dilema del Prisionero) El juego del cuadro 1.1 puede representarse en forma extensiva mediante la figura 2.1. La elipse de color negro rodea los nodos del conjunto de información del jugador 2. El hecho que haya más de un nodo dentro de esta elipse se debe a que la estructura informacional del juego señala que al momento de que al jugador 2 le toca mover no sabe si el jugador 1 coopera o no. Debido a que el conjunto de información del jugador dos contiene más de un elemento, este juego se le dice de información imperfecta. 1Esto quiere decir que no es posible avanzar desde un nodo cualquiera y llegar a este mismo nodo. 10 Figura 2.1: Forma Extensiva del Dilema del Prisionero Jugador 1 Jugador 2 C NC C NC C NC (−6,−6)(0,−9) (−9, 0) (−1,−1) Definición 2.6 Un juego se le dice de información imperfecta si al menos un jugador posee un conjunto de información con más de un elemento. 2.2. Equilibrio de Nash Perfecto en Subjuegos Considérese el siguiente ejemplo de un juego dinámico con información completa de la figura 2.2. Figura 2.2: Ejemplo Juego Dinámico de Información Completa Jugador 1 Jugador 2 I D I ′ D′ I ′ D′ (3, 1) (1, 2) (2, 1) (0, 0) En este juego, el jugador 1 tiene un conjunto de información con un sólo elemento, mientras que el jugador 2 tiene dos conjuntos de información con un sólo elemento (uno para cada curso de acción que emprenda el jugador 1). Definición 2.7 Una estrategia es un plan completo de acción que especifica una acción factible del ju- gador en cada contingencia (cada conjunto de información) en la que el jugador le pudiese corresponder decidir. En el juego de la figura 2.2, las acciones factibles para el jugador 1 son A1 = {I,D} y el espacio de estrategias es {I,D}11 Por su parte, las acciones para el jugador 2 son A2 = {I ′, D′} y debido a que hay dos conjuntos de información y dos posibles acciones, hay cuatro estra- tegias posibles. Ellas son {(I ′, I ′) , (I ′, D′) , (D′, I ′) , (D′, D′)} donde la estrategia E = (x, y) se lee como “jugar x si el jugador 1 juega I y jugar y si el jugador 1 juega D”. La representación en forma normal del juego es la del cuadro 2.1 y, como se puede deducir de la discusión de la sección 2.1, hay información valiosa que se pierde y ello provoca obtener equilibrios poco razonables. Cuadro 2.1: Representación en Forma Normal Juego de la figura 2.2. J1\J2 (I ′, I ′) (I ′, D′) (D′, I ′) (D′, D′) I (3, 1) (3, 1) (1, 2) (1, 2) D (2, 1) (0, 0) (2, 1) (0, 0) En particular, del cuadro 2.1 se desprende que hay dos equilibrios de Nash en estrategias puras. EN(G) = {( D, (D′, I ′) ) ; ( I, (D′, D′) )} Sin embargo, el equilibrio ( D, (I ′, D′) ) es poco razonable, pues si el jugador 1 se desv́ıa y usa la estrategia I, la mejor respuesta del jugador 2 es D′ y no I ′. Debido a esto, se busca refinar el concepto de equilibrio de Nash mediante la búsqueda de equilibrios de Nash que sean perfectos en subjuegos ; i.e. que en cada nodo de decisión, el jugador realiza su mejor respuesta. Definición 2.8 Se define un subjuego como un juego en forma extensiva que cumple tres requisitos. i) Empieza en un nodo de decisión n que es un conjunto de información en śı mismo2. ii) Incluye todos los nodos de decisión (incluyendo los finales) que son subsecuentes del nodo n. iii) No intersecta (o particiona) a ningún conjunto de información3 2Esto es, contiene un sólo elemento. 3Es decir, si un nodo de decisión n′ sucede a n en el árbol, entonces todos los nodos que estén en el mismo conjunto de información que contiene a n′ son también sucesores de n y, por tanto, deben incluirse en el subjuego. 12 Definición 2.9 (Reinhard Selten, 1965) Un perfil de estrategias es un equilibrio perfecto en subjuegos si éste cumple con dos condiciones: i) Es un equilibrio de Nash del juego completo. ii) Las reglas de acción relevantes son equilibrios de Nash para cada subjuego. Notar que de acuerdo a la definición 2.8, el juego completo es también un subjuego. Para obtener los equilibrios de Nash en cada subjuego se usa la inducción hacia atrás. Esto consiste en determinar cual es la decisión óptima en los nodos predecesores a los finales y con esta información resolver el juego reducido que resulta. Repitiendo el proceso se puede encontrar el equilibrio perfecto en subjuegos. Volviendo al juego de la figura 2.2, se aplica el refinamiento de la inducción hacia atrás. El equilibrio perfecto en subjuegos se ilustra en la figura 2.3, en donde las ĺıneas gruesas representan la mejor respuesta del jugador que decide en el nodo en el cual éstas comienzan, explicitándose como se descarta el equilibrio ( I, (D′, D′) ) . El resultado del juego es( D, (D′, I ′) ) Figura 2.3: Inducción hacia atrás Jugador 1 Jugador 2 I D I ′ D′ I ′ D′ (3, 1) (1, 2) (2, 1) (0, 0) Consideremos el juego de la figura 2.4. En dicho juego las estrategias disponibles para cada individuo son Agente 1: (D,D′′), (D, I ′′), (I,D′′), (I, I ′′) Agente 2: D′, I ′ En donde la estrategia (I,D′′) significa jugar I en la primera etapa y usar D′′ en la segunda etapa (si eventualmente se diera tal etapa). La resolución de dicho juego se ilustra en la figura 2.5. 13 Figura 2.4: Ejemplo de Inducción hacia Atrás D′ D ′′ I I ′ I ′′ 1 1 2 (0, 2) (3, 0) (1, 1) (2, 0) 2.3. Juegos Repetidos Un juego repetido es un juego estático que se juega con las mismas reglas durante varios peŕıodos. En este sentido, existen de dos tipos: i) Juegos Repetidos Finitos. ii) Juegos Repetidos Infinitos. De la inducción hacia atrás se sigue que si el juego que se repite posee un único equilibrio de Nash, entonces el único equilibrio de Nash perfecto en subjuegos de este juego repetido finitamente es que en cada repetición se juege el equilibrio de Nash del juego estático. A continuación se estudian los juegos repetidos infinitamente. Considérese el dilema del prisionero del cuadro 2.2 y supóngase que si los pagos en cada peŕıodo del preso i son {Ui(1), Ui(2), ...} entonces el pago total es: Πi = Ui(1) (1 + r)0 + Ui(2) (1 + r)1 + · · · Supóngase que el preso 1 tiene la siguiente estrategia: juega s1 mientras el preso 2 juega t1. Pero si el preso 2 usa t2, entonces el preso 1 usa s2 ad inf́ınitum. Ahora se busca la mejor respuesta del jugador 2 frente a esta estrategia. Ella puede tomar sólo la siguiente forma: i) Jugar t1 siempre. 14 Figura 2.5: Resolución Ejemplo de Inducción hacia Atrás Tercera Etapa D′ D ′′ I I ′ I ′′ 1 1 2 (0, 2) (3, 0) (1, 1) (2, 0) D D′ I I ′ 1 2 (3, 0) (1, 1) (2, 0) D I 1 (1, 1) (2, 0) Segunda Etapa Primera Etapa 15 Cuadro 2.2: Dilema del Prisionero Preso 1 \Preso 2 t1 t2 s1 (5,5) (-3,8) s2 (8,-3) (0,0) ii) Desviarse una vez, jugando t2, y por tanto juega t2 de alĺı en adelante. Notar que estas son las únicas posibilidades debido a que el juego de la etapa siguiente es igual al original y si, en algún instante le conviene cooperar, entonces siempre le conviene y de manera inversa, si en un instante tiene incentivos a desviarse, nunca querŕıa cooperar y por tanto se desviaŕıa el primer turno. Los pagos de la estrategia i) son Π1 = 5 (1 + r)0 + 5 (1 + r)1 + 5 (1 + r)2 + · · · = 5 · r + 1 r En cambio, los pagos de la estrategia ii) son 8 (1 + r)0 + 0 (1 + r)1 + · · · = 8 por lo que el jugador 2 coopera (i.e. usa la estrategia i)) para siempre en tanto 5 · r + 1 r > 8⇔ r < 5 3 Sin embargo, el equilibrio de Nash de este juego no es único. Por ejemplo4 los siguientes dos pares de estrategias configuran un equilibrio de Nash perfecto en subjuegos: Equilibrio 2 El preso 1 alterna entre s1 y s2 mientras que el preso 2 usa t1 siempre. Si el preso 2 se desv́ıa y juega t2, entonces el preso 1 juega s2 para siempre. Equilibrio 3 El preso 2 alterna entre t1 y t2 mientras que el preso 1 usa s1 siempre. Si el preso 1 se desv́ıa y juega s2, entonces el preso 2 juega t2 para siempre. La razón de la existencia de equilibrios múltiples se haya en el siguiente teorema. Teorema 2.1 (Teorema de Folk) Cualquier pago descontado factible puede ser sustentado como un equilibrio en tanto cada jugador tenga un pago esperado que sea al menos tan grande como el que el jugador puede asegurarse para śı mismo, aún cuando todos los jugadores juegen en contra de él (castigo). 4Se deja de ejercicio la demostración. 16 Parte 3 Juegos Estáticos de Información Incompleta Supóngase que en un juego estático con dos jugadores, el jugador uno (J1) no sabe frente a quién está jugando, pero sabe que es uno de dos tipos. En particular, sea S2 y N2 los tipos que puede ser el jugador dos. Las matrices de pagos para ambas situaciones son las del cuadro 3.1. Cuadro 3.1: Ejemplo Juego Estático de Información Incompleta Tipo S2 Tipo N2 J1\J2 O B O (2,1) (0,0) B (0,0) (1,2) J1\J2 O B O (2,0) (0,2) B (0,1) (1,0) La idea es modelar este tipo de situaciones donde el jugador uno no conoce las preferencias del jugador 2. 3.1. Información Privada o Asimétrica Definición 3.1 En un juego con información simétrica, el conjunto de información de un jugador ya sea en cualquier nodo en el que el jugador elige una acción o en un nodo terminal contiene los mismos elementos que los conjuntos de información de cualquier otro jugador. En caso contrario, el juego es uno de información asimétrica. 3.2. Juegos Estáticos Bayesianos En estos juegos existe incertidumbre respecto al tipo del otro jugador, donde “tipo” denota aquello que es información privada. Sean ti el tipo del jugador i y Ti el conjunto de 17 tipos posibles para el jugador i, entonces se puede escribir la función de pagos como: ui(a1, ..., an; ti) ti ∈ Ti Se supondrá que si bien el jugadoruno no sabe que tipo es el jugador dos, él posee una distribución de creencias con respecto a ello. De esta manera el análisis se lleva a cabo para una estructura de probabilidades. Bajo la definición 3.1 es posible que la información privada de un jugador sea algo que afecta la función de pagos del otro jugador. Un ejemplo de esto es el caso de dos empresas en donde sólo una de ellas conoce con certeza la demanda y la otra no. En este caso, es claro que la demanda afecta la función de pagos de ambas firmas. Para el caso de n jugadores, esto se captura permitiendo que la función de pagos del jugador i dependa no sólo de su propio tipo, sino que del tipo de todos los jugadores (t1, t2, ..., tn), en cuyo caso la función de pagos seŕıa: ui(a1, ..., an; t1, t2, ..., tn) ∀ tj ∈ Tj con j = 1, 2, ..., n Como el juego es estático, no hay información nueva que permita alterar el equilibrio del juego. Esto no ocurre en juegos dinámicos bayesianos, en donde a medida que se repite el juego hay aprendizaje sobre el tipo de los otros jugadores que se refleja en creencias a posteriori que difieren de las a priori. Sea pi(t−i|ti) la distribución de probabilidad que denota la creencia (a priori) que tiene el jugador i respecto del tipo de los demás jugadores t−i dado su propio tipo. Usualmente, se supone, a fin de simplificar notación más que nada, que ti y t−i son independientes y aśı: pi(t−i|ti) = pi(t−i) Definición 3.2 La representación en forma normal de un juego estático bayesiano de n jugadores especifica: Los espacios de acciones de los jugadores A1, A2, ..., An. Sus espacios de tipos T1, T2, ..., Tn Las creencias p1, p2, ..., pn Las funciones de pago u1, u2, ..., un. El tipo del jugador i, ti es conocido privadamente por el propio jugador i y determina la función de pagos ui(a1, ..., an; ti) donde ti ∈ Ti. El juego se denota de la siguiente forma: G = { A1, ..., An ; T1, ..., Tn ; p1, ..., pn ; u1, ..., un } 18 3.3. Transformación de Harsanyi1 La transformación de Harsanyi permite transformar un juego de información incompleta en un juego con información completa pero imperfecta. Se enuncia, nuevamente y adecuándo- la a nuestro contexto, la definición 2.6 de información perfecta e imperfecta. Definición 3.3 Un juego se le dice de información perfecta si todos los jugadores saben, en cualquier ronda, todos los movimientos que se han hecho a lo largo del juego. En caso contrario se le dice de información imperfecta. Para hacer la transformación se introduce un nuevo jugador, la naturaleza, el cual decide inicialmente los tipos de los jugadores y luego se los revela a algunos participantes del juego. El juego de información incompleta del cuadro 3.1 puede transformarse en un juego de información imperfecta de acuerdo a la figura 3.1. Figura 3.1: Juego del cuadro 3.1 Transformado según Harsanyi O B O B O B (2, 1) (0, 0) (0, 0) (1, 2) O B O B O B (2, 0) (0, 2) (0, 2) (1, 0) 1 1 1 1 2 2 S2 N2 Naturaleza Pr[S2] = 0,5 Pr[N2] = 0,5 De manera general, la dinámica de la transformación de Harsanyi es la siguiente: 1) La naturaleza saca aleatoriamente un vector de tipos t = (t1, t2, ..., tn) con ti ∈ Ti para todo i = 1, 2, ..., n. 2) La naturaleza revela ti sólo al jugador i (información privada del jugador i). 3) Los jugadores simultáneamente escogen acciones. Cada jugador i = 1, 2, ..., n elige algún ai ∈ Ai. 4) Se reciben los pagos ui(a1, ..., an; ti). Definición 3.4 Una estrategia (pura) para el jugador i debe especificar una acción factible para cada uno de los posibles tipos de i. En particular, en un juego estático bayesiano G = { A1, ..., An ; T1, ..., Tn ; p1, ..., pn ; u1, ..., un } 1Desarrollada por John Harsanyi, quien fue premio Nobel de Economı́a en 1994. 19 una estrategia para el jugador i es una función si(ti) donde para cada tipo ti ∈ Ti especifica una acción del conjunto factible Ai que el tipo ti elegiŕıa si es elegido por la naturaleza. Definición 3.5 Una estrategia se le dice separadora si para cada ti ∈ Ti la función si(ti) especifica una acción distinta ai ∈ Ai. Análogamente, una estrategia se le dice agrupadora si todos los tipos ti ∈ Ti eligen la misma acción. Definición 3.6 Un equilibrio de Nash Bayesiano en el juego estático bayesiano G = { A1, ..., An ; T1, ..., Tn ; p1, ..., pn ; u1, ..., un } son las estrategias S∗ = (s∗1, s ∗ 2, ..., s ∗ n) y creencias ( p1(t−1), p2(t−2), ..., pn(t−n) ) tales que para cada jugador i y cada uno de sus tipos posibles ti ∈ Ti, la estrategia s∗i (ti) es una solución a máx {ai∈Ai} ∑ t−i∈T−i ui ( s∗1(t1), ..., s ∗ i−1(ti−1), ai, s ∗ i+1(ti+1), ..., s ∗ n(tn) ) · pi(t−i|ti) donde T−i es el conjunto de posibles tipos de todos los jugadores menos el i−ésimo. 3.4. Ejemplo 1 Considérese el cuadro 3.1, en donde las creencias del jugador 1 son Pr(t2 = S2) = 0,5. Aśı Pr(t2 = N2) = 1− 0,5 = 0,5. Tipo S2 Tipo N2 J1\J2 O B O (2,1) (0,0) B (0,0) (1,2) J1\J2 O B O (2,0) (0,2) B (0,1) (1,0) En este ejemplo, las estrategias posibles del jugador 2 son: Separadora: Tipo S2 juega O y un tipo N2 juega B. Esto se denota con: (O S2 , B N2 ) Separadora: Tipo S2 juega B y un tipo N2 juega O. Esto se escribe como: (B S2 , O N2 ) 20 Agrupadora: Tipo S2 juega O y un tipo N2 juega O. Es decir: (O,O) Agrupadora: Tipo S2 juega B y un tipo N2 juega B. (B,B) Si, por ejemplo, el jugador 2 juega (O,O), entonces el pago esperado del jugador 1 si juega O es 1 2 · 2 + 1 2 · 2 = 2 y si jugase B el pago esperado seŕıa 1 2 · 0 + 1 2 · 0 = 0 Repitiendo el proceso para cada una de las cuatro estrategias anteriores, se puede construir la tabla 3.2. Cuadro 3.2: Pagos Esperados Jugador 1 (O,O) (O,B) (B,O) (B,B) O 2 1 1 0 B 0 1/2 1/2 1 Se tiene que en este juego hay un único equilibrio de Nash bayesiano. Considere el perfil de estrategias ( O, (O,O) ) . Del cuadro 3.2 se sabe que la mejor respuesta del jugador 1 frente a (O,O) es O, por lo que sólo hay que verificar si (O,O) es la mejor respuesta del jugador 2 frente a O. Si el jugador 2 es de tipo S2, frente a O la acción óptima es O. Si el jugador 2 es de tipo N2, frente a O la acción óptima es B. De esta manera, al no ser (O,O) es la mejor respuesta del jugador 2 frente a O, se tiene que el perfil de estrategias ( O, (O,O) ) no forman parte del equilibrio de Nash bayesiano. Sin embargo, ya que (O,B) es la mejor respuesta del jugador 2 a O y gracias al cuadro 3.2 se sabe que O es la mejor respuesta del jugador 1 frente a (O,B). De esta manera, se tiene el siguiente equilibrio de Nash separador: ENB(G) = {( O, (O,B) ) ; Pr[t2 = S2] = 0,5 } 3.5. Ejemplo 2 Considere un juego en donde ninguno de los jugadores conoce los tipos del otro de acuerdo al cuadro 3.3. 21 Cuadro 3.3: Juego con Información Privada en ambos Jugadores Tipo S2 Tipo N2 Tipo S1 J1\J2 O B O (2,1) (0,0) B (0,0) (1,2) Tipo S1 J1\J2 O B O (2,0) (0,2) B (0,1) (1,0) Tipo S2 Tipo N2 Tipo N1 J1\J2 O B O (0,1) (2,0) B (1,0) (0,2) Tipo N1 J1\J2 O B O (0,0) (2,2) B (1,1) (0,0) En donde las creencias de cada jugador son: Jugador 1: Pr[t2 = S2] = 1/2 y Pr[t2 = N2] = 1/2 Jugador 2: Pr[t1 = S1] = 2/3 y Pr[t1 = N1] = 1/3 En este ejemplo, cada jugador puede usar las siguientes estrategias: (O,O) (O,B) (B,O) (B,B) Los cuadros siguientes expresan los pagos esperados de cada jugador y de cada tipo de éste y se construyen de manera análoga al cuadro 3.2, explicando como obtener uno de los pagos a modo de ilustración. Pagos Jugador 1 Si el jugador 1 es de tipo S1, el jugador 2 usa la estrategia (B,B) entonces el pago esperado de jugar B es: 1 2 · 1 + 1 2 · 1 = 1 Cuadro 3.4: Pagos Esperados para S1 J1\J2 (O,O) (O,B) (B,O) (B,B) O 2 1 1 0 B 0 1/2 1/2 1 Si el jugador 1 es de tipo N1, el jugador 2 usa la estrategia (O,B) entonces el pago esperado de jugar B es: 1 2 · 1 + 1 2 · 0 = 1 2 22 Cuadro 3.5: Pagos Esperados para N1 J1\J2 (O,O) (O,B) (B,O) (B,B) O 0 1 1 2 B 1 1/2 1/2 0 Pagos Jugador 2Si el jugador 2 es de tipo S2, el jugador 1 usa la estrategia (B,O) entonces el pago esperado de jugar O es: 2 3 · 0 + 1 3 · 1 = 1 3 Cuadro 3.6: Pagos Esperados para S2 J2\J1 (O,O) (O,B) (B,O) (B,B) O 1 2/3 1/3 0 B 0 2/3 4/3 2 Como último ejemplo, si el jugador 2 es de tipo N2, el jugador 1 usa la estrategia (O,O) entonces el pago esperado de jugar B es: 2 3 · 2 + 1 3 · 2 = 2 Cuadro 3.7: Pagos Esperados para N2 J2\J1 (O,O) (O,B) (B,O) (B,B) O 0 1/3 2/3 1 B 2 4/3 2/3 0 Equilibrio de Nash Bayesiano En este juego se tiene que: A1 = {O,B} A2 = {O,B} T1 = {S1, N1} T2 = {S2, N2} p1 = {1/2, 1/2} p1 = {2/3, 1/3} u1(a1, a2; t1) u2(a1, a2; t2) Para encontrar el equilibrio de Nash bayesiano sólo se puede proceder mediante prueba y error. Dadas las creencias, se procede a evaluar si tres candidatos a equilibrios son o no 23 equilibrios de Nash bayesianos. Candidato 1 ( (O,B), (O,B) ) Si el jugador 2 juega (O,B), un jugador 1 tipo S1 juega O, gracias al cuadro 3.4, pero un jugador 1 tipo N1 frente a esta estrategia del jugador 2 prefiere jugar O por el cuadro 3.5. De esta forma ( (O,B), (O,B) ) no forma parte de un equilibrio de Nash bayesiano. Candidato 2 ( (O,O), (O,B) ) Del análisis del candidato 1, se sabe que la mejor respuesta del jugador 1 frente a (O,B) es (O,O). Hay que verificar que (O,B) es la mejor respuesta del jugador 2 frente a (O,O). Si el jugador 2 es de tipo S2, frente a (O,B) escoge O gracias al cuadro 3.6. Por otro lado, un jugador 2 tipo N2 escogeŕıa B frente a (O,B), gracias al cuadro 3.7. Aśı, este par de estrategias forma parte de un equilibrio de Nash bayesiano. Candidato 3 ( (B,O), (B,B) ) Frente a (B,B), un jugador 1 tipo S1 escoge B (ver cuadro 3.4) mientras que uno de tipo N1 elige O. Luego, en efecto, la mejor respuesta del jugador 1 a (B,B) es (B,O) y sólo falta determinar que la mejor respuesta del jugador 2 frente a (B,O) es (B,B). Un jugador 2 tipo S2 frente a (B,O), del cuadro 3.6, escoge B y uno tipo N2 escoge O 2. De esta forma, este perfil de estrategias conforma parte de un equilibrio de Nash bayesiano. Finalmente, los equilibrios de Nash del juego son: ENB(G) = {( (O,O), (O,B) ) con creencias Pr[t1 = S1] = 2/3; Pr[t2 = S2] = 0,5( (B,O), (B,B) ) con creencias Pr[t1 = S1] = 2/3; Pr[t2 = S2] = 0,5 } 2Si bien hay indiferencia en este caso, de todas formas ella apoya al equilibrio de Nash bayesiano. 24 Parte 4 Juegos Dinámicos de Información Incompleta En este tipo de juegos se puede dar el aprendizaje; esto es, un jugador puede inferir el tipo de otro a través del comportamiento del otro a lo largo del juego, modificando sus creencias a priori a unas a posteriori sobre el tipo del otro jugador. Para que ello ocurra, lógicamente este otro jugador ha de usar estrategias separadoras (o h́ıbridas) para que el aprendizaje en efecto modifique las creencias. Este aprendizaje se lleva a cabo mediante el teorema de Bayes: Pr[A|B] = Pr[A ∩B] Pr[B] Para ilustrar los juegos dinámicos de información incompleta, se inicia con un ejemplo. 4.1. Siguiendo al Ĺıder Suponga una situación en la que el jugador J no conoce con exactitud los pagos del juego en forma precisa. En particular, el tiene una distribución a priori que representa las creencias sobre la estructura de los pagos (distintos juegos) representadas en el cuadro 4.1. Por su parte, el jugador R śı conoce que juego se está jugando. Los juegos se representan en el cuadro 4.2. Para resolver el juego se realiza la transformación de Harsanyi que se aprecia en el cuadro 4.3. De este modo, se modela como si la naturaleza moviese primero y eligiese los pagos del juego de acuerdo a los juegos A, B o C según las probabilidades subjetivas del jugador J. Luego el jugador R observa la movida de la naturaleza (pero no J). 25 Cuadro 4.1: Creencias del Jugador J Creencias Juego 0.7 A 0.1 B 0.2 C Cuadro 4.2: Creencia de los Pagos R L S J J L L S S (2, 2) (−1,−1) (−1,−1) (1, 1) Juego A R L S J J L L S S (5, 1) (0, 2) (−1,−1) (2, 3) Juego B R L S J J L L S S (0, 0) (−1,−1) (−1,−1) (4, 4) Juego C 26 Cuadro 4.3: Juego Completo Transformado R L S J J L L S S (2, 2) (−1,−1) (−1,−1) (1, 1) R L S J J L L S S (5, 1) (0, 2) (−1,−1) (2, 3) R L S J J L L S S (0, 0) (−1,−1) (−1,−1) (4, 4) A B C N 0,7 0,2 0,1 27 En este último cuadro, se aprecia que el jugador J posee dos conjuntos de información, consistentes en los nodos con puntos rojos o azules, debido a que el jugador J observa la movida de R pero no la de la naturaleza. Por su parte, el jugador R posee tres conjuntos de información con un sólo elemento (uno para cada estado de la naturaleza). Definición 4.1 El tipo de un jugador es el conjunto de estrategias, partición de información y función de pagos que escoge la naturaleza para algún jugador al inicio de un juego de información incompleta. Un estado de la naturaleza es la elección del tipo hecha por la naturaleza. Al igual que en la parte 3, las estrategias deben especificar un plan de acción para cada contingencia que pueda enfrentar el jugador. Por ejemplo, considerando el juego del cuadro 4.3, una estrategia posible del jugador R es la tripleta: (LLS) = Jugar L si A Jugar L si B Jugar S si C Notar que esta estrategia especifica una acción a emprender para cada conjunto de informa- ción del jugador R. Una estrategia para el jugador J es el par: (LS) = { Jugar L si el jugador R usa L Jugar S si el jugador R usa S Un jugador tiene creencias acerca de los tipos de los demás jugadores y a medida que los ve tomar decisiones, las actualiza bajo el supuesto de que están siguiendo un com- portamiento de equilibrio. Luego, un equilibrio Bayesiano perfecto se usa para denotar un equilibrio perfecto en subjuegos en donde los jugadores actualizan sus creencias de acuerdo a la regla de Bayes. De manera informal, para determinar la existencia de un equilibrio se debe realizar lo siguiente: 1. Se propone un candidato a equilibrio (un perfil de estrategias). 2. Obtener las creencias actualizadas según la regla de Bayes. 3. Dadas las creencias y dada la estrategia del otro, cada jugador debe elegir su mejor respuesta simultáneamente. A continuación se determina si ( (LLS); (LS) ) forma parte o no de un equilibrio bayesiano perfecto. 28 Actualización de Creencias de cada Jugador Dado que los conjuntos de información del jugador R tienen un sólo elemento, al mover la naturaleza éste sabe con certeza el estado de la naturaleza prevaleciente, por lo que su actualización resulta trivial. Para el jugador J, se requiere calcular: Pr [A|L] Pr [B|L] Pr [C|L] Pr [A|S] Pr [B|S] Pr [C|S] •Pr[A|L] Del teorema de Bayes, se tiene que Pr[A|L] = Pr[L|A] · Pr[A] Pr[L] y por el teorema de la probabilidad total Pr[L] = Pr[L|A] · Pr[A] + Pr[L|B] · Pr[B] + Pr[L|C] · Pr[C] Dado que el jugador R usa la estrategia (LLS) es claro que Pr[L|A] = 1 Pr[L|B] = 1 Pr[L|C] = 0 y dadas las creencias del cuadro 4.1 se tiene que Pr[A|L] = 1 · 0,7 1 · 0,7 + 1 · 0,1 + 0 = 0,875 •Pr[B|L] Pr[B|L] = Pr[L|B] · Pr[B] Pr[L] = 1 · 0,1 1 · 0,1 + 1 · 0,7 + 0 = 0,125 •Pr[C|L] Pr[C|L] = Pr[L|C] · Pr[C] Pr[L] = 0 · 0,2 Pr[L] = 0 De manera análoga se calcula el resto de las probabilidades. Pr[A|S] = 0 Pr[B|S] = 0 Pr[C|S] = 1 Como último ejemplo se calcula Pr[C|S] Pr[C|S] = Pr[S|C] · Pr[C] Pr[S] = 1 · 0,2 0 · Pr[S|A] + 0 · Pr[S|B] + 1 · 0,2 = 1 29 Mejor Respuesta de J dado (LLS) y las Creencias Actualizadas. Los pagos al emplear cada acción posible, dado que el jugador R jugó L, son: Pago esperado de Jugar L Pago esperado de Jugar S 2 · 0,875 + 1 · 0, 125 = 1,1875 −1 · 0,875 + 0,125 · 2 = −1,635 Aśı, la mejor respuesta de J dado que el jugador R usa L es L. Si el jugador R usa S, el jugador J cree que, con probabilidad uno, la naturaleza jugó C. La mejor respuesta de J ante S es emplear S. De este modo, (LS) es la mejor respuesta del jugador J ante (LLS). Mejor Respuestade R dado (LS) y las Creencias Actualizadas. Dado que la naturaleza escoge A y que el jugador J usa la estrategia (LS), los pagos de usar L o S son: Pago esperado de Jugar L Pago esperado de Jugar S 2 1 Aśı, la mejor respuesta del jugador R ante (LS) en el estado A es L. Si la naturaleza escoge B y el jugador J usa (LS), los pagos para cada acción son: Pago esperado de Jugar L Pago esperado de Jugar S 5 2 Aśı, la mejor respuesta del jugador R ante (LS) en el estado B es L. Finalmente, si la naturaleza escoge C y el jugador J usa (LS), los pagos para cada acción son: Pago esperado de Jugar L Pago esperado de Jugar S 0 4 En este caso, la mejor respuesta del jugador R ante (LS) es S. De esta forma, (LLS) es la mejor respuesta del jugador R ante (LS). 30 Debido a que simultáneamente las estrategias del jugador R, (LLS), y la del jugador J, (LS), son mejor respuesta una de otra, el par {(LLS) ; (LS)} forma parte de un equilibrio bayesiano perfecto1. 4.2. Equilibrio de Nash Bayesiano Perfecto Este concepto de equilibrio es un refinamiento del equilibrio de Nash Bayesiano que elimina las promesas o amenazas no créıbles. Este punto es ilustrado por el siguiente juego con información completa, pero imperfecta. El jugador 1 escoge entre tres acciones I, C y D. Si el jugador 1 escoge D el juego termina sin que el jugador 2 mueva. Si el jugador 1 escoge I o C, entonces el jugador 2 sabe que D no fue escogido, pero no sabe si I o C fue jugado, y escoge entre dos acciones I ′ y D′ tras lo cual el juego termina. La representación extensiva se haya en la figura 4.1, donde p es la creencia de que, dado que el jugador 2 juega, el jugador 1 haya usado la acción I. Por otro lado, la representación normal está en el cuadro 4.4, donde los números subrayados indican la mejor respuesta de cada jugador donde haya un equilibrio de Nash. Figura 4.1: Representación en forma extensiva Jugador 2 Jugador 1 (1, 3) (2, 1) (0, 0) (0, 2) (0, 1) D I C I ′ D′ D ′ I ′ (1− p)p Cuadro 4.4: Representación normal del juego Jugador 1\Jugador 2 I’ D’ I (2,1) (0,0) C (0,2) (0,1) D (1,3) (1,3) El cuadro 4.4 señala que EN(G) = { (I, I ′) ; (D,D′) } = EPS(G) En este caso, los equilibrios de Nash son a su vez equilibrios perfectos en subjuegos debido a que el único subjuego del juego es el juego completo. Sin embargo, el equilibrio (D,D′) se sustenta en una amenaza no créıble. Esto se debe a que si el jugador llegara a mover, la estrategia I ′ domina a D′ de manera que el jugador 1 no se verá inducido a jugar D bajo la 1Se resalta la palabra parte, pues más adelante se define formalmente un equilibrio bayesiano perfecto, el cual no sólo consta de un par de estrategias, al igual que el equilibrio de Nash Bayesiano. 31 amenaza de que el jugador 2 jugará D′. De esta manera se requiere refinar el concepto de equilibrio para eliminar el equilibrio de Nash (D,D′). 4.2.1. Requisitos para el Equilibrio Perfecto Bayesiano Requisito 1 En cada conjunto de información, al jugador que le toca decidir debe tener una creencia acerca del nodo en el conjunto de información que se ha alcanzado. Notar que en este caso, una creencia es una distribución de probabilidad sobre los nodos del conjunto de información. En particular, en conjuntos de información con un sólo elemento, las creencias del jugador asignarán una probabilidad uno en el único nodo de decisión. Requisito 2 Dadas sus creencias, las estrategias de los jugadores deben ser secuencialmente racio- nales; esto es, en cada conjunto de información la acción tomada por el jugador al que le toca mover y las estrategias del jugador de ah́ı en adelante (estrategias subsecuentes) deben ser óptimas dada las creencias de ese jugador en ese conjunto de información y dada las estrategias siguientes de los otros jugadores. En la figura 4.1 el requisito 1 implica que si le toca mover al jugador 2, éste debe poseer ciertas creencias respecto a si el jugador 1 jugó I o si jugó C. Dichas creencias están repre- sentadas por las probabilidades p y (1− p). Luego, dadas las creencias, el pago esperado de jugar D′ es 0 · p+ (1− p) · 1 = 1− p mientras que el pago esperado de jugar I ′ es 1 · p+ 2 · (1− p) = 2− p y debido a que 2 − p > 1 − p para cualquier p ∈ [0, 1], entonces el requisito 2 evita que se elija D′. Por tanto, los requisitos 1 y 2 eliminan a (D,D′) como equilibrio. Definición 4.2 Para un equilibrio dado en un juego en forma extensiva, se dice que un conjunto de informa- ción está en la trayectoria de equilibrio si éste conjunto de información será alcanzado con probabilidad positiva si el juego se juega con las estrategias de equilibrio. Análogamen- te, un conjunto de información está fuera de la trayectoria de equilibrio si de forma segura no será alcanzado si se juegan las estrategias de equilibrio. Requisito 3 En los conjuntos de información en las trayectorias de equilibrio, las creencias están deter- minadas por la regla de Bayes y las estrategias de equilibrio de los jugadores. 32 De este modo, en el juego de la figura 4.1, en el equilibrio perfecto en subjuegos (I, I ′), debe ser el caso que p = 1 para el jugador 2. Es decir, dada la estrategia de equilibrio del jugador 1, entonces el jugador 2 sabe en que nodo están. Formalmente, un equilibrio consiste no sólo de una estrategia para cada jugador sino que también incluye una creencia de cada jugador en cada conjunto de información en el cual al jugador le toca decidir. Requisito 4 En los conjuntos de información fuera de la trayectoria de equilibrio, las creencias se deter- minan por la regla de Bayes y las estrategias de equilibrio de los otros jugadores cuando es posible. Definición 4.3 Un equilibrio perfecto bayesiano consiste en estrategias y creencias que satisfacen los requisitos 1 al 4. Ejemplo 1 Considérese el juego en su forma extensiva del la figura 4.2. Figura 4.2: Ejemplo Equilibrio Perfecto Bayesiano Jugador 3 Jugador 2 D (1, 2, 1) (3, 3, 3) (0, 1, 2) (0, 1, 1) L R L′ R′ R′L′ (1− p)p Jugador 1 A (2, 0, 0) Considerando el subjuego donde decide el jugador 2, la representación en forma normal es la del cuadro 4.5. Para este subjuego, se tiene que EN(G) = { (L,R′) } ⇒ EPS(G) = { (D,L,R′) } Estas estrategias, con las creencias p = 1 satisfacen los requisitos 1 al 3 y también satisfacen, trivialmente, el requisito 4 porque no hay conjuntos de información fuera de la trayectoria 33 Cuadro 4.5: Subjuego en forma normal Jugador 2\Jugador 3 L′ R′ L (2, 1) (3, 3) R (1, 2) (1, 1) de equilibrio, luego de acuerdo a la definición 4.3 (D,L,R′) con la creencia p = 1 es un equilibrio perfecto bayesiano. Considere ahora las estrategias (A,L, L′) junto a la creencia p = 0. Se tiene que ellas también configuran un equilibrio de Nash y satisface los requisitos 1 al 3. El jugador 3 tiene una creencia y actúa óptimamente de acuerdo a ella. Dado esto, los jugadores 1 y 2 actúan óptimamente dada las estrategias subsecuentes de los otros jugadores. Pero este equilibrio de Nash no es perfecto en subjuegos, ya que la creencia del jugador 3, p = 0 ,es incongruente con la estrategia de 2 (no resulta óptima), pero los requerimientos 1 al 3 no imponen restric- ciones en las creencias del jugador 3, ya que el conjunto de información de dicho jugador no se alcanza con las estrategias predeterminadas. No obstante, el requisito 4 fuerza a que las creencias del jugador 3 estén determinadas por la estrategia del jugador 2: si la estrategia del jugador 2 es R entonces p = 0, pero si p = 1, entonces el requisito 2 obliga a que la estrategia del jugador 3 sea R′, luego las estrategias (A,L, L′) con la creencia p = 0 no es un equilibrio perfecto bayesiano. Ejemplo 2 Considere el juego en su forma extensiva de la figura 4.3, en donde se omiten los pagos intencionalmente. Figura 4.3: Juego Ejemplo 2 Jugador 3 Jugador 2 D L R L′ R′ L′ (1− p)p Jugador 1 A A′ R′ Si la estrategia de equilibrio del jugador 1 es A, entonces elconjunto de información del jugador 3 está fuera de la senda de equilibrio, pero ahora el requisito 4 no puede determinar 34 las creencias del jugador 3 a partir de la estrategia del jugador 2. Esto se debe a que si la estrategia del jugador 2 es A′, entonces el requisito 4 no impone restricciones en las creencias del jugador 3, pero si la estrategia del jugador 2 es L con probabilidad q1, R con probabilidad q2 y A ′ con probabilidad 1− q1 − q2, entonces el requisito 4 dice que la creencia del jugador 3 debe ser: p = q1 q1 + q2 4.3. Juegos de Señalización Existen situaciones, dentro de la economı́a de la información2, donde se quiere modelar la interacción estratégica entre dos partes y en donde una de ellas trata de informar a la otra acerca de su tipo a través de una señal. Un ejemplo de esta interacción es la decisión de educación de las personas al saber que el nivel de ésta comunica, de manera más o menos créıble, las competencias y habilidades de las personas. Definición 4.4 Un juego de señalización es un juego dinámico de información incompleta con dos jugadores: un emisor (S) y un receptor (R) en donde se cumplen los siguientes requisitos: i) La naturaleza escoge un tipo ti para el emisor de un conjunto de tipos factibles T = {t1, ..., tI} de acuerdo a la distribución de probabilidad p(ti), donde p(ti) > 0 para todo i y p(t1) + p(t2) + · · ·+ p(tI) = 1 ii) El emisor observa ti y elige un mensaje mj de un conjunto de mensajes factibles M = {m1, ...,mJ}. iii) El receptor observa mj, pero no ti, y luego escoge una acción ak del conjunto de acciones factibles A = {a1, ...a,k }. iv) Los pagos de cada jugador están dados por uS(mj, ak; ti) y aR(mj, ak; ti). Un ejemplo de juegos de esta clase se haya en la figura 4.4, en donde se omiten los pagos. En este juego se tiene que T = {t1, t2} M = {m1,m2} A = {a1, a2} p(t1) = p 2Será estudiado en la siguiente parte del curso. 35 Figura 4.4: Forma Extensiva Juego de Señalización p (1− p) Naturaleza Emisor Emisor t1 t2 Receptor Receptor m1 m1 m2 m2 Definición 4.5 Una estrategia para el emisor en un juego de señalización es una función m(ti) que es- pecifica el mensaje elegido para cada tipo que la naturaleza puede haber escogido. Por otro lado, una estrategia para el receptor es una función a(mj) que indica la acción emprendida para cada mensaje que el emisor pueda enviar. De acuerdo a la definición 4.5, en el ejemplo de la figura 4.4 cada jugador tiene cuatro estrategias posibles. Estrategias para el emisor 1) Jugar m1 si la naturaleza escogiese t1 o t2. 2) Jugar m1 si la naturaleza determina t1 y jugar m2 si la naturaleza escoge t2. 3) Jugar m2 si la naturaleza determina t1 y jugar m1 si la naturaleza escoge t2. 4) Jugar m2 si la naturaleza escogiese t1 o t2. Estrategias para el receptor 1) Jugar a1 si el emisor env́ıa m1 o si env́ıa m2. 2) Jugar a1 si el emisor env́ıa m1 y jugar a2 si env́ıa m2. 3) Jugar a2 si el emisor env́ıa m1 y jugar a1 si env́ıa m2. 4) Jugar a2 si el emisor env́ıa m1 o si env́ıa m2. Ahora se procede a reescribir los requisitos 1 al 4 para el juego de señalización. Debido a que el emisor conoce la historia completa del juego cuando elige un mensaje, su elección ocurre en un set de información singleton (con un sólo elemento) por lo que el requisito 1 se cumple de manera trivial para el emisor. Para el receptor en cambio, su elección ocurre en un conjunto de información no-singleton. Requisito de Señalización 1 Después de observar cualquier mensaje mj ∈M, el receptor debe tener una creencia acerca de que tipos pueden haber enviado mj. Se llama a esta creencia la distribución de probabilidad 36 µ(ti|mj) donde µ(ti|mj) ≥ 0 ∀ ti ∈ T y ∑ ti∈T µ(ti|mj) = 1 Requisito de Señalización 2 (Receptor) Para cada mensaje mj ∈ M, la acción del receptor a∗j(mj) debe maximizar la utilidad esperada dada su creencia µ(ti|mj) acerca de que tipos puede haber emitido el mensaje. Esto es, a∗j(mj) resuelve el problema máx {ak∈A} ∑ ti∈T µ(ti|mj) · uR(ak; ti) (Emisor) Simultáneamente con lo anterior, para todo ti ∈ T, el mensaje m∗(ti) debe maxi- mizar la utilidad del emisor dada la estrategia a∗(mj); es decir, m ∗(ti) resuelve: máx {mj∈M} uS(ak,mj; ti) Requisito de Señalización 3 Para mj ∈M, si existe ti ∈ T tal que m∗(ti) = mj,3 entonces la creencia del receptor en el conjunto de información correspondiente a mj deben derivarse usando la regla de Bayes y la estrategia del emisor: µ(ti|mj) Definición 4.6 Un equilibrio perfecto bayesiano en estrategias puras en un juego de señalización con- siste en un par de estrategias ( m∗(ti) , a ∗(mj) ) y en una creencia µ(ti|mj) que satisfacen los requisitos de señalización 1, 2 y 3. Ejemplo 3 Considere el juego de la figura ??. Sean (p, 1− p) y (q, 1− q) las creencias del receptor en sus dos conjuntos de información. Este juego posee cuatro candidatos a equilibrios perfectos bayesianos en estrategias puras. 1. Agrupador en L. 2. Agrupador en R. 3. Separador (L,R). 3Esto es; para cada conjunto de información en la senda de equilibrio. 37 4. Separador (R,L). donde (m′,m′′) indica que un individuo tipo t1 env́ıa la señal m ′ y uno tipo t2 env́ıa la señal m′′. Figura 4.5: Ejemplo Juego de Señalización 0,5 0,5 Naturaleza Emisor Emisor t1 t2 Receptor Receptor L L R R u d u d u d u d (2, 1) (0, 0) (1, 0) (1, 2) (1, 3) (4, 0) (2, 4) (0, 1) p (1− p) q (1− q) Candidato 1: (L,L) Estrategia del Receptor Supóngase que existe un equilibrio en el cual la estrategia del emisor es (L,L), luego el conjunto de información correspondiente a L está en la senda de equilibrio de manera que las creencias ( p, 1 − p ) se determinan por la regla de Bayes. Intuitivamente, el recibir la señal L no entrega información al receptor, pues ambos tipos env́ıan la misma, por lo que la distribución a priori es igual a la a posteriori. Anaĺıticamente, esto se demuestra según: Pr [t1|L] = Pr [L|t1] · Pr [t1] Pr [L] ⇒ Pr [t1|L] = 1 · 0,5 1 = 0,5 Dadas la estrategia (L,L) y las creencias p = 0,5 se busca la mejor respuesta de el receptor frente a la acción L (en la senda de equilibrio). Pago esperado de Jugar u Pago esperado de Jugar d 3 · 0,5 + 4 · 4 = 3,5 0 · 0,5 + 0,5 · 1 = 0,5 De este modo, frente a L la mejor respuesta del receptor es jugar u. Ahora se procede a estudiar que hace el receptor en los conjuntos de información fuera de la trayectoria de equilibrio. Sea q la probabilidad de que el emisor sea de tipo t1 dado que env́ıa la señal R. Con esto, la utilidad esperada de jugar cada estrategia viene dado por lo siguiente. E[UR(u|R)] = q · 1 + (1− q) · 0 = q E[UR(d|R)] = q · 0 + (1− q) · 2 = 2(1− q) 38 Aśı, el receptor juega u si q > 2− 2q ⇔ q > 2 3 y juega d si q < 2 3 Estrategia del Emisor La mejor respuesta del receptor frente a (L,L) es (u, u) si q > 2 3 y es (u, d) si q < 2 3 . Hay que ver si la mejor respuesta del emisor frente a estas estrategias es o no (L,L). Un emisor tipo t1 que juega R recibe los pagos Pago esperado si q < 2 3 Pago esperado si q > 2 3 0 2 por lo que la acción L es la mejor respuesta sólo si q < 2 3 , pues en caso contrario un emisor tipo t1 tiene incentivos a jugar R. Un emisor tipo t2 que juega L, con lo que el receptor juega u, recibe los pagos el pago de 2 que es mayor que el pago de jugar R para cualquier valor de q. De esta manera, se ha probado que4:{ (L,L) , (u, d) , p = 0,5 , q ≤ 2 3 } es un equilibrio perfecto bayesiano agrupador. Candidato 2: (R,R) Estrategia del Receptor Supóngase que la estrategia de equilibrio del emisor es (R,R). De manera análoga al caso anterior, la probabilidad revisada es q = 0,5 < 2/3 de manera que la mejor respuesta del receptor a R es d, la cual otorga los pagos siguientes al emisor. Pago tipo t1 Pago tipo t2 0 1 Pero, un individuo t1 puede obtener un pago de 1 jugando L, debido a que la mejor respuesta del receptor a L es u para cualquier valor de p,de manera que no hay un equilibrio perfecto bayesiano donde el emisor usa la estrategia (R,R). 4Cuando q = 2/3 el receptor está indiferente entre jugar u o d por lo que bien sustenta este equilibrio bayesiano perfecto 39 Candidato 3: (L,R) Si el emisor usa la estrategia (L,R) entonces ambos conjuntos de información estarán en la trayectoria de equilibrio, por lo que ambas creencias (determinadas por p y q) vienen dadas por la regla de Bayes. De hecho, en este caso: p = Pr[t1|L] = Pr[L|t1] · Pr[t1] Pr[L] = 1 · 0,5 1 · 0,5 + 0 · 0,5 = 1 ya que Pr[L] = Pr[L|t1] · Pr[t1] + Pr[L|t2] · Pr[t2]. Análogamente: q = Pr[t1|R] = Pr[R|t1] · Pr[t1] Pr[R] = 0 · 0,5 0 · 0,5 + 1 · 0,5 = 0 Las mejores respuestas del receptor frente a estas creencias son u y d respectivamente de manera que el emisor recibe 1 independiente de su tipo, de manera que sólo puede chequearse si las estrategias del emisor es óptima dada la estrategia del receptor (u, d). Sin embargo, este no es el caso. Si el tipo t2 se desv́ıa usando L en vez de R, entonces el receptor responde con u y t2 recibe 2 que es mayor que el pago de usar R. Candidato 4: (R,L) De igual manera que para el candidato anterior, la revisión de las creencias del receptor dada la estrategia del emisor señala que p = 0 y que q = 1. Aśı, la mejor respuesta del receptor es (u, u) y ambos tipos reciben un pago de 2. Si t1 se desviase jugando L, entonces el receptor respondeŕıa con u y el pago del emisor t1 seŕıa 1. Luego no hay incentivos, para un tipo t1, para desviarse de jugar R. Asimismo, si un tipo t2 se desviara y jugara R, el receptor respondeŕıa con u y el tipo t2 obtendŕıa un pago de 1, por lo que tampoco tiene incentivos a desviarse. De esta manera:{ (R,L) , (u, u) , p = 0 , q = 1 } configura un equilibrio bayesiano perfecto separador. 40 Juegos Estáticos de Información Completa Equilibrio Estrategias Dominadas Equilibrio de Nash Estrategias Mixtas Juegos Dinámicos de Información Completa Representación en Forma Extensiva de un Juego Equilibrio de Nash Perfecto en Subjuegos Juegos Repetidos Juegos Estáticos de Información Incompleta Información Privada o Asimétrica Juegos Estáticos Bayesianos Transformación de HarsanyiDesarrollada por John Harsanyi, quien fue premio Nobel de Economía en 1994. Ejemplo 1 Ejemplo 2 Juegos Dinámicos de Información Incompleta Siguiendo al Líder Equilibrio de Nash Bayesiano Perfecto Requisitos para el Equilibrio Perfecto Bayesiano Juegos de Señalización