Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
TEORÍA MICROECONÓMICA I AYUDANTÍA REPASO DE TEORÍA DE JUEGOS Y APLICACIONES A JUEGOS DINÁMICOS 2do Semestre 2003 Prof : Juan Pablo Montero Ayud: Paula Benavides Manuel Hermosilla I.- Juegos Estáticos con Información Completa: Este es un repaso de conceptos básicos en Teoría de Juegos. Ha sido extraído de los capítulos 1 y 2 del texto "Un primer curso de teoría de juegos" de R. Gibbons, y complementado con algunas aplicaciones de MCW y FT. 1.1.- Teoría Básica: Juegos en forma normal y equilibrio de Nash. Esta sección considera juegos simples, en que los jugadores forman sus decisiones simultáneamente, posteriormente reciben sus ganancias que dependen de la combinación de acciones que acaban de elegir. Nos referimos a los juegos estáticos y en particular por ahora con información completa, es decir la función de ganancias de cada jugador es conocida por todos los jugadores. Este tipo de juegos se puede describir a través de una representación en forma normal. Esto significa que cada jugador elige de forma simultánea una estrategia y la combinación de las estrategias elegidas por los jugadores determina las ganancias de cada uno. Ejemplo 1: Dilema del prisionero. Dos sospechosos son arrestados y acusados de un delito. La policía no tiene evidencia para condenar a menos que uno confiese. Si ninguno confiesa, ambos son condenados por un delito menor, a un mes de cárcel. Si ambos confiesan son sentenciados a seis meses de cárcel. Finalmente si uno confiesa y el otro no, el que confiesa es puesto en libertad y el otro es sentenciado a nueve meses de prisión. Este problema puede representarse mediante la siguiente matriz: Preso 2 Callarse Confesar Callarse -1,-1 -9,0 Preso 1 Confesar 0,-9 -6,-6 Podemos ver que se encuentra toda la información requerida en la forma normal: (i) Los jugadores del juego. (ii) Las estrategias de que dispone cada jugador. (iii) La ganancia que cada jugador obtiene en cada combinación posible de estrategias. Hasta ahora hemos señalado que la representación normal permite representar juegos estáticos (en que los jugadores actúan sin conocer las decisiones de los demás jugadores), más adelante se verá que también puede darse en el contexto de juegos dinámicos, aunque en dichos casos la representación en forma extensiva suele ser más conveniente. Ya sabemos como representar un juego simple, pero falta ver como lo resolvemos. Una primera forma es pensar que un jugador racional no utilizará una estrategia estrictamente dominada, es decir que para cada combinación posible de estrategias de los restantes jugadores la ganancia para el jugador de utilizar una estrategia sea estrictamente menor que la de utilizar otra. En el dilema del prisionero la estrategia de callarse es estrictamente dominada para ambos jugadores. Podemos repetir este proceso repetidas veces (eliminación iterativa de estrategias estrictamente dominadas) pero para ello necesitamos suponer que los jugadores son racionales y que existe conocimiento común de la racionalidad (Aumann 1976). Otra desventaja de este método es que frecuentemente nos lleva a una predicción imprecisa sobre el juego. Puede que no existan estrategias estrictamente dominadas para eliminar. Un concepto mucho más preciso es el de Equilibrio de Nash. Este concepto está basado en el hecho que si la teoría predice un perfil de estrategias de equilibrio, la estrategia predicha para cada jugador debe ser su mejor respuesta a las estrategias predichas par los otros jugadores. Esta predicción sería self-enforcing, puesto que ningún jugador querría desviarse de la estrategia predicha para él. Definición: En el juego en forma normal de n jugadores, G = {S1, .....Sn; u1,.....un}, las estrategias s1*,.....,Sn*, forman un equilibrio de Nash si para cada jugador i, si* es la mejor respuesta del jugador i (o al menos una de ellas) a las estrategias de los otros n-1 jugadores, (s1*,....si-1*, si+1*,....,sn*): ui(s1*,....si-1*,si*, si+1*,....,sn*)≥ui(s1*,....si-1*,si,si+1*,....,sn*), para cada posible estrategia si en Si. Veamos como hacerlo en la práctica: Podemos ver si cada combinación posible de estrategias satisface la condición del EN, es decir si la estrategia de cada jugador es la mejor respuesta a la del otro. Metodológicamente, para cada jugador y cada posible estrategia, marcamos la mejor respuesta del otro jugador a esa estrategia. Los pares de estrategias, en el caso de dos jugadores, que satisfagan esta condición son los equilibrios de Nash en estrategias puras del juego. Ejemplo 2: J2 I C D A 0,4 4,0 5,3 M 4,0 0,4 5,3 J1 B 3,5 3,5 6,6 En el ejemplo, el par de estrategias (B,D), constituye el único equilibrio de Nash en estrategias puras del juego, con pagos (6,6). Ahora veremos la relación entre la eliminación iterativa de estrategias estrictamente dominadas (EIEED) y el concepto de equilibrio de Nash. Resultado 1: si la eliminación iterativa de estrategias estrictamente dominadas elimina todas las estrategias menos las estrategias (s1*,....,sn*), entonces estas estrategias constituyen el único equilibrio de Nash del juego. Sin embargo, el concepto de equilibrio de Nash es más poderoso ya que a menudo la EIEED elimina sólo unas pocas estrategias. Resultado 2: Si las estrategias (s1*,....,sn*) forman un equilibrio de Nash, entonces sobreviven a la eliminación iterativa de las estrategias estrictamente dominadas. Esto no señala que pueden existir estrategias que sobrevivan a la EIEED pero que no formen parte de ningún equilibrio de Nash. Constatar esto en nuestro ejemplo anterior. Por último, hasta ahora hemos señalado que si la teoría de juegos ofrece una única solución a un juego, esta debe ser un equilibrio de Nash. Pero debemos considerar que existirán juegos en los cuales no se pueda alcanzar acuerdo (no existe EN) o en los cuales existan múltiples equilibrios de Nash. Otros conceptos de equilibrio que se verán más adelante podrán refinar esta predicción, pero aún así existirán juegos en los cuales la teoría de los juegos no ofrece una solución única. Ejemplo 3: La batalla de los sexos. J2 Ópera Boxeo Ópera 2,1 0,0 J1 Boxeo 0,0 1,2 (Ópera,Ópera) y (Boxeo, Boxeo) son Equilibrios de Nash. Recomendación: ver en Gibbons aplicaciones al modelo de duopolio de cournot y el modelo de duopolio de Bertrand. Se verán en siguiente ayudantía. 1.2.- Teoría Avanzada: Estrategias mixtas y existencia de equilibrio. Veamos el siguiente ejemplo conocido en la literatura como Matching Pennies. Ejemplo 4: Matching Pennies: El juego de las Monedas. J2 Cara Cruz Cara -1,1 1,-1 J1 Cruz 1,-1 -1,1 Si ambas monedas coinciden, el jugador 2 gana la moneda del jugador 1 y si no coinciden el jugador 1 gana la moneda del jugador 2. En este juego no existe ningún par de estrategias que cumplan las condiciones del EN, siempre hay incentivos a desviarse. Este juego se caracteriza por que a cada jugador le conviene adivinar la jugada del otro y que el otro no adivine la suya. En este caso no existe equilibrio ya que existe incertidumbre sobre lo que harán los otros jugadores. Introduciremos el concepto de estrategias mixtas que se interpreta en términos de la incertidumbre de un jugador respecto a lo que otro jugador hará. Una Estrategia Mixta es una distribución de probabilidad sobre alguna o todas las estrategias en Si (llamadas estrategias puras). Si existen tres posibles estrategias para un jugador, una estrategia mixta es una distribución de probabilidad (q,r,1-q-r) sobre las estrategias del jugador. (¿cómo se representa una estrategia pura, en términos de estrategia mixta?. Existencia del Equilibrio de Nash: Lo primero es ampliar la definición de equilibrio de Nash para incluir las estrategias mixtas. Recordemos que la definición de equilibrio de Nash presentada anteriormente requería que la estrategia pura de cada jugador constituyera una mejorrespuesta a las estrategias puras de los restantes jugadores. Ahora necesitamos que la estrategia mixta de cada jugador sea una mejor respuesta a las estrategias mixtas de los otros jugadores. Puesto que cada estrategia pura puede ser expresada como una estrategia mixta, esta nueva definición ampliada incluye a la anterior. Definición: En el juego en forma normal G={S1,S2;u1,u2}, las estrategias mixtas (p1*,p2*)forman un equilibrio de Nash si la estrategia mixta de cada jugador es una mejor respuesta a la estrategia mixta del jugador. Debe cumplirse que: v1(p1*,p2*)≥ v1(p1,p2*) v2(p1*,p2*)≥ v2(p1*,p2) Es decir la ganancia esperada para cada jugador utilizando la estrategia mixta de equilibrio debe ser superior a la que obtendría utilizando una estrategia mixta distinta. Veamos en un ejemplo como encontrar el EN en estrategias mixtas. Ejemplo 5: Equilibrio de Nash con estrategias mixtas en el juego Matching Pennies. J2 Cara Cruz Cara -1,1 1,-1 r J1 Cruz 1,-1 -1,1 (1-r) q (1-q) Llamamos a r*(q) y q*(r) las correspondencias de mejor respuesta. La intersección de las correspondencias de mejor respuesta nos da el equilibrio de Nash. En este juego la estrategia mixta (1/2, 1/2), (1/2,1/2) es un equilibrio de Nash en estrategias mixtas y no existe como ya vimos equilibrio de Nash en estrategias puras. Recomendación: Hacer el mismo ejercicio para el juego de la batalla de los sexos y constatar la existencia de equilibrio en estrategias puras bajo este procedimiento. v1(cara)=-1*q+1*(1-q) = 1-2q v1(cruz)=1*q-1*(1-q) = -1+2q Igualamos: 1-2q=-1+2q q=1/2 v2(cara)=1*r-1*(1-r) = -1+2r v2(cruz)=-1*r+1*(1-r) = 1-2r Igualamos: -1+2r = 1-2r r=1/2 Ahora graficamos. r*(q) r 1/2 q q*(r) 1 1 Teorema Nash 1950: En el juego en forma normal de n jugadores G= {S1, .....Sn; u1,.....un}, si n es un número finito y Si es finito para cada i, existe al menos un equilibrio de Nash, que posiblemente incluye estrategias mixtas. (Se demuestra mediante el teorema de punto fijo de Kakutani) II.- Juegos Dinámicos con Información Completa: Ahora veremos los juegos dinámicos, aún bajo el contexto de información completa, es decir las funciones de ganancia de los jugadores son de dominio público. Además se analizan los juegos dinámicos con información perfecta que significa que en cada momento del juego, el jugador a quien le corresponde decidir conoce la historia completa de todas las decisiones tomadas hasta ese momento. El tema central en este tipo de juegos es la credibilidad. 2.1.- Juegos dinámicos con información completa y perfecta. Las características claves de un juego dinámico con información completa y perfecta son que las decisiones se toman de manera sucesiva, todas las decisiones anteriores son conocidas antes de tomar la decisión siguiente y las ganancias de los jugadores para cada combinación posible de jugadas son información de dominio público. Esta descripción corresponde a la forma extensiva del juego. Una forma de resolver este tipo de juegos es por inducción hacia atrás. Cuando el jugador 2 debe decidir toma la acción del jugador 1 como dada, por lo que se enfrenta al siguiente problema: max u2(a1,a2) a2∈A2 Suponiendo que este problema de optimización tiene una única solución, la podemos denotar a través de una función de reacción: R2(a1). El jugador 1 resuelve el siguiente problema: max u1(a1,R2(a1)) a1∈A1 Supongamos que este problema también tiene una solución única. Llamamos a a(a1*,R2(a1*))el resultado por inducción hacia atrás de este juego. Este resultado ignora las amenazas no creíbles, sólo considera respuestas óptimas. En este tipo de juegos pueden existir múltiples equilibrios de Nash pero el único equilibrio de Nash perfecto en subjuegos será aquel asociado con el resultado obtenido por inducción hacia atrás. Recordar que el argumento de inducción hacia atrás implica supuestos de racionalidad que de no cumplirse pueden invalidar la predicción del juego. Ejemplo 6: Inducción hacia atrás. Por inducción hacia atrás el jugador 1 juega I y el juego termina ahí. Ejemplo 7: El modelo de duopolio de Stackelberg. Este es un modelo dinámico de duopolio en el cual la empresa dominante (o líder) decide primero y una empresa seguidora decide en segundo lugar. Las empresas escogen cantidades como en el caso del modelo de Cournot. (Recordar que en el modelo de Bertrand escogen precios). El juego: (i) La empresa 1 escoge una cantidad q1 ≥0; (ii)la empresa 2 observa q1 y escoge entonces una cantidad q2 ≥0; (iii)las ganancias de la empresa i vienen dadas por la función de beneficio: πi(qi,qj) = qi(P(Q) - c) Donde P(Q)=a-Q es el precio de equilibrio de mercado función de la cantidad agregada y c es el costo marginal constante de producción, siendo cero los costos fijos. Buscamos el resultado por inducción hacia atrás de este juego. Lo primero es buscar R2(q1)que es una solución de: Max π2(q1,q2) = Max q2(a- q1 - q2 - c) q2≥0 Lo que resulta en: R2(q1)= (a - q1 - c)/2 Siempre que a - c > q1 El problema de la empresa 1 es: Max π1(q1,R2(q1)) = Max q1(a- q1 - R2(q1) - c)= = Max q1(a- q1 - c)/2 q1≥0 q1≥0 q1≥0 El resultado por inducción hacia atrás del juego de duopolio de Stackelberg por lo tanto es: q1*=(a-c)/2 R2 (q1*)=(a-c)/4 Recomendación: Comparar con el resultado del juego de Cournot y notar que en este caso la empresa 2 se encuentra peor, a pesar de tener más información ya que conoce q1, pero a la vez la empresa 1 sabe que la 2 conoce q1. 1,1 1 2 1 2,0 3,0 0,2 I D I´ D´ I D 2.2.- Juegos en dos etapas con información completa pero imperfecta. En esta sección permitiremos que hayan decisiones simultáneas en cada etapa, lo que implica que la información es imperfecta. Perfección en Subjuegos: Analicemos el siguiente juego: (i)Los jugadores 1 y 2 escogen simultáneamente las acciones a1 y a2 de los conjuntos factibles A1 y A2 respectivamente. (ii)Los jugadores 3 y 4 observan el resultado de la primera etapa (a1 , a2) y escogen simultáneamente las acciones a3 y a4 de los conjuntos factibles A3 y A4 respectivamente. (iii)Las ganancias son u(a1,a2,a3,a4) para 1=1,2,3,4. Cómo resolver: muy parecido a la inducción hacia atrás pero ahora al final del juego resolvemos un juego simultáneo, no el problema de optimización de un jugador. Los jugadores 1 y 2 prevén que el comportamiento en la segunda etapa de los jugadores 3 y 4 será: (a3*(a1,a2),a4*(a1,a2)). En base a esto los jugadores 1 y 2 escogen simultáneamente a1 y a2. Supongamos que a1*, a2* es el único equilibrio de Nash de este juego de decisiones simultáneas. Llamamos a (a1*, a2*,a3*(a1*, a2*), a4*(a1*, a2*))el resultado perfecto en subjuegos de este juego en dos etapas. 2.3.- Juegos Repetidos. 2.3.1.- Juegos repetidos en dos etapas. Ejemplo 8: Juego repetido del dilema del prisionero en dos etapas. J2 I2 D2 I1 1,1 5,0 J1 D1 0,5 4,4 J2 I2 D2 I1 2,2 6,1 J1 D1 1,6 5,5 En este caso se cumple que en la segunda etapa existe un único equilibrio de Nash y en este ejemplo el resultado de la segunda etapa es independiente del resultado de la primera. El único resultado de equilibrio de la segunda etapa es (I1, I2). Ahora analizamos la primera etapa teniendo en cuenta que en la segunda etapa el EN será (I1, I2), y también encontramos que existe un único EN (I1, I2). Por lo tanto el único resultado perfecto en subjuegos de este juego es (I1, I2) en la primera etapa seguido de (I1, I2) en la segunda etapa. A partir de un juego estático con información completa en que los jugadores escogen de manera simultanea denotamos al juego G, como el juego de etapa del juego repetido. Definición: Dado un juego de etapa G, G(T) denota el juego repetido finitamente en el que G se juega T veces, habiendolos jugadores observado los resultados de todas las jugadas anteriores antes de que empiece la siguiente. Las ganancias de G(T) son simplemente la suma de las ganancias de los T juegos de etapa. Además si el juego de etapa G tiene un único EN, entonces, para cualquier T finito, el juego repetido G(T) tiene un único resultado perfecto en subjuegos: en cada etapa se juega el equilibrio de Nash de G. Veamos ahora que el resultado es diferente cuando el juego de etapa G tiene múltiples equilibrios de Nash. Pensemos en base al siguiente juego de etapa que se juega dos veces. Vamos a demostrar que existe un único resultado perfecto en subjuegos de este juego en que el par de estrategias (C1,C2) se juega en la primera etapa. J2 I2 C2 D2 I1 1,1 5,0 0,0 C1 0,5 4,4 0,0 J1 D1 0,0 0,0 3,3 Supongamos que en la primera etapa los jugadores prevén que (D1,D2)será el resultado de la segunda etapa si el de la primera etapa es (C1,C2),pero que (I1, I2) será el resultado de la segunda etapa si el de la primera etapa es cualquiera de los restantes. La interacción de los jugadores en la primera etapa se concreta entonces en el siguiente juego de una etapa: J2 I2 C2 D2 I1 2,2 6,1 1,1 C1 1,6 7,7 1,1 J1 D1 1,1 1,1 4,4 Existen tres equilibrios de Nash en este juego, que implican a su vez resultados perfectos en subjuegos del juego repetido. El EN (I1,I2) corresponde al resultado perfecto en subjuegos((I1,I2),(I1,I2))del juego repetido. Lo mismo ocurre con el EN (D1,D2). Pero el tercer EN (C1,C2)es mejor, y corresponde al resultado perfecto en subjuegos (C1,C2) ((D1,D2))del juego repetido. Lo importante: se puede alcanzar la cooperación en la primera etapa de un resultado perfecto en subjuegos del juego repetido. Es decir las amenazas o las promesas creíbles sobre el comportamiento futuro pueden influir en el comportamiento presente. Resultado: Si G=A1, ......,An;u1, ....un es un juego estático con información completa que tiene múltiples equilibrios, pueden existir resultados perfectos en subjuego del juego repetido G(T) en los que, para cualquier t<T, el resultado de la etapa t no es un equilibrio de Nash de G. Es importante notar que puede que el concepto de perfección en subjuegos no utilice una definición de credibilidad lo suficientemente fuerte. Asumimos lo que los jugadores preveían para la segunda etapa sin analizar si esto era o no creíble o podía dar origen a una renegociación. Puede ocurrir que los castigos o recompensas no sean creíbles ex-post lo que no está considerado aquí. Es decir puede ocurrir que se requiera de una penalización, pero exista otro equilibrio del juego de etapa preferido por el jugador que castiga, lo que llevaría a la posibilidad de persuadir al jugador que castiga de que renegocie la penalización. Ejemplo 9: Equilibrio perfecto en subjuego con equilibrios múltiples. t=1 J2 I´ D´ A´ 5,6 0,7 J1 B´ 0,0 1,1 t=2 J2 I D A 10,10 0,0 J1 B 0,0 3,3 En este ejemplo podemos alcanzar cooperación y lograr el resultado perfecto en subjuegos ((A,I),(A´,I´)), utilizando las siguientes estrategias: Jugar A´en t=1 S1 = Jugar A en t=2 si (A´,I´) Jugar B en t=2 si otra cosa Jugar I´en t=1 S2 = Jugar I en t=2 si (A´,I´) Jugar D en t=2 si otra cosa 2.3.2.- Aplicaciones a juegos dinámicos. Algunas críticas a la inducción hacia atrás: Si bien este concepto parece adecuado en juegos simples de dos etapas con información perfecta, las cosas son más complicadas cuando existen muchos jugadores o períodos. En primer lugar largas cadenas de inducción hacia atrás presumen largas cadenas de la hipótesis de conocimiento común "el jugador 1 sabe que el jugador sabe, que el jugador 3 sabe que........los pagos". En estos casos si se asumen pequeñas probabilidades que algún jugador juegue incorrectamente esto puede modificar el equilibrio. Es decir el argumento de inducción hacia atrás cuando existen largas cadenas de inducción es más sensible a pequeños cambios en la estructura de información del juego. Otra complicación ocurre cuando el mismo jugador debe jugar varias veces en la sucesión. Esto se presenta en el ejemplo que sigue a continuación. Ejemplo 10: El ciempiés. Por inducción hacia atrás encontramos un único equilibrio perfecto en subjuegos y es que el jugador juega D1 y el juego se acaba. Sin embargo si el jugador 2 se formara alguna creencia respecto de movidas distintas a las de equilibrio (A1 en el caso del jugador 1)podría ocurrir para una determinada probabilidad que se alcance un equilibrio distinto. Lo que predice en este caso la inducción hacia atrás no es lo que ocurre normalmente en los experimentos. En la teoría más avanzada existen otro tipo conceptos de equilibrio alternativos que abordan este tipo de aspectos. Esto quedará para más adelante. Por ejemplo una definición de Fudenberg y Kreps (1988)extiende este principio pero exige que se asigne probabilidad positiva a cualquier secuencia de juego. Algunas críticas a la perfección en subjuegos: Como la perfección en subjuegos es una extensión de la inducción hacia atrás es vulnerable a las críticas que ya discutimos. Pero más aún la perfección en subjuegos exige que los jugadores estén de acuerdo en un juego incluso si ese juego no es predicho a través de argumentos de inducción hacia atrás. El punto es que la perfección en subjuegos supone que todos los jugadores esperan el mismo equilibrio en cada subjuego. La plausibilidad de este supuesto dependerá de las razones por las cuales se crea que un equilibrio se alcanzará en primer lugar. (iv) Introducción a los juegos repetidos infinitamente. El paso que sigue es extender la repetición infinitamente. De nuevo el tema será que las amenazas o las promesas creíbles sobre el comportamiento futuro pueden influir en el comportamiento presente. Pero en el caso de repetición infinita encontraremos un resultado aún más poderoso. Incluso si en el juego de etapa existe un único equilibrio de Nash, pueden existir muchos resultados perfectos en subjuegos, en los que ninguno de los resultados en cada etapa sea un equilibrio de Nash de G. 2 1 2 11 (1,0) (0,1) (3,0) (2,4) (6,3) (5,5) A1 A2 A3 A4 A5 D1 D2 D3 D4 D5
Compartir