Logo Studenta

organizaciones parte 2-2

¡Estudia con miles de materiales!

Vista previa del material en texto

Estrategia para resolver juegos extendidos: 
– Comience con las decisiones que llevan a los nodos terminales más alejados del inicio del juego 
– Determine la acción que maximiza la utilidad del jugador que mueve en ese nodo 
– Retroceda para hacer lo mismo con el precedente, teniendo en cuenta la previsión sobre qué sucederá 
en las jugadas subsiguientes 
– Retroceda hasta el inicio del juego repitiendo el procedimiento nodo por nodo 
En juegos con múltiples equilibrios y preferencias fuertes, la inducción retrospectiva permite elegir un 
equilibrio como predicción, descartando a los otros: 
 En el caso del dilema del prisionero, sigue habiendo una estrategia dominante, y se sigue llegando a un 
equilibrio subóptimo. Por ende, no varía el resultado si se lo grafica de forma extensiva o estratégica. 
 En el caso de la caza del ciervo, no hay estrategia dominante, sino que hay dos equilibrios. Pero, gracias 
a la inducción retrospectiva, se llega a un solo resultado, ya que uno de esos 2 equilibrios es Pareto 
superior. 
 En el caso del juego del gallina, no hay estrategia dominante. Hay dos equilibrios, pero se llega a uno por 
inducción retrospectiva. A cuál lleguemos depende de quien juegue primero, es decir, depende de la 
secuencia del juego. El equilibrio al cual llegamos siempre va favorecer a quien juegue primero. Por ende, 
cada jugador prefiere un equilibrio distinto. 
Morrow describe que algunos resultados constituyen loterías cuyo valor debe expresarse como utilidades 
esperadas. Por ejemplo, la guerra es una lotería entre una guerra que se gana con una probabilidad p y una 
guerra con probabilidad 1-p, con un valor si se gana la guerra y un valor si se pierde. En el caso de la guerra, 
es razonable suponer que la utilidad de una guerra ganada es mayor que la de una guerra perdida. 
Entonces, para modelar riesgo sobre los resultados, se necesita el Azar o la Naturaleza. En los juegos hay 
jugadores reales/concretos, pero cuando modelamos riesgo tenemos que inventar un actor que es el azar o 
la naturaleza, y es el que decide estas decisiones de riesgo. Para la modelación se asume que un jugador 
ficticio, azar o naturaleza, decide el resultado con alguna probabilidad. 
Muchas veces también hay riesgo sobre los pagos del otro; puede ser problemático asumir información 
completa. No se sabe si el otro es halcón o paloma. Se necesita otro concepto que tiene que ver con los 
"tipos". Se expresa el riesgo sobre los pagos del otro en los tipos que pueden caracterizar al otro jugador y 
que se determinan por parte de la Naturaleza con una probabilidad. El otro jugador puede ser de tipo A o de 
tipo B. 
 
Morrow describe que los pagos pueden ser utilidades esperadas, ya que por ejemplo la guerra es el resultado 
de una lotería donde no se sabe quien ganara si estalla la guerra. Por ende, los pagos de cada jugador de ir 
a la guerra es la utilidad esperada sobre esa lotería. La lotería se puede incluir en el juego como una jugada 
de la Naturaleza o el Azar. Las probabilidades de cada jugada de la Naturaleza son conocidas para los 
jugadores al comienzo del juego. De esta forma, la jugada de la Naturaleza nos permite incluir elementos 
aleatorios en el juego. 
Solo resolvemos juegos con información completa. 
Los jugadores tienen memoria, no se puede volver a un punto anterior del árbol. Los jugadores recuerdan 
las estrategias que jugaron. 
 
 
Aplicaciones: La Guerra de Malvinas como juego extendido con información incompleta 
Se le puede hacer una crítica estructural al modelo anterior de Malvinas ya que hay problemas en la 
especificación del juego. Al plantearlo como juego normal, se consideraban que las jugadas eran 
simultaneas. Pero Malvinas es un juego secuencial, donde hay riesgo sobre los resultados y sobre los pagos 
del otro. 
En primer lugar hay que determinar la estructura del juego. Argentina juega primero y se plantea una 
disyuntiva: ocupar o no ocupar las islas. Si Argentina ocupa, Gran Bretaña puede atacar o no atacar. Si Gran 
Bretaña no ataca, hay capitulación británica. Si Gran Bretaña ataca, Argentina puede decidir si ceder o 
resistir. Si Argentina cede, tenemos capitulación argentina. Si Argentina resiste, el resultado es la guerra. 
Con inducción retrospectiva, el resultado es la guerra. Se llega a un equilibrio O,R: A. 
 
La guerra es una lotería entre una guerra ganada y una guerra perdida. La lotería se simula como una jugada 
de la naturaleza o el azar. Hay que distinguir las utilidades de si se gana o se pierde la guerra porque tiene 
un impacto ordinal. Se tiene que utilizar utilidades esperadas. 
 
Si Argentina resiste, entra la naturaleza, y esta decide que Argentina gana con una probabilidad p, y pierde 
con una probabilidad 1-p. De esta forma convertimos algo que es un resultado en una lotería. Es una ficción 
al servicio de modelar aquellos resultados que implican riesgo. Se puede convertir la lotería en un resultado 
"guerra" con utilidades esperadas. Tenemos que calcular la utilidad esperada de la guerra para Argentina y 
para Gran Bretaña. 
▪ Utilidad esperada de Argentina: Ug(p) + Up(1-p) 
▪ Utilidad esperada de Gran Bretaña: Up(p) + Ug(1-p) 
De esta forma convierto la lotería en un resultado. Si no hago esto no puedo resolver el juego. Entonces 
debo sustituir la lotería por la utilidad esperada 
 
Si asumimos que p = 0,1: 
▪ UE Argentina de guerra: 3(0,1) + -1(0,9)= 0,6 
▪ UE Gran Bretaña de guerra: (-1)(0,1) + 2(0,9)= 1,7 
Con inducción retrospectiva, Argentina elije capitulación, Gran Bretaña elije atacar, y Argentina decide no 
ocupar. El resultado entonces es Statu Quo, y el equilibrio es N,C: A. 
 
Si no sabemos el valor de p, tenemos que averiguar cuál es el valor que hace que sea indiferente entre ocupar 
o no ocupar. Es decir, cual es el valor de p para que p sea igual a 2. De este modo, aún sin conocer p, es 
posible derivar el valor que hace que Argentina sea indiferente entre ceder y resistir. 
 .UE de Argentina de resistir: Ua (C ) 
 3p + (-1)(1-p)=1 
 3p + (-1)+p= 1 
 (3+1)p= 2 
 p=2/4 
 p=0,5 
 →Cuando p es mayor a 0,5, la utilidad de resistir es siempre mayor que la de ceder 
 →Cuando p es menor que 0,5, la utilidad de ceder es siempre mayor que la de resistir 
 
En cuanto a las preferencias de Gran Bretaña, es plausible asumir que su primera preferencia era mantener 
el statu quo. Es también plausible que la capitulación argentina fuese su segunda opción. Menos clara, ex 
ante, es la preferencia sobre los dos resultados restantes, lo que da dos órdenes de preferencia alternativos 
para Gran Bretaña 
– Halcón: SQ>CA>G>CB 
– Paloma: SQ>CA>CB>G 
 
En cuanto a las preferencias de Argentina, es plausible asumir que su primera preferencia era la capitulación 
británica. Es también plausible que el statu quo fuese preferible a la capitulación argentina. Menos clara es 
la preferencia del resultado guerra respecto de SQ y CA, lo que da tres órdenes de preferencia alternativos 
para Argentina 
– Paloma: CB>SQ>CA>G 
– “Intermedio”: CB>SQ>G>CA 
– Halcón: CB>G>SQ>CA 
 
Esto permite analizar seis juegos que pueden construirse combinando esos órdenes de preferencias. Para 
ello se asumirá en todos los casos que la lotería de la guerra ya está resuelta. Eso implica que los pagos 
asociados a ese resultado expresarán la utilidad esperada de cada jugador. 
 
 
Con Argentina paloma y Gran Bretaña paloma, el resultado es el statu quo. Si juegan Argentina paloma y 
Gran Bretaña halcón, el resultado es statu quo. Entonces, si Argentina es una paloma, no importa el orden 
de preferencia de Gran Bretaña, el resultado es siempre statu quo. La información incompleta no afecta la 
decisión argentina ni el resultado esperado, es decir, no afecta el resultado saber o no cuál es el orden de 
preferencia de Gran Bretaña ya que Argentina tiene una estrategia dominante de No ocupar. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Con Argentina halcón (prefiere guerra antes que statu quo) y Gran Bretaña paloma, el resultado es lacapitulación británica. Con Argentina halcón y Gran Bretaña halcón, el resultado es la guerra. En este caso 
(con Argentina halcón), Argentina tiene estrategia dominante ocupar. Entonces, la información incompleta 
no afecta la decisión porque tiene estrategia dominante. Los problemas de información afectan la 
expectativa acerca del resultado. Si estoy jugando contra un halcón pero creo que es una paloma, espero 
que el otro ceda, pero de todas formas terminas en la guerra. Hubiese sido mejor que el otro ceda, pero de 
todas formas es mejor ir a la guerra antes que la capitulación o el statu quo. 
 
 
 
 
Con Argentina como halcón suave, y Gran Bretaña como paloma, el resultado es capitulación británica. Con 
argentina como halcón suave y Gran Bretaña halcón, el resultado es el statu quo. En este caso, no hay 
estrategia dominante. Argentina tiene una estrategia condicional. Uso la fuerza contra el que no la va a usar, 
y no la uso contra el que si la va a usar. 
 
 
 
Hay otra manera de llegar a la guerra que es por error de información. La información incompleta puede 
llevar a resultados subóptimos para Argentina. Entonces en este caso los errores de información si son 
peligrosos porque me pueden llevar a la guerra cuando me conviene el statu quo. Se puede llegar a la guerra 
por una Gran Bretaña halcón, Argentina halcón suave, y problemas de información. 
 
Los juegos con información incompleta se modelan como si fuesen juegos de información imperfecta. Ello 
requiere introducir a un jugador ficticio: Naturaleza o Azar. También implica identificar los “tipos” que 
pueden caracterizar al otro jugador y que se determinan probabilísticamente, y unir con un “conjunto de 
información” los nodos decisionales del jugador con información incompleta. 
Entonces, la naturaleza decide si Gran Bretaña es un halcón o una paloma. Antes de que juegue Argentina 
juega la naturaleza y decide si Gran Bretaña es un halcón con una probabilidad p o una paloma con una 
probabilidad 1-p. En el pasado la naturaleza jugó, pero necesito simular que es un juego con información 
incompleta en el que hay un jugador Argentina que no sabe que jugó antes la naturaleza. Por eso debo unir 
ambos nodos. Simulo que la naturaleza juega y que Argentina tiene información imperfecta sobre la historia 
del juego. Hay que unir los nodos decisionales de aquel actor que tiene problemas decisionales (no es 
siempre el que está arriba). 
 
 
 
Argentina va a Ocupar si la utilidad esperada de ocupar es mayor a la utilidad esperada de no ocupar. La 
utilidad de No ocupar es 3 en ambos juegos. La utilidad de Ocupar es 4 en el juego de la izquierda y 2 en el 
de la derecha. 
Ocupar es una lotería en que las utilidades se ponderan por la probabilidad de que Gran Bretaña sea halcón 
o paloma. Supongamos que la probabilidad de GB sea halcón es de 49% (p= 0.49). Hago el cálculo de ambas 
utilidades esperadas y las comparo. La decisión optima finalmente es ocupar, ya que la utilidad esperada de 
ocupar para Argentina es 3,03, mientras que la utilidad esperada de no ocupar es 3. 
Si Argentina cree que Gran Bretaña es una paloma, va a ocupar aun cuando sepa que no puede ganar una 
eventual guerra. La Junta Militar tenía evidencia de que Gran Bretaña podría no atacar, lo que daba 
plausibilidad a la creencia de que fuese una Paloma. Sin embargo, Gran Bretaña resultó ser una Halcón, y 
cuando Argentina ocupó las Malvinas, atacó. Entonces, en este caso la información incompleta condujo a 
una guerra que podría no haber ocurrido de haber habido información completa.

Continuar navegando