Estrategias avanzadas de teoría de juegos para la toma de decisiones

Teoría de juegos de suma cero con estrategias mixtas con hojas de cálculo. Caso práctico. (Noviembre 2024)

Teoría de juegos de suma cero con estrategias mixtas con hojas de cálculo. Caso práctico. (Noviembre 2024)
Estrategias avanzadas de teoría de juegos para la toma de decisiones

Tabla de contenido:

Anonim

La teoría de juegos, el estudio de la toma de decisiones estratégicas, reúne disciplinas dispares como las matemáticas, la psicología y la filosofía. La teoría de juegos fue inventada por John von Neumann y Oskar Morgenstern en 1944 y ha recorrido un largo camino desde entonces. La importancia de la teoría de juegos para el análisis moderno y la toma de decisiones puede medirse por el hecho de que desde 1970, hasta 12 destacados economistas y científicos han sido galardonados con el Premio Nobel de Ciencias Económicas por sus contribuciones a la teoría de juegos.

La teoría de juegos se aplica en una serie de campos que incluyen negocios, finanzas, economía, ciencias políticas y psicología. Comprender las estrategias de la teoría de juegos, tanto las populares como algunas relativamente menos conocidas, es importante para mejorar las habilidades de razonamiento y toma de decisiones en un mundo complejo.

El dilema del prisionero: en pocas palabras

Una de las estrategias de teoría de juegos más populares y básicas es el dilema del prisionero. Este concepto explora la estrategia de toma de decisiones tomada por dos individuos que, actuando en su propio interés individual, terminan con peores resultados que si hubieran cooperado entre sí en primer lugar.

En el Dilema del prisionero, dos sospechosos que han sido detenidos por un crimen se encuentran en habitaciones separadas y no pueden comunicarse entre sí. El fiscal les informa a cada uno individualmente que si él (llamándolo Sospechoso 1) confiesa y testifica contra el otro, puede irse, pero si no coopera y el Sospechoso 2 sí, el Sospechoso 1 será sentenciado a tres años de prisión. Si ambos confiesan, obtendrán una condena de dos años, y si ninguno confiesa, serán sentenciados a un año de prisión.

Si bien la cooperación es la mejor estrategia para los dos sospechosos, cuando se enfrentan a tal dilema, la investigación muestra que las personas más racionales prefieren confesar y testificar en contra de la otra persona en lugar de quedarse en silencio y aprovechar la oportunidad que la otra parte confiesa

Game Theory Strategies

The Prisoner's Dilemma sienta las bases para estrategias avanzadas de teoría de juegos entre las que se incluyen las populares:

Matching Pennies : este es un juego de suma cero que involucra a dos jugadores (llámalos Jugador A y Jugador B) colocando simultáneamente un centavo en la mesa, con el pago dependiendo de si los centavos coinciden. Si ambos centavos son cara o cruz, el jugador A gana y mantiene el centavo del jugador B. Si no coinciden, el jugador B gana y mantiene el centavo del jugador A.

Deadlock : Este es un escenario de dilema social como Prisoner's Dilemma en el que dos jugadores pueden cooperar o desertar (i.mi. no cooperar). En Deadlock, si el jugador A y el jugador B cooperan, cada uno obtiene una recompensa de 1, y si ambos fallan, cada uno obtiene un pago de 2. Pero si el jugador A coopera y el jugador B falla, entonces A obtiene una recompensa de 0 y B obtienen un pago de 3. En el diagrama de pago a continuación, el primer número en las celdas (a) hasta (d) representa el pago del jugador A, y el segundo número es el del jugador B:

Matriz de pago de punto muerto < Jugador B

Cooperar

Defecto

Jugador A

Cooperar

(a) 1, 1

(b) 0, 3

Defecto

(c) 3 , 0

(d) 2, 2

Deadlock difiere del dilema del prisionero en que la acción de mayor beneficio mutuo (es decir, ambos defectos) es también la estrategia dominante. Una estrategia dominante para un jugador se define como aquella que produce el mayor beneficio de cualquier estrategia disponible, independientemente de las estrategias empleadas por los otros jugadores.

Un ejemplo citado comúnmente de Punto muerto es el de dos potencias nucleares que intentan llegar a un acuerdo para eliminar sus arsenales de bombas nucleares. En este caso, la cooperación implica adherirse al acuerdo, mientras que la deserción significa renunciar en secreto al acuerdo y retener el arsenal nuclear. El mejor resultado para cualquiera de las naciones, desafortunadamente, es incumplir el acuerdo y conservar la opción nuclear mientras la otra nación elimina su arsenal, ya que esto le dará a la primera una gran ventaja oculta sobre la segunda si la guerra se desata entre los dos. La segunda mejor opción es que ambos deserten o no cooperen, ya que esto conserva su estado como potencias nucleares.

Competencia de Cournot

: Este modelo también es conceptualmente similar al Dilema del prisionero, y lleva el nombre del matemático francés Augustin Cournot, quien lo introdujo en 1838. La aplicación más común del modelo de Cournot es describir un duopolio o dos principales productores en un mercado. Por ejemplo, supongamos que dos compañías A y B producen un producto idéntico y pueden producir cantidades altas o bajas. Si ambos cooperan y acuerdan producir a niveles bajos, entonces el suministro limitado se traducirá en un alto precio para el producto en el mercado y beneficios sustanciales para ambas compañías. Por otro lado, si desertan y producen en niveles altos, el mercado se hundirá y dará como resultado un precio bajo para el producto y, en consecuencia, menores ganancias. Pero si uno coopera (es decir, produce en niveles bajos) y los otros defectos (es decir, subrepticiamente produce en niveles altos), entonces el primero simplemente se divide, mientras que el segundo obtiene un beneficio que es mayor que si ambos cooperan.

La matriz de pagos para las empresas A y B se muestra (las cifras representan ganancias en millones de dólares). Por lo tanto, si A coopera y produce en niveles bajos mientras B produce defectos y produce en niveles altos, el pago se muestra en la celda (b): punto de equilibrio para la empresa A y $ 7 millones en ganancias para la empresa B.

Cournot Payoff Matriz

Empresa B

Cooperar

Defecto

Empresa A

Cooperar

(a) 4, 4

(b) 0, 7

Defecto

(c ) 7, 0

(d) 2, 2

Coordinación

: en coordinación, los jugadores obtienen mayores ganancias cuando seleccionan el mismo curso de acción. Como ejemplo, considere dos gigantes tecnológicos que están decidiendo entre introducir una nueva tecnología radical en chips de memoria que podría generar cientos de millones en ganancias, o una versión revisada de una tecnología anterior que les otorgaría menos. Si solo una compañía decide seguir adelante con la nueva tecnología, la adopción del mercado por parte de los consumidores sería significativamente menor, y como resultado, ganaría menos que si ambas compañías deciden el mismo curso de acción. La matriz de pagos se muestra a continuación (las cifras representan ganancias en millones de dólares).

Por lo tanto, si ambas compañías deciden introducir la nueva tecnología, ganarían $ 600 millones cada una, mientras que la introducción de una versión revisada de la tecnología anterior les otorgaría $ 300 millones cada una, como se muestra en la celda (d). Pero si la Compañía A decide solo introducir la nueva tecnología, solo ganaría $ 150 millones, aunque la Compañía B ganaría $ 0 (presumiblemente porque los consumidores pueden no estar dispuestos a pagar por su tecnología ahora obsoleta). En este caso, tiene sentido que ambas compañías trabajen juntas y no por sí mismas.

Matriz de liquidación de coordinación

Compañía B

Nueva tecnología

Tecnología antigua

Compañía A

Nueva tecnología

(a) 600, 600

(b) 0, 150 < Tecnología anterior

(c) 150, 0

(d) 300, 300

Juego de ciempiés

: este es un juego extenso en el que dos jugadores alternativamente tienen la oportunidad de tomar el mayor parte de un dinero escondido cada vez más lento. El juego Centipede es secuencial, ya que los jugadores hacen sus movimientos uno tras otro en lugar de hacerlo simultáneamente; cada jugador también conoce las estrategias elegidas por los jugadores que jugaron antes que ellos. El juego concluye tan pronto como un jugador toma el escondite, con ese jugador obteniendo la porción más grande y el otro jugador obteniendo la porción más pequeña.

Como ejemplo, si el Jugador A y el Jugador B están jugando el juego Centipede, suponga que el Jugador A va primero y tiene que decidir si debe "Tomar" o "Pasar" el alijo, que actualmente equivale a $ 2. Si él toma, entonces A y B obtienen $ 1 cada uno, pero si A aprueba, la decisión de "Tomar o Pasar" ahora tiene que ser hecha por el Jugador B. Si B toma, ella recibe $ 3 (es decir, el alijo anterior de $ 2 + $ 1 ) y A obtiene $ 0. Pero si B pasa, A ahora llega a decidir si tomar o pasar, y así sucesivamente. Si ambos jugadores siempre eligen pasar, cada uno recibe un pago de $ 100 al final del juego. El objetivo del juego es que si A y B cooperan y "pasan" al final del juego, obtienen la recompensa máxima de $ 100 cada uno. Pero si desconfían del otro jugador y esperan que lo "tomen" en la primera oportunidad, entonces el equilibrio de Nash predice que los jugadores tomarán el reclamo más bajo posible ($ 1 en este caso). Los estudios experimentales han demostrado, sin embargo, que este comportamiento "racional" (como lo predice la teoría de juegos) raramente se exhibe en la vida real. Esto no es intuitivamente sorprendente dado el pequeño tamaño del pago inicial en relación con el final. Un comportamiento similar por parte de sujetos experimentales también ha sido exhibido en el Dilema del Viajero.

Dilema del viajero

: este es un juego de suma no nula en el que ambos jugadores intentan maximizar su propio pago sin tener en cuenta al otro. Ideado por el economista Kaushik Basu en 1994, en Traveler's Dilemma, una aerolínea acuerda pagar a dos viajeros una indemnización por daños y perjuicios a artículos idénticos. Sin embargo, los dos viajeros se requieren por separado para estimar el valor del artículo, con un mínimo de $ 2 y un máximo de $ 100. Si ambos anotan el mismo valor, la aerolínea reembolsará a cada uno de ellos esa cantidad. Pero si los valores son diferentes, la línea aérea les pagará el valor más bajo, con un bono de $ 2 para el viajero que anotó este valor más bajo y una penalización de $ 2 para el viajero que anotó el valor más alto.

El nivel de equilibrio de Nash, basado en la inducción hacia atrás, es de $ 2 en este escenario. Pero como en el juego Centipede, los experimentos de laboratorio demuestran consistentemente que la mayoría de los participantes, ingenuamente o no, escogen un número mucho más alto que $ 2. El dilema del viajero se puede aplicar para analizar una variedad de situaciones de la vida real. El proceso de inducción hacia atrás, por ejemplo, puede ayudar a explicar cómo dos compañías involucradas en una competencia despiadada pueden reducir los precios de los productos en forma más baja en un intento de ganar participación de mercado, lo que puede hacer que incurran cada vez mayores pérdidas en el proceso.

Estrategias adicionales de teoría de juegos

Batalla de los sexos

: Esta es otra forma del juego de coordinación descrito anteriormente pero con algunas asimetrías de pago. Básicamente se trata de una pareja tratando de coordinar su salida nocturna. Si bien habían acordado reunirse ya sea en el juego de pelota (la preferencia del hombre) o en una obra de teatro (la preferencia de la mujer), han olvidado lo que habían decidido, y para complicar el problema, no pueden comunicarse entre sí. ¿A dónde deberían ir? La matriz de pagos es como se muestra: los números en las celdas representan el grado relativo de disfrute del evento para la mujer y el hombre, respectivamente. Por ejemplo, la celda (a) representa la recompensa (en términos de niveles de disfrute) para la mujer y el hombre, respectivamente, en la obra (ella lo disfruta mucho más que él). Cell (d) es la recompensa si ambos llegan al juego de pelota (él lo disfruta más que ella). Cell (c) representa la insatisfacción si ambos van no solo a la ubicación incorrecta, sino también al evento que menos disfrutan: la mujer en el juego de pelota y el hombre en la obra.

Matriz de Batalla de los Sexos Hombre

Jugar

Juego de pelota

Mujer

Jugar

(a) 6, 3

(b) 2, 2 > Juego de pelota

(c) 0, 0

(d) 3, 6

Juego de dictador

: Este es un juego simple en el que el jugador A debe decidir cómo dividir un premio en efectivo con el jugador B , que no tiene participación en la decisión del jugador A. Si bien esta no es una estrategia de la teoría de juegos

per se

, proporciona algunas ideas interesantes sobre el comportamiento de las personas. Los experimentos revelan que aproximadamente el 50% se queda con todo el dinero; 5% lo dividió por igual, y el otro 45% le dio al otro participante una porción más pequeña. El juego del dictador está estrechamente relacionado con el juego del ultimátum, en el que el jugador A recibe una cantidad determinada de dinero, parte de la cual debe asignarse al jugador B, que puede aceptar o rechazar la cantidad otorgada.El problema es que si el segundo jugador rechaza la cantidad ofrecida, tanto A como B no obtienen nada. Los juegos del dictador y el ultimátum contienen lecciones importantes para temas como la caridad y la filantropía. Peace-War : una variación del dilema del prisionero en el que las decisiones de "cooperar o defecto" se reemplazan por "paz o guerra". "Una analogía podría ser dos compañías involucradas en una guerra de precios. Si ambos se abstienen de recortar los precios, disfrutan de una prosperidad relativa (celda a), pero la guerra de precios reduciría drásticamente los pagos (celda d). Sin embargo, si A se involucra en la reducción de precios (guerra) pero B no lo hace, A tendría un pago mayor de 4 ya que podría capturar una participación de mercado sustancial, y este mayor volumen compensaría los precios más bajos de los productos. Matriz de resultados de paz y guerra

Compañía B Paz

Guerra

Compañía A

Paz

(a) 3, 3

(b) 0, 4 > Guerra

(c) 4, 0

(d) 1, 1

Dilema del voluntario

: En el dilema de un voluntario, alguien tiene que emprender una tarea o trabajo por el bien común. El peor resultado posible se realiza si nadie se ofrece como voluntario. Por ejemplo, considere una compañía donde el fraude contable es desenfrenado pero la alta gerencia no lo sabe. Algunos empleados subalternos en el departamento de contabilidad son conscientes del fraude, pero dudan en avisarle a la alta gerencia, porque daría lugar a que los empleados involucrados en el fraude fueran despedidos y probablemente procesados. Ser etiquetado como un "denunciante" también puede tener algunas repercusiones en el futuro. Pero si nadie se ofrece como voluntario, el fraude a gran escala puede resultar en la eventual bancarrota de la empresa y la pérdida de los empleos de todos.

The Bottom Line

La teoría de juegos se puede usar muy eficazmente como una herramienta para la toma de decisiones ya sea en un entorno económico, comercial o personal.