¿Resolver ejemplos prácticos de teoría de juegos?

La teoría de juegos, también conocida como teoría de juegos, teoría de juegos, etc., no es solo una nueva rama de las matemáticas modernas, sino también un tema importante de la investigación de operaciones.

La teoría de juegos estudia principalmente la interacción entre estructuras de incentivos formuladas. Es una teoría y un método matemático que estudia fenómenos de naturaleza lucha o competitiva. La teoría de juegos considera el comportamiento real y previsto de los individuos en un juego y estudia sus estrategias de optimización. Los biólogos utilizan la teoría de juegos para comprender y predecir ciertas consecuencias de la evolución. La teoría de juegos se ha convertido en una de las herramientas analíticas estándar en economía. Se utiliza ampliamente en finanzas, valores, biología, economía, relaciones internacionales, informática, ciencias políticas, estrategia militar y muchas otras disciplinas.

Caso 1: Dilema del prisionero

En teoría de juegos, un ejemplo famoso de equilibrio estratégico dominante es el modelo de juego del "dilema del prisionero" propuesto por Tucker. Este modelo nos cuenta la historia de un policía y un ladrón de una forma especial. Supongamos que dos ladrones A y B cometen conjuntamente un delito, irrumpen en una casa particular y son atrapados por la policía.

La policía colocó a los dos hombres en dos habitaciones diferentes para interrogarlos. Para cada sospechoso, la política policial era: si ambos sospechosos confesaban el crimen, entregarían las pruebas después de recibir los bienes robados. concluyente, y ambos fueron declarados culpables y cada uno fue sentenciado a 8 años de prisión. Si solo un sospechoso confesara y el otro no confesara pero negara, sería acusado de obstruir asuntos oficiales (porque ya había pruebas de que era culpable). ) fue condenado a 2 años adicionales de prisión, mientras que la persona que confesó fue condenada meritoriamente a una pena reducida de 8 años y puesta en libertad inmediatamente. Si ambos niegan el delito, la policía no podrá condenarlos por robo por falta de pruebas, pero sí podrán ser condenados a un año de prisión cada uno por entrar en una casa particular. La siguiente tabla muestra la matriz de pagos de este juego.

Para A, aunque no sabe qué elegirá B, sabe que no importa lo que elija B, siempre es óptimo para él elegir "confesión". . Evidentemente, por simetría, B también optará por "confesar", y el resultado es que ambos son condenados a 8 años de prisión. Sin embargo, si todos deciden "negar", cada uno sólo será sentenciado a un año de prisión. Entre las cuatro combinaciones de opciones de acción en la Tabla 2.2, (negar, negar) es óptima de Pareto, porque cualquier otra combinación de opciones de acción que se desvíe de esta combinación de opciones de acción empeorará la situación de al menos una persona. Sin embargo, la "confesión" es la estrategia dominante de cualquier sospechoso de delito, y (confesión, confesión) es un equilibrio estratégico dominante, es decir, un equilibrio de Nash. No es difícil ver que aquí hay un conflicto entre el equilibrio de Nash y el de Pareto.

Desde un punto de vista matemático, esta teoría es razonable, es decir, todas las elecciones se hacen con franqueza. Pero es obviamente inapropiado en un campo sociológico donde la información multidimensional juega un papel sinérgico. Así como la antigua China llamó al soborno y al soborno entre funcionarios "malas reglas" en lugar de intentar por todos los medios investigarlas, esto se debe a que el efecto restrictivo del sistema social sobre el comportamiento de las personas las obliga a cambiar su forma de tomar decisiones. Por ejemplo, desde un punto de vista psicológico, el costo de elegir confesar será mayor. Si una de las partes confiesa y la otra es culpable, entonces el comportamiento de represalia posterior y el papel de "vendedor" entre los conocedores del entorno no lo serán. fácilmente hacerle perder dinero.

La tasa de aumento entre 8 y 10 años se diluirá. La dignidad humana hará que la gente se sienta vengativa y rompa ligeramente las "reglas comerciales". Estamos en la era del big data. Si queremos abordar algo más cercano a los hechos, debemos dominar la mayor cantidad de información relevante posible y ponderar razonablemente el análisis. Las actividades humanas son complejas y tienen motivaciones complejas, por lo que el dilema del prisionero puede. Sólo debe utilizarse como referencia para modelos simplificados y decisiones específicas. Es necesario analizarlo en detalle.

Caso 2: Los beneficios de los cerdos

1. "Los beneficios de los cerdos" en economía Este ejemplo habla de:

Supuesto Hay un cerdo grande y un pequeño cerdo en la pocilga. Hay un comedero para cerdos en un extremo de la pocilga, y en el otro extremo hay instalado un botón para controlar el suministro de alimento para cerdos. Cuando se presiona el botón, entrarán 10 unidades de alimento para cerdos en el comedero, pero quien presione el. El botón pagará primero un costo de 2 unidades. Si se presiona el botón, el costo será de 2 unidades. Si el cerdo llega primero al comedero, la proporción de ganancias de los cerdos grandes y pequeños cuando lleguen. al mismo tiempo, la proporción de ganancias de los cerdos grandes y pequeños es de 7:3; cuando el cerdito llega primero al comedero, la proporción de ganancias de los cerdos grandes y pequeños es de 9:1;

Entonces, bajo la premisa de que ambos cerditos son sabios, el resultado final es que el cerdito elige esperar.

El "Juego del Cerdo Inteligente" fue propuesto por Nash en 1950. De hecho, la razón por la que Cerdito elige esperar y dejar que Cerdito presione el botón de control, mientras él elige "tomar un bote" (o hacer autostop) es muy simple: bajo la premisa de que Cerdito decide actuar, si Cerdito Si elige esperar, Cerdito podrá obtener 4 unidades de ingreso neto, pero si el cerdito actúa, solo podrá obtener 1 unidad de ingreso neto del cerdo grande, por lo que esperar es mejor que actuar bajo la premisa de que; el cerdo grande elige esperar, si el cerdito actúa. Si es así, el ingreso del cerdito no será igual al costo y el ingreso neto será -1 unidad. Si el cerdito también elige esperar, entonces el ingreso del cerdito será. cero y el costo será cero. En resumen, esperar es aún mejor que actuar.

Utilizando la matriz de recompensas en la teoría de juegos, la elección del cerdito se puede representar más claramente:

Se puede ver en la matriz que cuando el cerdo grande elige actuar, si el cerdito Acción, su ganancia es 1, y si el cerdito espera, la ganancia es 4, entonces el cerdito elige esperar cuando el cerdito grande elige esperar, si el cerdito actúa, su ganancia es -1, y si el cerdito actúa, su ganancia es -1; El cerdito espera, la ganancia es 0, por lo que Piggy también elige esperar. En conjunto, no importa si Big Pig elige actuar o esperar, la elección de Little Pig será esperar, es decir, esperar es la estrategia dominante de Little Pig.

En las operaciones de pequeñas empresas, aprender a "aprovechar" es la cualidad más básica de un gerente profesional astuto. En algún momento, es una buena elección esperar y dejar que otras grandes empresas desarrollen el mercado primero. ¡Aquí es cuando puedes hacer algo sin hacer nada! Los administradores inteligentes saben aprovechar diversas condiciones favorables para servirse a sí mismos. El "free-riding" es en realidad otra opción para que los gerentes profesionales afronten todos los gastos. Prestar atención y estudiarlos puede ahorrar a las empresas muchos gastos innecesarios, llevando así la gestión y el desarrollo de las empresas a un nuevo nivel. Este fenómeno es muy común en la vida económica, pero rara vez resulta familiar para los directivos de pequeñas empresas. En el juego del cerdo inteligente, aunque el comportamiento del cerdito de "recoger lo ya hecho" es moralmente repugnante, ¿no es el objetivo principal de la estrategia del juego utilizar estrategias para maximizar los propios intereses?

Caso 3: La moneda de la belleza

Una belleza extraña viene a charlar contigo y te pide jugar un juego contigo. La belleza sugirió: "Muestremos cada uno una cara de la moneda, ya sea cara o cruz. Si ambos somos cara, entonces te daré 3 yuanes. Si ambos somos cruz, te daré 1 yuan. En el resto En estos casos, dame sólo 2 yuanes”. Suena como una buena idea. Si fuera hombre, jugaría de todos modos, pero las consideraciones económicas son otra cuestión. ¿Es este juego realmente justo?

Supongamos que la probabilidad de que salga cara es x y la probabilidad de que salga cruz es 1-x. Para maximizar los beneficios, nuestros ingresos deben ser iguales cuando el oponente muestra cara o cruz. De lo contrario, el oponente siempre puede cambiar la probabilidad de que salga cara y cruz para reducir nuestro ingreso total. La ecuación enumerada aquí es 3x (-2) *. (1-x)=(-2)*x 1*(1-x). En términos sencillos, esta ecuación significa que los beneficios que obtienes cuando tu oponente sigue jugando cara son los mismos y mayores cuando tu oponente sigue jugando cruz. Al resolver la ecuación se obtiene x=3/8, lo que significa que, en promedio, 3 caras y 5 cruces cada ocho veces es nuestra estrategia óptima. Sustituya x=3/8 en la expresión de ingresos 3*x (-2)*(1-x) para obtener el ingreso esperado cada vez, y el resultado del cálculo es -1/8 de yuanes.

De manera similar, supongamos que la probabilidad de que una mujer hermosa obtenga cara es y, y la probabilidad de que salga cruz es 1-y, y la ecuación es -3y 2(1-y)=2y (-1) *(1 año). La solución es que y también es igual a 3/8, y el rendimiento esperado de la belleza cada vez es 2(1-y)-3y=1/8 yuanes. Esto nos dice que cuando ambas partes adoptan la estrategia óptima, la belleza gana en promedio 1/8 de yuan cada vez. De hecho, mientras la belleza adopte el plan (3/8, 5/8), no importa qué plan adoptes, no cambiará la situación.

Si salen todas las caras, la ganancia esperada cada vez es (3 3 3-2-2-2-2-2)/8=-1/8 yuan

Si salen todas las caras, la ganancia esperada ganancia cada vez El ingreso también es (-2-2-2 1 1 1 1 1)/8=-1/8 yuanes. Cualquier estrategia no es más que una combinación lineal de las dos estrategias anteriores, por lo que la expectativa sigue siendo -1/8 de yuan. Pero cuando también adoptas la mejor estrategia, al menos puedes asegurarte de perder lo mínimo. De lo contrario, definitivamente serás el objetivo de las estrategias adoptadas por mujeres hermosas y perderás más. Parece que este modelo de juego es de poca utilidad, pero de hecho puede involucrar el modelo más importante en la fijación de precios en los mercados financieros: el modelo de ponderación de precios.

En general, la esencia de la "teoría de juegos" es expresar las contradicciones competitivas en la vida diaria en forma de juegos y utilizar métodos matemáticos y lógicos para analizar las reglas de funcionamiento de las cosas. Puesto que hay participantes en el juego, también debe haber creadores de reglas. Una comprensión profunda de la naturaleza del comportamiento competitivo nos ayuda a analizar y captar la relación entre las cosas en competencia, y nos facilita formular y ajustar reglas para que, en última instancia, puedan operar de acuerdo con nuestros propósitos esperados.

Fuente: Enciclopedia Baidu de Teoría de Juegos

Caso 4: Juego de Paradigma Común

GOO Company y SAM Company son dos participantes de peso en una determinada ecología de productos de telefonía móvil. Sin embargo, ambas partes desempeñan sus propias funciones en diferentes posiciones de la cadena industrial y tienen una relación ambigua. A veces, a menudo tienen intenciones diferentes debido a la competencia por los intereses comerciales y la influencia del producto. Los beneficios de los dos también continúan cambiando con los cambios en el juego.

La tabla anterior simula la situación actual del juego entre dos compañías. Cada lado tiene dos estrategias opcionales: "cooperación" y "deserción". Los cuatro conjuntos de datos en la cuadrícula representan las puntuaciones de las cuatro. resultados del juego (beneficios), el primer número en cada conjunto de datos representa los ingresos de GOO Company y el último número representa los ingresos de SAM Company. El juego se juega simultáneamente. Los participantes de un lado deben considerar nuestras elecciones estratégicas desde la perspectiva del otro lado para maximizar las ganancias. A esto se le llama ponerse en el lugar de los demás en la teoría de juegos.

Ahora utilizamos GOO Company como perspectiva en primera persona para pensar en la estrategia del juego contra SAM Company. Si SAM Company decide cooperar, entonces el beneficio generado por nuestra elección de cooperación es 3 y el beneficio generado por nuestra elección de deserción es 5. Con base en consideraciones racionales de maximización de ganancias, debemos optar por desertar. Esto se denomina ventaja estricta. estrategia; Si SAM Company decide desertar, entonces el beneficio generado por nuestra elección de cooperación es -3, y el beneficio generado por nuestra elección de deserción es -1. Para minimizar la pérdida, debemos optar por desertar. Finalmente, el resultado del análisis de GOO es que no importa si SAM elige una estrategia de cooperación o de deserción, debemos elegir una estrategia de deserción para maximizar los beneficios. De la misma manera, cuando SAM Company también responde a la elección estratégica de GOO Company con una estrategia de ventaja estricta, repetimos el proceso de análisis anterior y podemos concluir: No importa que GOO Company elija una estrategia de cooperación o deserción, SAM Company debe elegir una estrategia de deserción. para obtener Maximizar los ingresos.

Al final, descubrimos que ambos lados de este juego adoptaron una estrategia de traición y sus respectivos beneficios fueron -1. Este es un final relativamente malo, aunque no es el peor para ninguna de las partes. . Esta situación es el famoso "dilema del prisionero". Sin embargo, el número de juegos suele ser más de uno. Por ejemplo, pueden existir muchas oportunidades en los negocios entre el COO y SAM. Después de que los dos experimentaron muchos juegos de estrategia de traición, descubrieron que hay una situación en la que todos ganan con (3, 3) ingresos en la fórmula, que obviamente es mucho mejor que el resultado de ingresos de (-1, -1), por lo que dos más tarde En el proceso del juego, inevitablemente intentarán generar confianza entre sí, lo que llevará a ambas partes a elegir una estrategia cooperativa.

Aquí existe un supuesto ideal, es decir, suponer que ambas partes saben que el número de juegos es infinito, es decir, los contactos comerciales entre las dos partes son infinitos, entonces las estrategias de ambas las partes seguirán eligiendo la cooperación. El ingreso final del juego se fijará en (3, 3), que es un equilibrio de Nash.

Dado que el número de juegos es infinito, no hay razón para que ninguna de las partes elija la estrategia de traición de arriesgar 5 puntos de ganancia a corto plazo e incurrir en la venganza de la otra parte en la siguiente ronda del juego (este tipo de venganza se llama estrategia de "ojo por ojo" en la teoría de juegos). Otra situación hipotética es que si ambas partes saben que el número de juegos es limitado y tal vez el próximo juego sea el último, entonces, para evitar que la otra parte elija una estrategia de traición en la última ronda del juego, sufren una pérdida de -3, por lo que ambos lados adoptaron nuevamente la estrategia de deserción y el resultado final del juego volvió a (-1, -1), que formó el segundo equilibrio de Nash. Como cambia el número de veces (la naturaleza del juego), el punto de equilibrio de Nash no es único.

Caso 5: Juego del León Hambriento

La pregunta se plantea a seis leones A, B, C, D, E, F (el más fuerte y el más débil de izquierda a derecha) y una oveja . Supongamos que el león A tomará una siesta después de comerse la oveja. En este momento, el león B, que es un poco más débil que A, aprovechará la oportunidad para comerse al león A, luego B también tomará una siesta y luego el león C se comerá al león. B, y así sucesivamente. Entonces la pregunta es: ¿se atreve el león A a comer ovejas?

Para simplificar la explicación, damos primero la solución a este problema. Esta pregunta debe utilizar el método de análisis inverso, es decir, comenzar desde el león F más débil y avanzar en orden. Supongamos que el león E está dormido, ¿se atreve el león F a comerse al león E? La respuesta es sí, porque no hay otros leones detrás del león F, por lo que el león F puede comerse con seguridad al león E que está tomando una siesta. En el futuro, dado que el león E será devorado por el león F cuando duerma, el león E no debe atreverse a comerse al león D que está durmiendo frente a él. En el futuro, dado que el león E no se atreve a comerse al león D, entonces D puede comerse con seguridad al león C que está tomando una siesta. Siguiendo adelante en secuencia, obtenemos que C no comerá, B comerá y A no comerá. Entonces la respuesta es que el león A no se atreve a comerse a la oveja. Las personas cuidadosas pueden descubrir que si el número total de leones aumenta o disminuye, el resultado del juego será completamente diferente.

Añadimos un león G detrás del león F, haciendo el número total 7. Utilice el método de análisis inverso para seguir los pasos de la pregunta anterior nuevamente y será fácil llegar a la conclusión: el león G come, el león F no come, E come, D no come, C come, B no come y A come. Esta vez la respuesta fue que el León A se atrevió a comerse la oveja.

Al comparar los dos juegos, encontramos que si el león A se atreve a comerse la oveja depende de la paridad del número total de leones. Cuando el número total es impar, A se atreve a comerse la oveja; cuando el número total es par, A no se atreve a comerse la oveja. Por tanto, los resultados del Juego de los Leones con un número impar y un número par forman dos equilibrios de Nash estables.

A través del juego de múltiples rondas del caso anterior, los principiantes deberían poder descubrir vagamente el esquema del equilibrio de Nash. Cuando el juego se juega más de una vez, el resultado del juego se fijará repetidamente en un determinado estado, y ese estado es el punto de equilibrio de Nash. La explicación axiomática es que si ningún jugador en el juego puede aumentar sus ganancias actuando solo en una situación determinada, entonces la combinación de estrategias en ese momento se llama equilibrio de Nash.

Los casos de juegos simples pueden parecer interesantes, pero la teoría de juegos es siempre un tema profundo y complejo. Su complejidad radica en el hecho de que siempre existen diferencias entre el modelo idealizado utilizado en el análisis de juegos y la realidad. Por ejemplo, la teoría de juegos requiere que todos los participantes sean "personas racionales" en el sentido económico, pero en realidad no existen "personas completamente racionales". Hay demasiadas variables en el mundo real que van más allá de la teoría de juegos, lo que dificulta la construcción de modelos de juegos que persigan predicciones precisas.

A pesar de esto, la teoría de juegos todavía ha cambiado el mundo y se ha convertido en una herramienta importante para que los seres humanos comprendan el mundo de forma racional. La propuesta del equilibrio de Nash sin duda ha enriquecido el sistema teórico de la teoría de juegos y es un ladrillo y cemento de la civilización humana. Lo que es seguro es que cien años después, la gente todavía no olvidará el nombre de John Nash, ni olvidará ese equilibrio mágico de Nash. Fuente: Dos ejemplos clásicos que revelan el misterio de la teoría de juegos y el equilibrio de Nash. El autor de este artículo es el hermano Shui

.