Supongamos que hay n jugadores participando en el juego, si ningún jugador puede actuar solo para aumentar sus ganancias (es decir, para maximizar sus propios intereses, ninguna parte está dispuesta a cambiar su estrategia [1]). Entonces esta combinación de estrategias se llama equilibrio de Nash. Las estrategias de todos los jugadores constituyen un perfil estratégico.
El equilibrio de Nash es esencialmente un estado de juego no cooperativo.
Cuando se alcanza el equilibrio de Nash, no significa que ambos lados del juego estén en un estado estacionario. En un juego secuencial, este equilibrio se logra mediante las sucesivas acciones y reacciones de los jugadores. El equilibrio de Nash no significa que ambas partes del juego hayan alcanzado el estado óptimo general. Cabe señalar que sólo la estrategia óptima puede lograr el equilibrio de Nash. Una estrategia estrictamente inferior no puede ser la estrategia óptima, y sólo las estrategias débilmente superiores y débilmente inferiores pueden lograr el equilibrio de Nash. Un juego puede tener múltiples equilibrios de Nash, pero el dilema del prisionero tiene un solo equilibrio de Nash.
Las principales aportaciones académicas de Nash quedan reflejadas en sus dos artículos de 1950 y 1951. Recién en 1950 publicó los resultados de su investigación en las Actas Mensuales de la Academia Nacional de Ciencias, lo que inmediatamente causó sensación. Hablando de eso, todo depende del trabajo del hermano David Gale. Pocos días después de haber sido menospreciado y ridiculizado por von Neumann, conoció a Gale y le dijo que había encontrado el método de promoción y el punto de equilibrio del "principio mínimo-máximo" de von Neumann, como hablar en un sueño. El novato Nash no tenía idea de los peligros de la competencia y nunca había pensado en las consecuencias de las trampas académicas. Por lo tanto, David Gale actuó como su "agente" y redactó un breve mensaje a la Academia de Ciencias, mientras que el jefe del departamento, Lev Sheetz, aprovechó su conveniente relación para enviar personalmente el manuscrito a la Academia de Ciencias. Nash no escribió muchos artículos. Abogó por: menos es mejor. Morris, ganador del Premio Nobel de Economía 65438-0996, no publicó ningún artículo mientras se desempeñaba como profesor Edgeworth de Economía en la Universidad de Oxford. Los talentos especiales requieren métodos de selección especiales.
El equilibrio de Nash se refiere a la situación del juego. Para cada jugador, mientras los demás no cambien sus estrategias, él no podrá mejorar su propia situación. Nash demostró que debe existir un equilibrio de Nash si cada jugador tiene opciones de estrategia limitadas y permite estrategias mixtas. Tomando como ejemplo la guerra de precios entre dos empresas, el equilibrio de Nash significa que ambas partes tienen la posibilidad de perder: si la otra parte no cambia el precio, usted tampoco puede subir el precio, de lo contrario perderá aún más el mercado; No podemos bajar el precio, porque habrá una transacción que generará pérdidas. Por lo tanto, las dos empresas pueden cambiar el patrón de intereses original y buscar un nuevo plan de evaluación y distribución de intereses mediante la negociación, lo cual es un equilibrio de Nash. Por supuesto, un razonamiento similar puede aplicarse a las elecciones, los conflictos de intereses entre grupos, los estancamientos antes del estallido de una posible guerra, las batallas por proyectos de ley en el parlamento, etc.
El equilibrio de Nash se puede dividir en dos categorías: equilibrio de Nash de estrategia pura y equilibrio de Nash de estrategia mixta.
Para explicar el equilibrio de Nash de estrategia pura y el equilibrio de Nash de estrategia mixta, primero debemos explicar la estrategia pura y la estrategia mixta.
La llamada estrategia pura consiste en proporcionar a los jugadores una definición completa de cómo jugar. En particular, la estrategia pura determina el movimiento a realizar en cualquier situación. Un conjunto de estrategias es un conjunto de estrategias puras que un jugador puede ejecutar. Una estrategia mixta es una estrategia formada asignando una probabilidad a cada estrategia pura. Las estrategias mixtas permiten a los jugadores elegir aleatoriamente una estrategia pura. El equilibrio del juego de estrategias mixtas debe calcularse con probabilidad, porque cada estrategia es aleatoria y cuando se alcanza una cierta probabilidad, se puede lograr el pago óptimo. Como la probabilidad es continua, hay infinitas estrategias mixtas incluso si el conjunto de estrategias es finito.
Por supuesto, en sentido estricto, toda estrategia pura es una estrategia mixta "degenerada". La probabilidad es 1 para una estrategia pura específica y 0 en caso contrario.
Así, el "equilibrio de Nash de estrategia pura", es decir, todos los participantes juegan una estrategia pura y el correspondiente "equilibrio de Nash de estrategia mixta", en el que al menos un jugador juega una estrategia mixta. No todos los juegos tendrán un equilibrio de Nash de estrategia pura. Por ejemplo, el "problema de las monedas" solo tiene un equilibrio de Nash de estrategia mixta, pero no existe un equilibrio de Nash de estrategia pura. Sin embargo, todavía hay muchos juegos que tienen equilibrio de Nash de estrategia pura (como el juego de coordinación, el dilema del prisionero, el juego de caza del ciervo). Incluso algunos juegos pueden tener equilibrios tanto de estrategia pura como de estrategia mixta.
Finalmente, hablemos de un ejemplo similar al dilema del prisionero.