El dilema del prisionero, una de las teorías de juego más famosas, fue conceptualizado por Merrill Flood y Melvin Dresher en la Rand Corporation en 1950. Posteriormente fue formalizado y nombrado por el matemático canadiense Albert William Tucker.
El dilema del prisionero proporciona básicamente un marco para entender cómo lograr un equilibrio entre la cooperación y la competencia y es una herramienta útil para la toma de decisiones estratégicas.
El dilema del prisionero es un juego de azar, por lo que se aplica en diversas áreas que van desde los negocios, las finanzas, la economía y las ciencias políticas hasta la filosofía, la psicología, la biología y la sociología.
Puntos clave
- El dilema del prisionero describe una situación en la que, según la teoría de los juegos, dos jugadores que actúan de forma egoísta acabarán tomando una decisión subóptima para ambos.
- El dilema del prisionero también nos muestra que la mera cooperación no siempre es lo mejor para uno.
- Un ejemplo clásico del dilema del prisionero en el mundo real se da cuando dos competidores se enfrentan en el mercado.
- En los negocios, entender la estructura de ciertas decisiones como dilemas del prisionero puede dar lugar a resultados más favorables.
- Esta configuración permite equilibrar la competencia y la cooperación en beneficio mutuo.
1:31
Haga clic en Play para aprender los fundamentos del dilema del prisionero
Conceptos básicos del dilema del prisionero
El escenario del dilema del prisionero funciona como sigue: Dos sospechosos han sido detenidos por un delito y ahora se encuentran en habitaciones separadas en una comisaría, sin medios para comunicarse entre sí. El fiscal les ha dicho por separado lo siguiente
- Si confiesan y aceptan testificar contra el otro sospechoso, que no confiesa, se retirarán los cargos contra ustedes y quedarán libres.
- Si usted no confiesa pero el otro sospechoso sí, será condenado y la fiscalía pedirá la pena máxima de tres años.
- Si ambos confiesan, serán condenados a dos años de prisión.
- Si ninguno de los dos confiesa, ambos serán acusados de delitos menores y serán condenados a un año de prisión.
¿Qué deben hacer los sospechosos?? Esta es la esencia del dilema del prisionero.
Evaluación del mejor curso de acción
Empecemos por construir una matriz de resultados como la que se muestra en la siguiente tabla. La „recompensa” aquí se muestra en términos de la duración de la pena de prisión (simbolizada por el signo negativo; cuanto más alto sea el número, mejor). Los términos „cooperar” y „desertar” se refieren a que los sospechosos cooperen entre sí (e.g., si ninguno de los dos confiesa) o desertar (i.e., no cooperar con el otro jugador, que es el caso en el que un sospechoso confiesa, pero el otro no lo hace). El primer número de las casillas (a) a (d) muestra el resultado para el sospechoso A, mientras que el segundo número lo muestra para el sospechoso B.
Dilema del prisionero –
Matriz de pagos |
Sospechoso B |
||
Cooperar |
Defecto |
||
Sospechoso A |
Cooperar |
(a) -1, -1 |
(c) -3, 0 |
Defecto |
(b) 0, -3 |
(d) -2, -2 |
La estrategia dominante para un jugador es la que produce la mejor ganancia para ese jugador, independientemente de las estrategias empleadas por otros jugadores. La estrategia dominante aquí es que cada jugador deserte (i.e., confesar), ya que confesar minimizaría la duración media de la estancia en prisión. Estos son los posibles resultados:
- Si A y B cooperan y no dicen nada, ambos reciben un año de prisión, como se muestra en la celda (a).
- Si A confiesa pero B no, A queda libre y B recibe tres años de cárcel (b).
- Si A no confiesa pero B confiesa, a A le caen tres años y B queda libre-véase la celda (c).
- Si A y B confiesan, ambos reciben dos años de prisión, como muestra la celda (d).
Así que si A confiesa, o sale libre o recibe dos años de prisión. Pero si no confiesan, les espera un año o tres años de cárcel. B se enfrenta exactamente al mismo dilema. Está claro que la mejor estrategia es confesar, independientemente de lo que haga el otro sospechoso.
Implicaciones del dilema del prisionero
El dilema del prisionero muestra elegantemente que cuando cada individuo persigue su propio interés, el resultado es peor que si ambos hubieran cooperado. En el ejemplo anterior, la cooperación -en la que A y B guardan silencio y no confiesan- haría que los dos sospechosos recibieran una condena total de dos años de prisión. Todos los demás resultados darían lugar a una sentencia combinada para los dos de tres o cuatro años.
En realidad, una persona racional que sólo está interesada en obtener el máximo beneficio para sí misma preferiría generalmente desertar, en lugar de cooperar. Si ambos optan por desertar, suponiendo que el otro no lo hará, en lugar de acabar en la opción (b) o (c) -como cada uno esperaba- acabarían en la posición (d) y cada uno ganaría dos años de cárcel.
En el ejemplo del preso, cooperar con el otro sospechoso supone una condena inevitable de un año, mientras que confesar, en el mejor de los casos, supondría la puesta en libertad o, en el peor, una condena de dos años. Sin embargo, no confesar conlleva el riesgo de incurrir en la pena máxima de tres años, si, por ejemplo, la confianza de A en que B también guardará silencio resulta ser errónea y B realmente confiesa (y viceversa).
Este dilema, en el que el incentivo para desertar (no cooperar) es tan fuerte aunque la cooperación pueda dar los mejores resultados, se presenta de muchas maneras en los negocios y la economía
Albert Tucker presentó por primera vez el Dilema del Prisionero en 1950 a un grupo de estudiantes de psicología de la Universidad de Stanford, como ejemplo de la teoría de juegos.
Aplicaciones a la empresa
Un ejemplo clásico del dilema del prisionero en el mundo real se da cuando dos competidores se enfrentan en el mercado. A menudo, muchos sectores de la economía tienen dos rivales principales. En la U.S., Por ejemplo, existe una feroz rivalidad entre Coca-Cola (KO) y PepsiCo (PEP) en el sector de los refrescos y entre Home Depot (HD) y Lowe’s (LOW) en el de los suministros para la construcción. Esta competencia ha dado lugar a numerosos estudios de casos en las escuelas de negocios. Otras rivalidades feroces son Starbucks (SBUX) contra Tim Horton’s (THI) en Canadá y Apple (AAPL) contra Samsung en el sector de la telefonía móvil mundial.
Consideremos el caso de Coca-Cola frente a PepsiCo, y supongamos que la primera está pensando en reducir el precio de su emblemático refresco. Si lo hace, Pepsi podría no tener más remedio que seguir su ejemplo para que su refresco de cola conserve su cuota de mercado. Esto puede dar lugar a un descenso significativo de los beneficios de ambas empresas.
Una bajada de precios por parte de cualquiera de las empresas puede interpretarse como una deserción, ya que rompe un acuerdo implícito de mantener los precios altos y maximizar los beneficios. Por lo tanto, si Coca-Cola baja su precio pero Pepsi sigue manteniendo los precios altos, la primera está desertando, mientras que la segunda está cooperando (al atenerse al espíritu del acuerdo implícito). En este escenario, Coca-Cola puede ganar cuota de mercado y obtener beneficios adicionales vendiendo más colas.
Matriz de resultados
Supongamos que los beneficios incrementales que obtienen Coca-Cola y Pepsi son los siguientes:
- Si ambos mantienen los precios altos, los beneficios de cada empresa aumentan en 500 millones de dólares (debido al crecimiento normal de la demanda).
- Si una de ellas baja los precios (i.e., defectos) pero el otro no (coopera), los beneficios aumentan en 750 millones de dólares para el primero debido a su mayor cuota de mercado y no cambian para el segundo.
- Si ambas empresas reducen los precios, el aumento del consumo de refrescos compensa la bajada de precios y los beneficios de cada empresa aumentan en 250 millones de dólares.
La matriz de beneficios tiene el siguiente aspecto (los números representan los beneficios incrementales en dólares en cientos de millones):
Coca-Cola contra. PepsiCo –
Matriz de compensación |
PepsiCo |
||
Cooperar |
Defecto |
||
Coca-Cola |
Cooperar |
500, 500 |
0, 750 |
|
Defecto |
750, 0 |
250, 250 |
Otros ejemplos de dilema del prisionero que se citan con frecuencia se dan en ámbitos como el desarrollo de nuevos productos o tecnologías o los gastos de publicidad y marketing de las empresas.
Por ejemplo, si dos empresas tienen un acuerdo implícito para no modificar los presupuestos de publicidad en un año determinado, sus ingresos netos pueden mantenerse en niveles relativamente altos. Pero si uno de ellos hace un defecto y aumenta su presupuesto publicitario, puede obtener mayores beneficios a costa de la otra empresa, ya que el aumento de las ventas compensa el incremento de los gastos publicitarios. Sin embargo, si ambas empresas aumentan sus presupuestos publicitarios, el aumento de los esfuerzos publicitarios puede compensarse mutuamente y resultar ineficaz, con lo que los beneficios serán menores -debido a los mayores gastos publicitarios- que si los presupuestos publicitarios se mantuvieran sin cambios.
Aplicaciones a la economía
La U.S. El bloqueo de la deuda entre demócratas y republicanos que surge de vez en cuando es un ejemplo clásico de dilema del prisionero.
Digamos que la utilidad o el beneficio de resolver la U.S. El problema de la deuda sería la ganancia electoral de los partidos en las próximas elecciones. La cooperación en este caso se refiere a la voluntad de ambas partes de trabajar para mantener el statu quo con respecto a la espiral de U.S. déficit presupuestario. Desertar implica alejarse de este acuerdo implícito y tomar las medidas necesarias para controlar el déficit.
Si ambos partidos cooperan y mantienen el buen funcionamiento de la economía, se aseguran algunos beneficios electorales. Pero si la Parte A intenta resolver el problema de la deuda de forma proactiva, mientras que la Parte B no coopera, esta contumacia puede costar a B votos en las próximas elecciones, que pueden ir a A.
Sin embargo, si ambas partes se alejan de la cooperación y juegan duro para intentar resolver el problema de la deuda, la consiguiente agitación económica (caída de los mercados, una posible rebaja de la calificación crediticia y el cierre del gobierno) puede dar lugar a menores ganancias electorales para ambos partidos.
Cómo se puede utilizar?
El dilema del prisionero puede utilizarse para ayudar a la toma de decisiones en una serie de ámbitos de la vida personal, como la compra de un coche, las negociaciones salariales, etc.
Por ejemplo, suponga que está buscando un coche nuevo y entra en un concesionario. En este caso, la utilidad o recompensa es un atributo no numérico (i.e., satisfacción con el trato). Quieres conseguir la mejor oferta posible en términos de precio, características del coche, etc., mientras que el vendedor de coches quiere conseguir el precio más alto posible para maximizar su comisión.
La cooperación en este contexto significa que no hay regateo; entras, pagas el precio de etiqueta (para alegría del vendedor) y te vas con un coche nuevo. Por otro lado, desertar significa negociar. Tú quieres un precio más bajo, mientras que el vendedor quiere un precio más alto. Asignando valores numéricos a los niveles de satisfacción, donde 10 significa totalmente satisfecho con el trato y 0 implica ninguna satisfacción, la matriz de resultados es la que se muestra a continuación:
Comprador de coches frente a. Vendedor –
Matriz de beneficios |
Vendedor |
||
Cooperar |
Defecto |
||
Comprador |
Cooperar |
(a) 7, 7 |
(c) 0,10 |
Defecto |
(b) 10, 0 |
(d) 3, 3 |
¿Qué nos dice esta matriz?? Si usted negocia mucho y consigue una rebaja sustancial en el precio del coche, es probable que esté plenamente satisfecho con el trato, pero el vendedor probablemente no lo esté por la pérdida de la comisión (como puede verse en la celda b).
Por el contrario, si el vendedor se mantiene firme y no cede en el precio, es probable que usted no esté satisfecho con el trato, mientras que el vendedor estaría plenamente satisfecho (celda c).
Su nivel de satisfacción podría ser menor si simplemente entrara y pagara el precio total de la etiqueta (celda a). En esta situación, el vendedor también puede estar menos satisfecho, ya que su disposición a pagar el precio completo puede hacer que se pregunte si podría haberle „orientado” hacia un modelo más caro, o si podría haberle añadido más accesorios para ganar más comisión.
La celda (d) muestra un grado de satisfacción mucho menor tanto para el comprador como para el vendedor, ya que el regateo prolongado puede haber conducido finalmente a un compromiso reacio sobre el precio pagado por el coche.
Del mismo modo, en el caso de las negociaciones salariales, no es aconsejable aceptar la primera oferta que te haga un posible empleador (suponiendo que sepas que vales más).
Aceptar la primera oferta puede parecer una solución fácil en un mercado de trabajo difícil, pero puede suponer dejar dinero sobre la mesa. Deserción (i.e., negociar) por un salario más alto puede suponer un paquete salarial más abultado. Por el contrario, si el empresario no está dispuesto a pagar más, puede estar insatisfecho con la oferta final.
Esperemos que las negociaciones salariales no se conviertan en un asunto agrio, ya que eso puede dar lugar a un menor nivel de satisfacción para ti y para el empresario. La matriz de retribución comprador-vendedor mostrada anteriormente puede ampliarse fácilmente para mostrar el nivel de satisfacción del demandante de empleo frente al empleador.
¿Qué es un ejemplo de dilema del prisionero??
Este „juego de intercambio” tiene la misma estructura que el dilema del prisionero, e indica los beneficios de la cooperación. Greg tiene una gorra verde y preferiría una azul, mientras que Brenda tiene una gorra azul y preferiría una verde. Ambos preferirían tener dos gorras a sólo una y cualquiera de las gorras a no tener ninguna. Cada uno puede elegir entre quedarse con la gorra que tiene o dársela al otro. Tanto si Rose se queda con su gorra como si se la da a Bill, a éste le conviene quedarse con la suya, y a ella le conviene que se la dé. Tanto si Bill se queda con su gorra como si se la da a Rose, a ésta le conviene quedarse con la suya y a él le conviene que ella se la dé. Lo ideal es tener dos gorras, pero eso sólo es posible si una persona se comporta de forma egoísta, y eso significa que una persona se queda sin gorra. Sin embargo, ambos están mejor si cambian las gorras que si se quedan con la que tienen, porque será del color que prefieren.
¿Cuál es la estrategia dominante en el dilema del prisionero??
En el dilema del prisionero, ninguno de los dos sospechosos -llamémosles Herb y Lee- conoce la decisión elegida por el otro sospechoso. Herb tiene miedo de guardar silencio porque en ese caso puede recibir más años de cárcel si Lee le culpa. Si Herb elige culpar a Lee, puede ser liberado si Lee permanece en silencio. Sin embargo, eso no es probable, porque Lee está utilizando el mismo razonamiento y también va a culpar a Herb.
Por lo tanto, la decisión de permanecer en silencio por ambos Los sospechosos (lo último en confianza y cooperación) proporcionan la recompensa más óptima (menos tiempo de cárcel para cada uno). Pero no es una opción realmente racional porque ambas partes están obligadas a actuar en su propio interés y a culpar a la otra persona, en un intento de no hacer tiempo. Por tanto, la segunda mejor estrategia es que ambos sospechosos confiesen. Cada uno recibirá más tiempo de cárcel que si ambos hubieran permanecido en silencio, pero menos que si uno permaneciera en silencio y otro confesara.
Cómo vencer el dilema del prisionero?
A lo largo del tiempo, la gente ha elaborado una serie de soluciones a los dilemas del prisionero para superar los incentivos individuales en favor del bien común. En el mundo real, la mayoría de las interacciones económicas y humanas se repiten más de una vez. Un verdadero dilema del prisionero sólo se juega una vez; con la repetición, la gente puede empezar a predecir el comportamiento de los demás y aprender de los errores y los resultados adversos.
La gente ha desarrollado estrategias institucionales formales para alterar los incentivos a los que se enfrentan los responsables individuales. La acción colectiva para imponer el comportamiento cooperativo a través de la reputación, las normas, las leyes, la toma de decisiones democrática o colectiva y el castigo social explícito por las deserciones transforma muchos dilemas del prisionero hacia los resultados cooperativos más beneficiosos para la colectividad.
Además, algunas personas y grupos de personas han desarrollado sesgos psicológicos y de comportamiento a lo largo del tiempo, como una mayor confianza en los demás, una orientación futura a largo plazo en las interacciones repetidas e inclinaciones hacia la reciprocidad positiva del comportamiento cooperativo o la reciprocidad negativa de los comportamientos de deserción. Estas tendencias pueden evolucionar a través de una especie de selección natural dentro de una sociedad a lo largo del tiempo o de una selección de grupo entre diferentes sociedades competidoras. En efecto, llevan a grupos de individuos a elegir „irracionalmente” resultados que en realidad son los más beneficiosos para todos ellos juntos.
La tragedia de los comunes es un excelente ejemplo del dilema del prisionero en una economía. Puede que a todo el mundo le convenga conservar y reinvertir en la propagación de un recurso natural común para poder seguir consumiéndolo, pero cada individuo siempre tiene un incentivo para consumir lo más rápido posible, lo que agota el recurso.
El resultado final
El dilema del prisionero nos muestra que la mera cooperación no siempre redunda en beneficio propio. De hecho, cuando se compra un artículo de gran valor, como un coche, el regateo es la opción preferida por los consumidores. De lo contrario, el concesionario puede adoptar una política de inflexibilidad en las negociaciones de precios, maximizando sus beneficios pero haciendo que los consumidores paguen de más por sus vehículos.
Comprender los beneficios relativos de cooperar frente a desertar puede estimularle a participar en negociaciones de precios significativas antes de realizar una gran compra.
Fuentes del artículo
Nuestro equipo exige a los escritores que utilicen fuentes primarias para apoyar su trabajo. Se trata de libros blancos, datos gubernamentales, informes originales y entrevistas con expertos del sector. También hacemos referencia a investigaciones originales de otras editoriales de renombre cuando es necesario. Puede obtener más información sobre las normas que seguimos para producir contenidos precisos e imparciales en nuestra
política editorial.