El “dilema del prisionero” y algunas aplicaciones

A pesar de lo que pueda sugerir su nombre, la “Teoría de Juegos” es una interesante rama de las Matemáticas que se ha llegado a aplicar en campos tan diversos como la Biología o la Economía. Trata sobre la forma de ganar en los juegos con reglas bien definidas, un grupo de jugadores, un conjunto de estrategias y una serie de premios en función de sus posibles combinaciones. El dilema del prisionero 01El ”dilema del prisionero” es un interesante problema teoría, muy estudiado como modelo de conflictos. Muestra como dos personas pueden no cooperar, incluso en contra del interés mutuo. Desarrollado en 1950 por Merrill Flood y Melvin Dresher cuando ambos trabajaban para la corporación RAND, laboratorio de ideas (think tank) norteamericano dedicado a la formación de las fuerzas armadas de ese país, fue popularizado más tarde por Albert W. Tucker quien le asignó ese nombre basado en recompensas penitenciarias.

Su enunciado clásico (a posteriori se han desarrollado más variantes) es el siguiente:
“La policía arresta a dos sospechosos, pero no existen suficientes pruebas para condenarlos. Se cree que han participado en el robo de un banco, delito penado con diez años de cárcel. Tan sólo puede culparles de un cargo menor, tenencia ilícita de armas, cuyo castigo es de solo un año. Detenidos y encerrados en celdas separadas de forma que no pueden comunicarse entre sí, la policía les visita de forma independiente ofreciéndoles el mismo trato:

Si uno confiesa y su cómplice no, el cómplice será condenado a la pena total, diez años, y el que confiesa será liberado. Si uno calla y el cómplice confiesa, éste será quien salga libre y el primero recibirá una pena de diez años. Si ambos confiesan, los dos serán condenados a seis años. Si ambos lo niegan, tan solo podrán encerrarlos durante un año por un cargo menor”.

Las posibles consecuencias se pueden ver de forma resumida en la tabla siguiente:Matriz posibilidades
O lo que es lo mismo en una doble matriz de penas (en años):
Matriz reparto penasEn esencia, el «dilema del prisionero» trata de estudiar el comportamiento racional de las personas. Como se puede observar en la tabla y la matriz de penas existen cuatro posibilidades. Supondremos, en un principio, que ambos son totalmente egoístas (y que no existe ningún nexo familiar o de otra índole entre ellos) y que su única meta será reducir el tiempo que pasarán en prisión. Cada uno tendrá por tanto dos opciones: “cooperar con su cómplice y permanecer callado, o traicionarlo y confesar”.

Está claro que el resultado final dependerá de la elección que ambos hagan de manera independiente. Si uno espera que el cómplice escoja cooperar con él y permanecer en silencio, la opción óptima sería confesar pues significaría ser liberado (el cómplice tendría que cumplir entonces una condena de 10 años). Si por el contrario espera que su cómplice decida confesar, la mejor opción es confesar también, ya que al menos no recibirá la condena completa (sería de 6 años para cada uno). Finalmente, si ambos decidiesen cooperar entre si y permanecer en silencio serían liberados los dos tras cumplir 1 año de condena.

Lo más normal bajo un planteamiento egoísta es que cada uno piense que el otro ha elegido callarse para poder salir en el menor tiempo posible. En este caso la tentación de ser el primero en confesar (opción más ventajosa) será enorme, pues significaría la libertad inmediata. Su compañero seguramente razonaría de igual manera bajo ese prisma egoísta. Por tanto: ”Si los dos son egoístas, la posibilidad real de que ambos confiesen y pasen 6 años entre rejas será muy grande”. Confesar es una estrategia dominante para ambos delincuentes, porque sea cual sea la elección del otro podrán siempre reducir su sentencia. Por desgracia para ellos conduce a un resultado tan solo «regular» pues reciben también una larga condena. En este punto concreto se encuentra la clave del dilema, porque provoca un resultado que no es el óptimo, que sucede como ya hemos dicho cuando ambos detenidos no confiesan.

Una mente maravillosa 01“Una mente maravillosa” es una extraordinaria película ganadora de cuatro Oscars protagonizada por Rusell Crowe en el papel de John Forbes Nash, uno de los economistas más importantes de la historia. Nash, que padecía esquizofrenia paranoide y un serio problema para relacionarse con los demás, recibió el premio Nobel de Economía en 1994 por sus aportaciones a la resolución de una de las teorías más complejas como es la “Teoría de Juegos”, y más en concreto al célebre problema del “dilema del prisionero». Cuando todos los jugadores toman una decisión y no pueden cambiarla sin empeorar su bienestar, se considera que se ha alcanzado un «equilibrio de Nash». Racionalmente suena muy bien decir que la mejor estrategia será cuando ninguno de los dos delincuentes confiesa. El problema radica en que,  al no existir ningún nexo de lealtad, se trata de un punto de «equilibrio inestable». Sin embargo, la situación alcanzada cuando ambos confiesan es un «equilibrio de Nash», y por tanto de un «equilibrio estable», porque ambas partes no pueden cambiar sin empeorar.

A primera vista pudiera parecer que el “dilema del prisionero” solo es un pasatiempo matemático. Sin embargo, se han dado bastantes casos de aplicación en la vida real. De ahí su gran interés para las ciencias sociales, la economía, las ciencias políticas, la sociología o las ciencias biológicas. En la actualidad la “Teoría de Juegos” sigue siendo un importante campo de investigación.

Un claro ejemplo lo podemos ver en la dirección estratégica de un negocio. Supongamos dos empresas del mismo ramo que han llegado a su máxima capacidad de mejora individual. Se les abre la posibilidad de seguir avanzando bajo un planteamiento de colaboración mutua. Está claro que su posición aún podría progresar aprovechando las ventajas comparativas para aumentar sus capacidades y competencias y reducir el coste unitario de sus productos gracias al conocimiento mutuo. De esa manera podrán seguir ganando terreno a sus competidores. Lo que no hace tantos años parecía difícil de entender se ha convertido, aunque solo sea por mera supervivencia, en un objetivo primordial. Está demostrado que las sinergias entre empresas da un rendimiento superior a la acción individual de cada una. Su beneficio será máximo si ambas son honestas y colaboran, aunque si una traiciona a la otra ocurrirá el fenómeno contrario. Lo normal es que la acción coordinada entre empresas redunde en beneficio del conjunto.

Otro campo de estudio del “dilema del prisionero” se da en las relaciones internacionales. Se vivió, por ejemplo, en la famosa Guerra Fría con las dos grandes superpotencias (USA y URSS) implicadas en una gran carrera armamentística por demostrar su supremacía ante un posible conflicto. Solo tenían dos opciones: incrementar el gasto militar o firmar un acuerdo para reducir su armamento. Como ninguna de las partes estaba segura de que la otra acataría un acuerdo siguieron con su expansión militar. Así sucedió durante largo tiempo. Una tesitura que en principio parece “racional”, pero cuyo resultado es totalmente irracional. Mucho más beneficioso para el conjunto hubiera sido un comportamiento más altruista, pero triunfó el egoísmo por dominar el mundo, aún a costa de lo que se denominó “Destrucción Mutua Asegurada” (conjunto de conceptos y estrategias ideadas para evitar la utilización de armas nucleares o conseguir una hipotética ventaja en caso de guerra nuclear con máximos beneficios políticos o militares). Frente a la idea generalizada, compartida por la mayoría de los especialistas, de que la única guerra nuclear posible es la guerra nuclear total que implicaría el fin del mundo, ambas superpotencias teorizaron con diferentes estrategias que les llevasen a vencer o al menos lograr una posición ventajosa sin que desembocase en un conflicto real total. Por fortuna, últimamente se está avanzando bastante aplicando la respuesta sencilla y práctica del “dilema del prisionero”: “Cuando se busca el interés del grupo se obtienen más beneficios que cuando se busca el mejor resultado individual. En pocas palabras, la forma de conseguir lo mejor para cada uno es hacer lo que resulta mejor para todos”.

Sin título-2

El “dilema del prisionero” es un ejemplo clásico de la «Teoría de Juegos» para demostrar las estrategias dominantes si no se conoce la decisión del otro jugador. Un escenario que ayuda a saber qué hacer cuando el resultado de un problema no depende solo de nosotros, sino de la elección que hagan otros. De todos modos casi siempre se asume que la traición suele ser la estrategia dominante tal y como proclama el “equilibrio de Nash”.

Sin embargo, nadie se había preocupado por llevar a cabo un experimento con prisioneros reales hasta que Menusch Khadjavi y Andreas Lange, economistas de la universidad de Hamburgo, lo hicieron con un grupo de internas de una prisión para mujeres y otro de estudiantes universitarios. Las recompensas para los estudiantes eran algunos euros y para las prisioneras café y cigarrillos. Los investigadores esperaban corroborar o comparar el comportamiento de ambos grupos en diversos tipos de juegos, pero los resultados fueron muy distintos a lo esperado: las prisioneras se mostraron mucho más cooperativas. Lo que nos obliga a pensar que tal vez el “equilibrio de Nash” funcione si asumimos la mala fe del contrincante.

Robert Axelrod es un profesor de ciencias políticas de la Universidad de Míchigan muy conocido por su contribución a la «Teoría de Juegos» en relación a la cooperación y estrategias aplicadas al complejo mundo económico. Hablando sobre el “dilema del prisionero”, del que estudió una variante que llamó “dilema del prisionero iterado” donde los participantes debían escoger una y otra vez una estrategia mutua con memoria de sus encuentros previos, decía lo siguiente: ”El ‘dilema del prisionero’ supuso una buena manera de pensar en los problemas políticos cuando existe un conflicto entre aquello que es bueno para el individuo y lo que es bueno para el grupo».

El «dilema del prisionero» es como un puzzle. Dos cómplices de un delito y un dilema. Aunque en el fondo no es más que la forma más elemental de conflicto entre el bien común y el interés personal. Es obvio que existen estrategias para conseguir la cooperación en un mundo egoísta, pero lo que no queda tan claro es cual utilizar en un momento determinado. Al respecto, Axelrod decía: “Se sugerían muchas opciones de actuar en un juego de este tipo, pero no hubo un consenso sobre cual era la más conveniente. Escribí a todos los que habían publicado alguna teoría para el ‘dilema del prisionero’ pidiendo que presentaran la estrategia que consideraran más válida. Obtuve 14 respuestas de diferentes campos de aplicación: matemáticas, biología, informática, filosofía, evolución, ciencias políticas, económicas… Después de estudiarlas la mejor resultó la más sencilla. La estrategia consiste en una especie de toma y daca. Se coopera en el primer movimiento y luego se hace lo mismo que el otro jugador hizo en el movimiento anterior. Si el otro jugador coopera tú cooperas, si el otro jugador va a lo suyo tu también”.

Axelrod había descubierto una estrategia efectiva para establecer la cooperación. Lo sorprendente era que fuese tan fácil. Y añadía: “Se podría argumentar que es como el ojo por ojo del Antiguo Testamento y desde ese punto de vista podía considerarse algo descorazonador, pero de otra manera es una manera de cooperación sostenida entre egoístas y aunque todo el mundo la utilice en su propio beneficio si se enfrenta a una situación del tipo ‘dilema del prisionero’ también es una manera de fomentar que la otra persona coopere contigo haciéndole saber que si no lo hace habrá consecuencias”. El resultado final tras descubrir este aspecto cooperativo en la naturaleza humana ha originado una corriente de pensamiento que dice: «Si conocemos nuestra naturaleza podremos construir una sociedad mejor».

Deja un comentario