Rock-Paper-Scissors es más profundo de lo que creías

Cuando era niño, muchos de nosotros resolvíamos disputas (por ejemplo, quién iba primero en la diapositiva) jugando a un juego simple llamado Piedra-Papel-Tijera. El juego es simple: golpeas tu puño cerrado en la mano tres veces mientras cantas "piedra-papel-tijera", y luego indicas tu elección haciendo un puño para representar "roca", apuntando tu índice y tu dedo medio para representar "tijeras, "O abriendo la mano para representar" papel ". La regla para ganar también fue simple: tijeras de piedra triturada, tijeras de papel cortado y roca cubierta de papel. Si todos hicieran la misma elección (todos eligieron "rock"), era un empate, y el juego se jugó nuevamente hasta que un ganador salió triunfante.

Lo que probablemente no sabía es que el rock-paper-scissors es un juego fundamental no cooperativo que ha sido ampliamente utilizado por los teóricos del juego para estudiar fenómenos de competencia tan variados como la diversidad de especies de los ecosistemas y la dispersión de precios en los mercados. Debido a que ninguna opción es absolutamente mejor que cualquiera de las otras, un agente racional elige una de las tres opciones al azar en cada ronda para evitar ser predecible y, por lo tanto, ser explotado por los otros jugadores. Después de todo, si siempre eliges "rock", otros jugadores lo resolverán y siempre eligen "papel" para poder ganarte. Eso significa que cada agente racional tiene 1 de 3 posibilidades de ganar en cualquier ronda. En teoría de juegos, esta estructura del juego se conoce como estrategia mixta Nash Equilibrium. La teoría de juegos recientemente catapultó a la atención nacional cuando Arthur Chu lo utilizó para ganar una serie de juegos de Jeopardy.

Pero la teoría de juegos evolutiva basada en el concepto de racionalidad limitada predice un resultado diferente: predice el comportamiento cíclico, no la selección aleatoria , especialmente para poblaciones finitas. El economista Herbert Simon propuso la noción de racionalidad limitada para explicar cómo lo que cuenta como racional depende de la información que tienen los que toman las decisiones, la cantidad de tiempo disponible para tomar una decisión y las limitaciones cognitivas o computacionales de sus mentes. Este es un concepto crucial porque la teoría de juegos y otros modelos económicos de toma de decisiones racionales lo definen como optimización, es decir, encontrar la solución óptima dado el tiempo, los recursos y la capacidad informática ilimitados. La toma de decisiones rara vez cumple con estas condiciones, por lo que las personas optan por simplificar sus elecciones y explotar los patrones ambientales (o contingencias) que permiten llegar a una solución satisfactoria, en lugar de óptima. Por esta razón, la toma de decisiones humanas a menudo se describe como más satisfactoria que optimizadora . Y, dicho todo esto, esta estrategia a menudo nos sirve bastante bien.

Un estudio reciente analizó cómo la gente juega rock-paper-tijeras y descubrió que, sí, las personas se comportan más como satisfactores biológicos que optimizadores racionales, adoptando una estrategia cíclica en lugar de la estrategia de elección aleatoria consistente con la teoría de juegos. Sin embargo, lo sorprendente es que esta estrategia de respuesta condicional produce mejores resultados que la estrategia mixta Nash Equilibrium.

Los investigadores reclutaron un total de 360 ​​estudiantes de diferentes disciplinas de la Universidad de Zhejiang y los dividieron en grupos de 60. Luego, cada grupo jugó 300 rondas de piedra-papel-tijeras (sí, trescientas rondas). Después de que se jugó el juego final, a los jugadores se les pagaba en efectivo proporcionalmente a sus ganancias acumuladas.

Los investigadores encontraron que cuando los jugadores ganaban una ronda usando una opción en particular (por ejemplo, "rock"), era más probable que se quedaran con esa opción ganadora en la siguiente ronda. Pero si perdían, tendían a cambiar a una de las otras opciones, y la opción que elegían era consistente con lo que superaría la elección que acababan de hacer. Por lo tanto, si se eligió "rock" y se golpea con "papel", el jugador probará "papel" en la siguiente ronda, y así sucesivamente.

Esto significa que las elecciones de los jugadores estaban condicionadas a lo que se jugó y al resultado de esa elección. Esta estrategia de "ganar-quedarse, perder-cambio" se conoce en la teoría de juegos como una respuesta condicional, y cuando se juega con poblaciones estables (como se hizo en este estudio), resultó ser muy exitoso: la estrategia condicional superó al Nash Equilibrio estrategia mixta en pago hasta en un 10 por ciento. Los investigadores se refirieron a esta estrategia de "ganar-quedarse, perder turno" como "socialmente eficiente". También se la conoce como una "estrategia de Pavlov", y se ha demostrado que facilita la cooperación en los juegos de Prisoners Dilemma.

Aún más interesante es que se observaron patrones de ciclismo similares en estudios relacionados con juegos que emplearon más de tres opciones … como rock-paper-scissors-lizard-spock.

Copyright 2 de mayo de 2014 Dra. Denise Cummins

El Dr. Cummins es psicólogo investigador, miembro de la Asociación de Ciencias Psicológicas y autor de Good Thinking: Siete ideas poderosas que influyen en la forma en que pensamos.

Se puede encontrar más información sobre mí en mi página de inicio.

Sigueme en Twitter.

Y en Google + .