Consejos para un campeón

El mundo de Go está en estado de shock, como hemos informado en una publicación anterior. Por primera vez, un programa de computadora ha derrotado a un jugador profesional. El programa informático detrás de esta hazaña, AlphaGo, es desarrollado por Google Deep Mind, y utiliza varias técnicas de vanguardia (ver nuestra publicación anterior para más detalles). El resultado fue pionero porque Go – un juego asiático con muchas más posibilidades que el ajedrez – fue visto como el santo grial de la inteligencia artificial. Se pensó que las computadoras deberían poder mostrar la intuición para jugar en un nivel superior; ahora parece que pueden hacerlo.

Las cosas podrían empeorar muy pronto para la humanidad. Desde el 9 de marzo hasta el 15 de marzo, AlphaGo jugará contra 9-dan Lee Sedol (Corea del Sur), uno de los mejores jugadores del mundo. El partido tendrá lugar en Seúl y se jugará en cinco juegos, con un premio de $ 1 millón. ¿Lee Sedol defenderá el último bastión del orgullo humano contra la IA?

Fernand Gobet
Fuente: Fernand Gobet

Corea del Sur es uno de los principales países de Go, donde se lo llama "baduk" en lugar del nombre japonés. (Quizás AlphaGo debería ser renombrado AlphaBaduk para este partido). Lee Sedol, de treinta y tres años, confía en que ganará, pero la comunidad Go no está tan segura.

En el lado positivo, Lee Sedol es mucho más fuerte que Fan Hui, el 2-dan profesional y campeón de Europa que perdió 0-5 ante AlphaGo en octubre pasado. La diferencia es similar a la diferencia, en el ajedrez, entre un Maestro y un Gran Maestro superior. Se espera que Lee Sedol gane la mayoría de los juegos contra Fan Hui.

En el lado negativo, Fan Hui perdió todos los juegos del partido, lo que indica claramente que AlphaGo es muy superior a un profesional de 2 dan. También es probable que Google Deep Mind use una versión mejorada. Por ejemplo, AlphaGo ha aprovechado cinco meses adicionales de aprendizaje desde octubre, con más juegos maestros, para mejorar su evaluación de las posiciones y su selección de movimientos. También podría usar hardware más potente, y también emplear una base de datos de apertura, que no hizo en la partida anterior. Esto le permitiría aprovechar el conocimiento humano en los primeros movimientos y así evitar líneas de apertura inferiores.

¿Qué estrategia debería adoptar Lee Sedol?

Algunos podrían afirmar despectivamente que la ejecución de presión es "todo en tu cabeza", pero, como reveló un nuevo estudio (Chib, Shimojo y O'Doherty, 2014), la presión deja una huella neurológica real que induce a las personas a "ahogarse" y actuar por debajo de su nivel de habilidad. Sedol estará bajo considerable presión psicológica durante el partido, dada la atención mundial que despertará. Parece confiado y ya habla de una revancha, que es una buena actitud a menos que se convierta en exceso de confianza. En su partido contra Deep Blue en 1997, el campeón mundial de ajedrez, Gary Kasparov, no manejó bien la presión y cometió graves errores (Hsu, 2002). Hay varias técnicas que Sedol puede usar para prepararse psicológicamente. Él puede jugar contra los programas de computadora, para que se acostumbre a jugar máquinas. Como los programas de computadora disponibles son mucho más débiles que AlphaGo, debe seleccionar posiciones difíciles que luego jugaría contra la computadora; esto incluye juegos en los que comienza con una discapacidad importante. Obviamente, debería practicar con el control de tiempo acordado para el partido.

Si es posible, debe ver los juegos jugados por Alpha-Go para que pueda identificar debilidades específicas. Idealmente, el contrato del partido debería haber estipulado que el equipo Alpha-Go debería proporcionar tales juegos regularmente durante la preparación del partido. Dada la publicidad que creará el concurso, dudamos que este sea el caso. En general, la fortaleza de AlphaGo también es su debilidad: necesita millones de posiciones para aprender y usa una gran cantidad de juegos maestros, porque hay muchos menos juegos de jugadores de alto nivel compitiendo entre sí. Por lo tanto, su juego se basa en el juego de maestros en lugar de jugadores de nivel superior. Los maestros son obviamente más débiles que los jugadores de alto nivel, y un jugador de talla mundial como Lee Sedol debería poder aprovechar este conocimiento relativamente inferior. Sin embargo, AlphaGo también aprende por el juego propio. Hasta qué punto esto compensa el tipo de juegos utilizados para el aprendizaje se desconoce, y bien podría ser el factor decisivo del partido.

Si bien es excelente en el reconocimiento de patrones, que a menudo se considera como el sello distintivo de la experiencia humana (Gobet, 2015), AlphaGo es más débil cuando se trata de buscar con anticipación. Esto se debe a que la forma en que realiza la búsqueda es estadística en lugar de examinar líneas críticas. En este sentido, es lo opuesto a Deep Blue, que fue optimizado para una búsqueda precisa. Lee Sedol podría aprovechar esto eligiendo posiciones que contengan variaciones tácticas, donde el juicio depende de unos pocos movimientos críticos. La búsqueda estadística de AlphaGo puede pasar por alto estas sutilezas y buscar las líneas que son apoyadas por la gran mayoría de movimientos, pero refutadas por un solo movimiento.

Para Lee Sedol, el dilema será si debería jugar como lo haría contra los humanos o cambiar su estilo para aprovechar las debilidades de AlphaGo. Hay peligro al hacer esto último. La investigación sobre el ajedrez ha demostrado que los jugadores, cuando juegan fuera del estilo en el que se especializan, se desempeñan en un nivel más débil (Bilalić, McLeod y Gobet, 2009). Esta conclusión es probable que se aplique a Go también. Además, tratar de anticipar el modo de pensar de AlphaGo involucrará recursos cognitivos que luego no se utilizan para jugar Go well.

A pesar de los formidables poderes computacionales de AlphaGo y sus notables habilidades de reconocimiento de patrones, Lee Sedol tiene una comprensión mucho más profunda del juego. Por lo tanto, dadas las incertidumbres sobre la verdadera fuerza de AlphaGo, nuestro consejo para él es comenzar el partido jugando al tipo de juego en el que normalmente se destaca. Solo si las cosas se ponen feas debe tratar de aplicar métodos destinados a aprovechar directamente las debilidades (supuestas) de AlphaGo.

Fernand Gobet y Morgan Ereku

Referencias

Bilalić, M., McLeod, P., y Gobet, F. (2009). Efecto de especialización y su influencia en la memoria y resolución de problemas en ajedrecistas expertos. Cognitive Science, 33 , 1117-1143.

Chib, V., Shimojo, S., y O'doherty, J. (2014). Los efectos del encuadre de incentivos en los decrementos de rendimiento para grandes resultados monetarios: mecanismos conductuales y neuronales. The Journal of Neuroscience, 34 , 14833-14844.

Gobet, F. (2015). Comprensión de la experiencia: un enfoque multidisciplinario . Londres: Palgrave.

Hsu, F.-H. (2002). Detrás de Deep Blue: construir la computadora que derrotó al campeón mundial de ajedrez . Princeton, Nueva Jersey: Princeton University Press.