Mejor ajedrez

Una forma de promover el pensamiento especulativo.

“Improv Chess” es una idea para torneos de juegos que animaría a los participantes a confiar en el pensamiento especulativo y en lo que Shneiderman denomina pensamiento de frontera. En lugar de confiar en secuencias memorizadas o en pesas y pre-análisis cuidadosamente elaborados, este formato requiere que amplíe su conocimiento y sus ideas, y que descubra implicaciones y posibilidades.

La forma en que funciona en un torneo de ajedrez (o podrías sustituirlo por Go, backgammon, o damas o cualquier otro tipo de juego) es que te presentas listo para jugar al ajedrez, pero con un pequeño pellizco.

Los organizadores del torneo se reúnen por adelantado y seleccionan un pellizco. Identifican un pequeño cambio en las reglas, pero no anuncian ese cambio hasta que el torneo está a punto de comenzar.

¿Qué tipo de cambio? Puede ser que los peones ya no puedan comenzar saltando dos espacios, solo pueden saltar un movimiento. O torres extra reemplazaría a los caballeros. O el rey desaparece, dejando un cuadrado vacío, y la reina ahora es aún más central: ganas capturando a la reina del oponente. O hay un cuadrado en el medio, digamos D4, que no se permite que ocupe ninguna pieza.

Eso es. Un cambio de regla de última hora. Y de repente, los millones de juegos que los sistemas de Aprendizaje Automático juegan contra sí mismos se vuelven irrelevantes. Lo que importa es una apreciación inmediata de las limitaciones, oportunidades y nuevas estrategias. El formato favorece la adaptación y el descubrimiento sobre la compilación de casos anteriores.

En realidad, Bobby Fischer desarrolló su propio juego de ajedrez innovador, Fischer Random Chess, que logra casi el mismo resultado al que estoy apuntando. El esquema de Fischer está diseñado para eliminar el requisito de memorizar muchas y muchas aperturas de ajedrez.

Fischer Random Chess deja los peones donde suelen estar. Las piezas blancas restantes todavía están en el primer rango, pero se colocan al azar, con algunas restricciones: los obispos todavía están en cuadrados de colores opuestos. El rey blanco tiene que ir a algún lugar entre las dos torres blancas. Las piezas negras reflejan las piezas blancas.

Fischer Random Chess logra el mismo tipo de aleatoriedad que Improv Chess y es mucho más fácil de implementar. Sin embargo, Fischer Random Chess se refiere principalmente a las aperturas, mientras que Improv Chess puede resonar a lo largo de todo el juego si, por ejemplo, la casilla D4 nunca puede estar ocupada o el rey queda fuera de juego.

Otra ventaja del formato Improv es que se puede usar con otros juegos, incluidos juegos como Go y backgammon que no tienen una posición inicial. El formato de Improv puede servir como un complemento de prodigios digitales como AlphaZero (Campbell, 2018; Silver et al., 2018) que pueden enseñarse a sí mismos en casi cualquier juego (por ejemplo, ajedrez, shogi y Go).

Ben Shneiderman ha sugerido algunos formatos para hacer que los juegos de mesa sean más ambiguos, en lugar de tener la identidad y la ubicación de cada pieza claramente etiquetadas. Por ejemplo, en momentos aleatorios puede cambiar aleatoriamente una sola pieza a otra pieza. Me gusta esta idea, usar una computadora de administración para hacer sustituciones de piezas en puntos aleatorios del juego. Las sustituciones de piezas tendrían que ser legales, por supuesto. También serían simétricos: la misma sustitución a nivel de punto se haría simultáneamente para ambos jugadores. Tal procedimiento convertiría un juego en una verdadera lucha, favoreciendo a los astutos que podrían adaptarse mejor a lo largo del juego.

Ben también sugirió tener un cuarto del tablero cubierto para cada jugador para que el otro tenga un conocimiento incompleto. Ese procedimiento inyectaría incertidumbre en el juego. Se parece al juego Kriegspiel, que es una variante del ajedrez. En Kriegspiel, juego un adversario pero ninguno de los dos ve a dónde se ha movido la otra persona. Cada uno de nosotros tiene un tablero de ajedrez frente a nosotros y movemos nuestras propias piezas. Un árbitro nos observa a los dos e ingresa cada movimiento en una tabla maestra; el árbitro informa a los jugadores si han hecho un movimiento ilegal o han hecho una captura. El juego continúa hasta que alguien gane por jaque mate. El juego fue algo popular en la Corporación RAND hace unas décadas. Algunas personas se sintieron frustradas y dijeron que era aleatorio. Otros dijeron que había estrategias reales, eran los que normalmente ganaban sus partidos. Kriegspiel tiene limitaciones logísticas: necesita más espacio y equipo (las tres tablas) más los servicios de un árbitro.

Una regla del torneo de Improv debería ser que los participantes puedan traer computadoras portátiles pero no puedan conectarse a supercomputadoras que puedan jugar rápidamente un millón de veces para aprender las nuevas reglas modificadas; Las computadoras portátiles en sí tendrían prohibido participar en este tipo de aprendizaje automático.

El motivo de esta estipulación es que quiero que el formato de Mejora enfatice la comprensión conceptual y el razonamiento causal en lugar del razonamiento correlacional que implementa actualmente Machine Learning.

Algunos de los enfoques de Aprendizaje automático más poderosos se basan en técnicas estadísticas para clasificar patrones utilizando redes neuronales con múltiples capas, comúnmente descritas como Aprendizaje Profundo. Estos son los enfoques responsables de los avances espectaculares en el reconocimiento de voz, el reconocimiento de imágenes, la traducción de idiomas y el juego para Go y otras actividades. Así que no hay que negar sus logros. Pero como señala Marcus (2018), “profundo” se refiere al gran número de capas, no a una mayor abstracción. Marcus usa el ejemplo del juego de Atari “Breakout”, que se resuelve con un sistema en aproximadamente cuatro horas de entrenamiento: el sistema aprende a cavar un túnel a través de una pared de ladrillos. Sin embargo, el sistema no tiene idea de qué es un túnel o qué es una pared. Y cuando los investigadores de IA hacen una ligera perturbación, como mover la altura de la paleta o insertar una pared en la mitad de la pantalla, los sistemas de AI fallan. No son adaptativos. El estado actual de la técnica no es capaz de manejar Improv Chess.

Quizás el uso de los formatos de Improv le dé a los humanos una ventaja; tal vez animará a los informáticos a seguir presionando en su búsqueda para agregar razonamiento de sentido común y diagnósticos conceptuales a sus sistemas. En cualquier caso, visualizo el formato de Improv como un medio para celebrar y fortalecer capacidades inteligentes como el pensamiento especulativo y el pensamiento de frontera que actualmente se pasan por alto.

Referencias

Campbell, M. (2018). Dominar los juegos de mesa. Science, 362, 1118.

Marcus, G. (2018). Aprendizaje profundo: una valoración crítica. preimpresión arXiv arXiv: 1801,00631, 2018 – arxiv.org.

Silver, D., Hubert, T., Schrittwieser, J., Antonoglou, I., Lai, M., Guez, A., Lanctot, M., Sifrre, L., Kumaran, D., Graepel, T., Lillicrap, T., Simonyan, K., y Hassabis, D. (2018). Un algoritmo de aprendizaje de refuerzo general que domina el ajedrez, el shogi y el juego de autoservicio. Science, 362, 1140-1144.