¿Puede un “físico de la IA” superar a Einstein?

El sistema AI de MIT es capaz de derivar leyes de la física en mundos misteriosos.

geralt/pixabay

Fuente: geralt / pixabay

La física es un campo científico importante, es una ciencia fundamental con principios que afecta a otras ramas de las ciencias naturales. Explica la naturaleza y propiedades de la materia, la energía, el movimiento y la fuerza. Las leyes de la física tienen relevancia en el mundo real y se implementan en productos y servicios utilizados en la vida moderna cotidiana. Las leyes de la física, que van desde automóviles, aviones, teléfonos inteligentes, audífonos, hasta balancines, afectan la forma en que vivimos. Recientemente, un equipo de investigación del Instituto de Tecnología de Massachusetts (MIT) creó un sistema de inteligencia artificial (IA) que implementa heurísticas de los físicos de siglos de antigüedad para derivar las leyes de la física a partir de mundos complejos y simulados. ¿Puede un físico de aprendizaje automático comprender las leyes naturales de nuestro mundo mejor que un físico humano?

La física aplicada ha aportado innovación en óptica, energía, electrónica, láseres, lidar, computación, resonancia magnética, sonar, radar, semiconductores, ciencia de materiales, propulsión electromagnética y exploración espacial. La física interdisciplinaria incluye neurofísica, psicofísica, acústica, nanotecnología, biofísica, astrofísica y econofísica. Los avances en física tienen oportunidades comerciales en el mundo real.

El equipo de investigación de Tailin Wu y Max Tegmark en el MIT incorporó cuatro estrategias que los físicos utilizan comúnmente: divide y vencerás, la navaja de Occam, la unificación y el aprendizaje de por vida en el desarrollo de su algoritmo para el Físico de la IA.

Los físicos a lo largo de los siglos nos han proporcionado teorías para explicar el fenómeno natural y nuestro universo, como la mecánica cuántica, la relatividad general, la ley de Newton de la gravitación universal, el Big Bang, la teoría M, la teoría de supercuerdas, la teoría de la gran unificación, la teoría de BCS y la teoría de Bloch. para nombrar unos pocos. Wu y Tegmark utilizaron un enfoque innovador que se centra en el aprendizaje automático y el procesamiento de teorías, en lugar del método estándar de aplicar un modelo grande único a todos los datos.

Wu y Tegmark implementaron una estrategia de dividir y vencer para encontrar teorías individuales a partir de observaciones complejas. El algoritmo aprende varias teorías que describen parte de los datos generales. Cada teoría es recomendada algorítmicamente para que se especialice en su dominio respectivo al recompensar los gradientes más grandes para obtener mejores teorías.

La maquinilla de afeitar de Occam, también conocida como la ley de la parsimonia, es un enfoque de resolución de problemas que cuando se dan múltiples hipótesis, es más probable que la que tenga la menor cantidad de suposiciones sea la correcta. En otras palabras, cuanto más simple sea la explicación, mejor. La maquinilla de afeitar de Occam se incorporó al minimizar matemáticamente la longitud total de la descripción en el algoritmo. Específicamente, el método utilizó la teoría de inferencia de Solomonoff vinculada al enfoque AIXI de Hutter para la inteligencia general artificial.

Al utilizar el concepto estratégico de unificación, Wu y Tegmark introdujeron parámetros específicos con el objetivo de unificar las teorías aprendidas. Se trata de identificar similitudes fundamentales entre varias teorías y reunirlas en una teoría global. El objetivo deseado es tener una teoría maestra que pueda generar un continuo de teorías.

El equipo integró el concepto de aprendizaje a lo largo de la vida en la arquitectura para que el conocimiento se acumule y las experiencias pasadas se conserven. El modelo recuerda las soluciones aprendidas y las prueba sobre problemas futuros.

El agente de aprendizaje automático no supervisado resultante, llamado “Físico de IA”, se probó en entornos físicos cada vez más complejos en mundos simulados que tenían combinaciones aleatorias de movimiento armónico, rebotes elásticos, gravedad y electromagnetismo.

El equipo creó 40 mundos “misteriosos” con leyes naturales de la física que variaban de un lugar a otro. En el experimento, además de probar el Físico de IA, Wu y Tegmark tenían un agente de “línea de base”, y un Físico de AI “recién nacido” que no había estado expuesto a ejemplos anteriores, y por lo tanto una estrategia de aprendizaje permanente no tuvo impacto. Tanto Newborn como AI Physicist mostraron capacidades para resolver más del 90 por ciento de los 40 mundos misteriosos. El equipo descubrió que al igual que con los científicos humanos, una estrategia de aprendizaje de por vida ayuda al Físico de la IA a rendir mejor y aprender más rápido con menos datos en nuevos entornos.

Fuera de todos los campos científicos, la física es, sin duda, uno de los mejores para aplicar inteligencia artificial. El universo es intrínsecamente complejo, y el aprovechamiento de las capacidades de reconocimiento de patrones del aprendizaje automático no supervisado podría revelar algunas ideas novedosas. Wu y Tegmark buscan “mejorar las técnicas para simplificar las complejas redes neuronales aprendidas”. Planean reducir y simplificar aún más la futura arquitectura de modelo de AI Physicist para mejorar tanto la velocidad como la precisión de los futuros agentes de aprendizaje automático sin supervisión.

Según los investigadores, el Físico de la IA “normalmente aprende más rápido y produce errores de predicción de media cuadrática aproximadamente mil millones de veces más pequeños que una red neuronal de alimentación comparable de complejidad comparable”.

¿Puede el físico de la IA evolucionar para comprender las leyes naturales de nuestro mundo mejor que un físico humano? Mira este espacio con el tiempo.

Copyright © 2018 Cami Rosso Todos los derechos reservados.

Referencias

Wu, Tailin, Tegmark, Max. “Hacia un físico de IA para el aprendizaje no supervisado”. ArXiv : 1810.10525. 6 de noviembre de 2018. Obtenido el 12-19-2018 de https://arxiv.org/pdf/1810.10525.pdf