La teoría de la felicidad fuera de la política

Por qué los filósofos están de acuerdo en lo que se necesita para ser feliz.

Wikimedia commons.

Fuente: Wikimedia Commons.

Yo era un estudiante de segundo año en la universidad cuando me di cuenta de que mis padres nunca me habían dicho: “Hijo, solo queremos que seas feliz”. Parecía que los padres de todos los demás les habían dicho que hicieran lo que hicieran, estaba bien siempre y cuando los hizo felices ¿Por qué, me preguntaba, mis padres nunca me habían dicho esto?

Inmediatamente entendí cuando encontré un pasaje de la autobiografía de John Stuart Mill.

Mill era un tipo interesante. Tenía uno de los CI más altos en la historia de la humanidad (no tenían pruebas de inteligencia en ese momento, pero los historiadores psicológicos han intentado reconstruir su cociente intelectual a partir de otra evidencia). Su padre, el venerable historiador James Mill, comenzó a enseñarle griego antiguo a la edad de tres años. A las ocho, ya había leído todas las historias de Herodoto en el original. Así que pensé que la historia de su vida podría ser una lectura interesante. Pero no lo es. Su autobiografía es una fiesta de snooze total. Según recuerdo, el trabajo es una compilación exhaustiva de las cosas menos interesantes que Mill haya leído, visto o contemplado alguna vez. Un pasaje representativo: “Cuando tuvimos suficiente economía política, retomamos la lógica silogística de la misma manera, Grote se unió a nosotros. Nuestro primer libro de texto fue Aldrich, pero disgustado con su superficialidad, reimprimimos uno de los más completos entre los muchos manuales de lógica escolar, que poseía mi padre, un gran coleccionista de dichos libros, el Manduuctio ad Logicam del Jesuita Du Trieu. Después de terminar esto, retomamos la Lógica de Whately, luego la republicamos por primera vez desde la Enciclopedia Metropolitana , y finalmente la Computación Logica de Hobbes. “Por el amor de Dios, John. ¿A quien le importa?

Aunque no estoy muy seguro de por qué, avancé penosamente. Y estoy feliz de haberlo hecho.

Pero para entender lo que dice Mill acerca de la felicidad, primero necesita comprender un concepto de la inteligencia artificial. Se llama aprendizaje de refuerzo.

La idea básica del aprendizaje de refuerzo es simple. Es un método para diseñar un agente, ya sea una persona, un robot o un programa informático, para comportarse de forma inteligente. La definición de inteligencia aquí es lo que los informáticos llaman “maximización de la recompensa”. En pocas palabras, hay algo que desea, y el comportamiento inteligente consiste en obtener la mayor cantidad de información posible. Por ejemplo, si su agente es un robot que juega baloncesto, entonces su recompensa viene en forma de puntos. Cuantos más cestos haga el robot, más puntos obtiene y más inteligente se comporta. El aprendizaje de refuerzo es una solución matemática a la forma en que el robot aprendería a adquirir más y más puntos.

En el corazón del aprendizaje de refuerzo se encuentra lo que se conoce como una “política”. Es el libro de jugadas del robot. Una política dice, en abstracción matemática, “Aquí es donde estoy ahora. Esto es lo que tengo que hacer a continuación para maximizar mi recompensa “. En el baloncesto, una buena política podría ser conseguir la pelota, driblarla hacia la canasta y tirar en un lay-up. Cada vez que el robot hace esto, observa qué tan efectiva era para obtener puntos, y ajusta su comportamiento para mejorar la próxima vez. El robot podría comenzar mal, pero usando el refuerzo de aprendizaje podría mejorar con el tiempo. Eso es lo que la inteligencia significa aquí; con el tiempo, se mejora cada vez más en el logro de su objetivo.

La idea puede ser simple, pero todos los matices del aprendizaje de refuerzo provienen precisamente de cómo se aprende esa política. Por ejemplo, ¿es la mejor política para avanzar hacia la canasta? ¿O debería sentarse y disparar saltadores? ¿Cómo sabes qué va a funcionar mejor la próxima vez? ¿Funcionará la misma política contra un oponente diferente?

Hay dos estrategias generales para aprender una política. El primero se llama on-policy . Es la más directa de las dos estrategias. On-policy significa que el robot usa la misma información para tomar decisiones y evaluar si fueron buenas o no. Si su política dice que debe avanzar hacia la canasta y eso genera muchos puntos, entonces será más probable que continúe con la misma política en el futuro. La segunda estrategia se llama fuera de política . Esto significa que el robot está usando información diferente para tomar decisiones que ella para evaluarlas. El agente puede tomar decisiones basadas, por ejemplo, en su tiempo de posesión de la pelota. Luego podría mirar hacia atrás en su juego en función de esa política y ver si centrarse en otra cosa en realidad aumentó su cantidad de canastas al final.

Al principio, podría parecer que la mejor estrategia siempre será la política. ¿Cómo podría sumar más puntos centrándose en algo totalmente irrelevante? Pero eso no es necesariamente cierto. El hecho empírico en la investigación de inteligencia artificial es que algunos problemas se resuelven mejor con métodos fuera de la política. A veces, la mejor manera de alcanzar un objetivo es indirectamente.

Esto es precisamente lo que Mill discute sobre la felicidad. La forma de maximizar tu felicidad, por así decirlo, es apuntar a otra cosa. Dedícate a algo más grande que tu propia felicidad. Trabaja duro en eso. Luego mirará hacia atrás y se dará cuenta de que ha estado acumulando felicidad todo el tiempo. Mill escribe,

“Los placeres de la vida son suficientes para que sea agradable cuando se toman de pasada sin que se conviertan en un objetivo principal. Una vez que los hagas así, inmediatamente sentirás que son insuficientes. No realizarán un examen escrutinio. Pregúntate si eres feliz y dejas de serlo. La única posibilidad es que tengas como tu propósito en la vida no la felicidad sino algo externo a ella. Deje que su autoconciencia, su escrutinio, su auto-interrogación, se agoten en eso; y si, afortunadamente, estás en alguna circunstancia, inhalarás la felicidad con el aire que respiras, sin pensar en ello, evitarlo en la imaginación o ponerlo en fuga con preguntas fatales “.

En otras palabras, la estrategia on-policy no funciona para la felicidad. Si tratas de maximizarlo directamente, entonces estarás peor que si hubieras tomado un enfoque diferente. La felicidad es uno de esos problemas que funciona mejor con la estrategia fuera de la política. Tiene que haber una separación entre acción y evaluación. Si está utilizando su propia felicidad como una medida para evaluar su próxima decisión, el alcance de su preocupación no puede extenderse más allá de sus propios sentimientos. En cambio, argumenta Mill, concéntrate en algo más grande que tú mismo y te despertarás un día para darte cuenta de que inhalas felicidad con el aire que respiras .

La razón, entonces, por la que mis padres nunca me dijeron que buscara la felicidad directamente era que, al igual que Mill, creían en un enfoque de felicidad fuera de la política. Cuando alguien le dice que debe “hacer lo que le hace feliz”, aboga por un enfoque de política para las decisiones de toma de la felicidad y evaluarlas con la misma métrica. Eso es exactamente lo que mis padres no querían que hiciera. Y aunque mis padres no aprendieron esto leyendo a Mill, lo sorprendente de esta posición sobre la felicidad es que la comparten, en una u otra versión, prácticamente todos los demás filósofos que han intervenido en el asunto.

Una de mis cuentas favoritas de este pertenece a Bertrand Russell. Más o menos dice lo mismo que Mill, pero con un cierto estilo de despreocupación en contraste con la solemne pesadez de Mill. Russell escribe en The Conquest of Happiness , “La felicidad fundamental depende más que nada de lo que puede llamarse un interés amistoso en las personas y las cosas”. Continúa, “deja que tus intereses sean lo más amplios posible, y deja que tus reacciones a las cosas y las personas que te interesan son, en la medida de lo posible, amigas más que hostiles “.

La felicidad, en otras palabras, es el resultado natural de la observación de que hay muchas personas y cosas en el mundo en las que vale la pena interesarse amigablemente, y solo una de ellas es usted mismo. Es con esta idea en mente que quiero escribir este blog.

Referencias

Mill, JS (1873/2003). Autobiografía. Proyecto Guternberg.

Russell, B. (1930). La conquista de la felicidad Nueva York, NY: Liveright Publishing Corp.