Divide y conquistaras

J. Krueger
La proporción áurea
Fuente: J. Krueger

Escribí este ensayo con Patrick Heck.

En relación erat de principio . ~ St. John, pseudepigraphical

Este ensayo trata sobre un problema matemático aparentemente simple, que, creemos, tiene implicaciones psicológicas de gran alcance. Antes de adentrarnos en el asunto, comencemos por San Juan, quien abre su evangelio igualando el Logos con Dios. Logos es un concepto griego antiguo de enorme gravedad. Puede referirse a palabras, frases, significado o comunicación, pero también al orden divino de la naturaleza y la ley natural. Incluso se podrían ver similitudes entre el Logos griego antiguo y el Tao del este. En el oeste moderno, Logos se reduce a La Palabra, una degradación que comenzó con el testamento Vulgata (latín), que hace que Logos sea Verbum. Solo imagina, dios es un verbo. Fuera de la Biblia, los latinos representaban el Logos como Ratio, y allí nos metimos en el meollo de las cosas. De la relación obtenemos racionalidad y racionalidad, el estándar de oro de pensamiento, el más alto alcance del funcionamiento psicológico.

Otro significado de relación se refiere al resultado de la división, lo que obtienes al fraccionar. Pero, ¿cuán diferente es este estrecho significado matemático del cognitivo psicológico? Siguiendo a Posner (1973), que definió el pensamiento como imaginando lo que no se da de inmediato (el estímulo) y considerando sus relaciones, Dawes (1988) diagnosticó el pensamiento relativo, comparativo y fraccionador como el corazón de la racionalidad. De ese modo, Dawes incrustó la creación de proporciones en el logro de la racionalidad. En la psicología del juicio y la toma de decisiones, las razones y su supuesta racionalidad en su mayoría vienen como parte de un argumento Bayesiano mayor. El reverendo Bayes enseñó cómo tener una mente bien educada, una mente que no se contradiga a sí misma.

Recuerdo que fue anteayer, cuando un compañero de clase en la escuela de postgrado resumió un artículo de McCauley y Stitt (1978), que pretendía mostrar que los estereotipos sociales son bayesianos, es decir, que son relativos. Considera los japoneses. Tienen, gracias a Dios, una tasa baja de suicidio, pero esta tasa puede ser, y puede percibirse como, un poco mayor que en el resto del mundo, o en su propio país si no es Japón. Digamos que la prevalencia percibida de suicidio en Japón es del 3%, mientras que es del 1% en Luxemburgo. Según McCauley & Stitt, este diferencial de percepción hace que el suicidio sea estereotípico para los japoneses y contraestenotípico de los luxemburgueses y debería expresarse como una relación de diagnóstico ; aquí 3/1. McCauley y Stitt argumentaron que el índice de diagnóstico es una medida mejor y más verdadera de los estereotipos que el buen valor porcentual anticuado obtenido para los japoneses. Efectivamente, encontraron que las razones de diagnóstico se correlacionan con las clasificaciones de tipicidad ("¿Qué tan típico es suicidarse de los japoneses?"), Pero en una búsqueda sostenida de una década, mis colegas y yo demostramos que el numerador (% japonés) hace todo el trabajo, mientras que el denominador (% luxemburgueses) degrada la medida en lugar de agudizarla (revisado en Krueger, 2008). Las estimaciones de porcentajes simples para un grupo están más altamente correlacionadas con las clasificaciones de características típicas que las razones de diagnóstico. Podemos ver esto incluso en los propios datos de McCauley & Stitt.

¿Por qué McCauley y Stitt creen que las razones de diagnóstico son superiores? Partieron de la premisa, una creencia previa que podría decirse, de que toda la cognición, y por tanto la cognición social, es bayesiana. Esto significa que las creencias pueden expresarse de forma probabilística y que un conjunto de creencias es, o al menos debería serlo, coherente a la manera de Bayes. En el teorema de Bayes, la relación entre la probabilidad de que una persona japonesa muera por suicidio, p (S | J), dividida por la probabilidad de que un luxemburgués muera por suicidio, p (S | L), sea igual a la proporción de clasificación posterior, es decir, la probabilidad de que un suicidio sea japonés, p (J | S), sobre la probabilidad de que un suicidio sea luxemburgués, p (L | S), si se multiplica por la relación de la probabilidad previa de que una persona Japonés, p (J), sobre la probabilidad previa de que una persona sea luxemburguesa, p (L). En otras palabras, el teorema de Bayes exige el cálculo de una relación de probabilidades condicionales para que una persona pueda clasificarse como japonesa o luxemburguesa, dadas sus probabilidades diferenciales de suicidio. Elegante como el método de Bayes, no es una buena descripción de cómo la gente percibe la tipicidad de los diversos rasgos en los grupos sociales.

McCauley y otros más tarde pasaron de las proporciones a los puntajes de diferencia sin mucho comentario. De cualquier manera, probablemente pensaron que tomar en cuenta la forma en que se percibe un grupo de comparación solo puede mejorar la medición y la predicción. Sin embargo, los puntajes de proporción y diferencia difieren de manera importante. Primero, las relaciones están limitadas por 0 en el piso, pero no tienen techo. Mientras que 1.0 es el punto medio, bajar el numerador no puede hacer que la relación sea negativa, mientras que al bajar el denominador se puede mover la relación hacia el infinito. Esta asimetría produce distribuciones altamente sesgadas. Por el contrario, las puntuaciones de diferencia se ajustan a una distribución modesta y simétrica alrededor de 0, donde el máximo es X max – Y max . En segundo lugar, y de forma relacionada, el tamaño de la relación nos permite estimar el tamaño del denominador. Si la proporción es muy grande, el denominador probablemente sea muy pequeño. Sin embargo, un puntaje de diferencia muy grande nos dice que tanto el numerador como el denominador están cerca de los puntos finales de sus escalas, pero en los extremos opuestos. En el nivel intuitivo-conceptual, las proporciones parecen "relativizar" la variable en el numerador, mientras que los puntajes de diferencia parecen "corregirla".

La fascinación por los puntajes "relativos" o "corregidos" es profunda, al menos por dos razones. Una razón es que el teorema de Bayes proporciona un estándar para el pensamiento racional. El pensamiento racional es coherente, y el teorema de Bayes garantiza que las piezas encajan. Si se descuida o se ignora una probabilidad por completo, ya no se puede garantizar el ajuste coherente y se puede desatar todo el infierno mental (Thomas Bayes era un clérigo). La otra razón es la intuición cotidiana. Esta intuición es algo divertido. Dice, por ejemplo, que "más información es siempre mejor", pero luego tiende a ignorar sus propios consejos cuando hace juicios intuitivos. Bayesianos y otros correctores y relativizadores aprovechan la intuición de que hay algo mejor cuando profesan aborrecimiento ante la idea de que las simples claves heurísticas pueden funcionar bien como herramientas de decisión. Según su filosofía, el juicio racional debe dividir (o restar) porque si no lo hace dejaría información sobre la mesa, y eso tarde o temprano provocaría un caos.

Los puntajes relativos tales como razones o diferencias son útiles si lo hacen mejor que cualquiera de sus componentes simples al predecir una tercera variable. Una razón de por qué no pueden hacer esto es que están confundidos con sus componentes. La puntuación de diferencia es más fácil de entender que las razones. Así que comencemos allí. Los libros de texto de estadísticas nos enseñan que las diferencias están correlacionadas positivamente con la variable de la que restamos, y se correlacionan negativamente con la variable restada (McNemar, 1969). La correlación, r , es positiva entre X y X – Y, y es negativa entre Y y X – Y.

J. Krueger
Fuente: J. Krueger

Dejando de lado las varianzas, o asumiendo que son las mismas para X e Y, podemos ver que el numerador es probable que sea positivo y que será más positivo a medida que la correlación entre X e Y caiga o se vuelva negativa.

P. Heck
Ratios trazados contra su numerador
Fuente: P. Heck

¿Qué, sin embargo, se puede decir acerca de las proporciones? ¿Se correlacionará positivamente la relación X / Y con su numerador X? ¿Cómo no puede ser así? A medida que X aumenta, entonces, ceteris paribus , X / Y debe aumentar también. Bueno, al principio no parece funcionar de esa manera. Realizamos simulaciones por computadora que permitieron que X e Y alcancen una distribución uniforme de 0 a 1. También variamos la correlación entre X e Y, pero eso no importó mucho. En cada simulación, la mayoría de los valores de X / Y estaban cerca de 1, mientras que unos pocos eran mucho más grandes e incluso menos eran extremadamente grandes. Este resultado confirma la idea de que la división produce una distribución muy sesgada. Sesgar en uno

P. Heck
Desviación positiva (derecha) cuando X e Y están correlacionados negativamente.
Fuente: P. Heck

variable deprime las correlaciones con otras variables. Para los valores positivamente correlacionados de X e Y ( r = .5), encontramos una correlación entre X y la relación X / Y de -.021, y para una X e Y negativamente correlacionada encontramos .152. Los gráficos de la izquierda muestran los dos diagramas de dispersión donde X / Y se muestra como una función de X. La mayoría de las proporciones se encuentran en la sección más baja de la escala, mientras que hay una salpicadura de valores atípicos. Cuando X e Y están correlacionados positivamente, la distribución de X / Y está sesgada a la izquierda; cuando la correlación es negativa, está sesgada a la derecha.

Uno podría sentirse tentado a concluir que la falta de correlación proporciona una prueba de independencia. Tal conclusión sería apresurada porque el sesgo puede enmascarar la verdadera asociación. Una corrección estándar es la transformación de registro de una variable asimétrica antes de correlacionarla con otras variables. Cuando registramos la transformación de los valores, eliminamos la influencia excesiva de los más grandes y emerge una asociación positiva entre el numerador, X y la relación completa, X / Y. El segundo conjunto de dos figuras muestra esto. Para valores positivamente correlacionados de X e Y ( r = .5), encontramos una correlación entre X y la relación X / Y de. 514, y para una X e Y negativamente correlacionadas encontramos .831. Estas correlaciones son bastante grandes, lo que da credibilidad a la opinión de que la división agrega poco a lo que el numerador ya logra. La división agrega más cuando la correlación entre X e Y se vuelve cada vez más positiva. Esto es interesante porque significa que "relativizar" una variable X al dividirla por la variable Y es más informativa en la medida en que las diferencias entre ellos (entre un valor muestreado de X y un valor muestreado de Y) se vuelven más pequeños.

P. Heck
Relación lineal que surge después de la transformación del registro
Fuente: P. Heck

El sesgo de la distribución de relación tiene otra consecuencia problemática. Sabemos que es probable que la media aritmética sea más alta que el punto central conceptual de 1.0, que obtendríamos cuando X = Y. Ya que es posible obtener una proporción de X / Y> 2 pero imposible obtener uno <0, la mayoría de los medios de muestra serán> 1. En una distribución simétrica, la media es una estimación no sesgada del promedio verdadero (es decir, la media de una muestra infinitamente grande); no es ni sistemáticamente demasiado pequeño ni demasiado grande, y no varía sistemáticamente en función del tamaño de la muestra. Esto no es así en una distribución sesgada. En una distribución asimétrica, la media

P. Heck
Fuerte asociación lineal entre X y X / Y.
Fuente: P. Heck

se arrastran a medida que aumenta el tamaño de muestra N porque las muestras más grandes hacen más probable que se capturen valores muy raros pero muy grandes (aquí, proporciones). Si son capturados, ellos levantan la media. Como sabemos que una relación puede derivar hacia el infinito a medida que el denominador se hace infinitamente pequeño, también sabemos que una muestra muy grande muy probablemente producirá una media que sea virtualmente, prácticamente o moralmente infinita. No nos gustaría que eso ocurra porque el resultado sería imposible de interpretar.

Para ilustrar el aumento de la media en función de N, realizamos una serie

P. Heck
El efecto de sesgo del tamaño de la muestra en la relación media esperada.
Fuente: P. Heck

de simulaciones. La figura final muestra los medios de muestra de X / Y calculados sobre 1000 simulaciones para cada uno de los 7 tamaños de muestras a lo largo de una escala logarítmica. Tenga en cuenta que la relación media aumenta, al igual que la precisión con la que se estima (las barras alrededor de cada media expresan el error estándar, que es la desviación estándar de los medios muestreados divididos por la raíz cuadrada de su número).

No hay razón para abandonar todas las esperanzas y todas las proporciones. Pero en muchos contextos psicológicos es una buena práctica preguntar si se ha ganado tanto como se esperaba. Uno no querría racionalizar el uso de ratios después del hecho. Recomendamos informar las razones junto con sus variables de ingredientes para que se puedan apreciar los niveles absolutos a partir de los cuales surgieron las razones. Y, por supuesto, algunas proporciones son hermosas, como la de oro en la imagen en la parte superior. Cerrando el círculo, si permites una metáfora geométrica, Fra Luca Pacioli, el gran matemático renacentista, observó que "Al igual que Dios, la Proporción Divina es siempre similar a él mismo".

Krueger, JI (2008). La robusta belleza de las asociaciones simples. En JI Krueger (Ed.), Racionalidad y responsabilidad social: Ensayos en honor a Robyn M. Dawes (pp. 111-140). Nueva York, NY: Psychology Press.

McCauley, C., y Stitt, CL (1978). Una medida individual y cuantitativa de estereotipos. Revista de Personalidad y Psicología Social, 36 , 929-940.

McNemar, Q. (1969). Estadísticas psicológicas (4ª ed.). Nueva York, Nueva York: Wiley.

Posner, M. (1973). Cognición: una introducción . Glenview, Ill: Scott, Foresman.