Un sesgo de promediación

El amor al prejuicio no es correspondido – otra vez.

“Παν μέτρον άριστον. [Todo con moderación. ”” Kleoboulos de Lindos, atribuido, siglo VI a. C.

La capacidad de promediar datos ruidosos es esencial para la cognición efectiva y la toma de decisiones. Los estudiantes introducidos a la distribución de errores de Gauss se estropean porque esta distribución no solo es normal sino también hermosa. El hecho de que existen diferentes medidas de ” tendencia central ” todavía no ha llegado a casa, porque con Gauss, todas son iguales: la media (la media aritmética), el modo (el pico) y la mediana (el percentil 50). ). Cuando se introduce sesgo, las tres formas de partes. Para una distribución sesgada negativamente (con la cola delgada a la izquierda) y con números que crecen desde la izquierda, el modo es mayor que la mediana, que es mayor que el promedio.

Cuando los investigadores presentan a los participantes una serie de números y les piden que calculen el promedio, lo hacen bien para explicar los tres tipos de tendencia central y dejar claro cuál de ellos buscan. A menudo, los investigadores parecen asumir que pedir un ‘promedio’ se entenderá como ‘media aritmética’, y cuando las estimaciones promedio se alejan de los promedios verdaderos, los investigadores concluyen que algo interesante está sucediendo.

Si las estimaciones promedio siempre alcanzaran bien los promedios verdaderos, no habría mucha psicología (Peterson y Beach, 1967). Las discrepancias generan dudas sobre lo que las personas realmente hacen para resolver la tarea y cómo modelar eso. Parducci (1965) presentó una cuenta simple y elegante del promedio. Según su teoría de rango-frecuencia (RFT), las estimaciones de promedios surgen de un compromiso entre un principio de rango y un principio de rango . El principio de rango toma el punto intermedio entre el valor observado más pequeño y el más grande, y el principio de rango toma la mediana. Si los dos difieren, divide la diferencia. RFT tiene buen éxito en la predicción del rendimiento humano en tareas de promedio en una amplia variedad de contextos (Wedell y Parducci, 2000).

De vez en cuando, los investigadores intentan reinventar RFT o mejorarlo, con un éxito limitado. En un ensayo anterior (Krueger, 2018), describí los esfuerzos de un equipo de Harvard para introducir un nuevo concepto de expansión de categorías , solo para encontrar que RFT describe bien los datos sin requerir un proceso psicológico novedoso, por no hablar de “sesgo”.

Ahora, los investigadores de Yale y Cornell nos cuentan acerca de un bia s binario , una supuesta heurística promedio que produce un error sistemático (Fisher & Keil, 2018; Fisher et al., 2018). El pecado psicológico del día es la dicotomización. Hacer promedios es difícil, y se piensa que los encuestados dividen el rango de valores observados en la mitad izquierda y la mitad derecha (recuérdese el principio del rango), y luego estiman el número de observaciones en cada mitad y restan un conteo del otro para llegar en una puntuación de desequilibrio. Esto se parece mucho a RFT porque se basa en el principio de rango (usando el rango medio como criterio de dicotomización) y el principio de rango (usando variaciones en el sesgo de distribución). De hecho, la medida crítica dependiente, la puntuación de desequilibrio , predice estimaciones del promedio en todo el rango. Sorprendentemente, sin embargo, el modelo computacional para el sesgo binario es mudo sobre cómo la puntuación de desequilibrio se traduce en un promedio estimado; solo predice que los dos están correlacionados sobre pares de distribuciones.

J. Krueger

Un cuento de 2 menús.

Fuente: J. Krueger

Para probar la hipótesis del sesgo binario, los autores construyen pares de distribuciones donde los dos medios son iguales pero el sesgo es diferente. Ahora, el sesgo afecta tanto a la puntuación de desequilibrio como a la mediana, lo que confunde a los dos. Considere el ejemplo de los dos menús (que se muestran en la primera figura insertada). Hay 10 elementos en el menú. Los precios van desde $ 12 a $ 20 en el menú 1, y desde $ 10 a $ 17 en el menú 2. Por lo tanto, el rango medio es de $ 16 en el menú 1 y $ 13.5 en el menú 2. En el menú 1, 7 artículos son más baratos que el precio de rango medio, y 3 son más caro. Esto produce un puntaje de desequilibrio de 4 (7 – 3). En el menú 2, 2 artículos son más caros que el rango medio y 8 son más baratos. Esto produce un puntaje de desequilibrio de -6 (2 – 8). La predicción es que los encuestados estimarán un precio promedio más bajo para el menú 1 que para el menú 2, y de hecho lo hacen. Et voilà , el sesgo da error.

Sin embargo, la mediana muestra la misma desigualdad. La distribución de precios para el menú 1 está sesgada positivamente (la mayoría de los platos son baratos), mientras que la distribución para el menú 2 no está sesgada. El precio medio en el menú 1 es de $ 14, y el precio medio en el menú 2 es de $ 16. Esta parte de RFT está haciendo bien. Sin embargo, si los encuestados dieran el mismo valor a la mediana y al precio de rango medio al estimar los promedios, el promedio estimado para el menú 1 sería un poco más alto que el promedio estimado para el menú 2.

La posibilidad de que los encuestados simplemente tomen la mediana al estimar el promedio es una alternativa psicológica plausible. Los autores notan repetidamente la confusión entre el sesgo binario y el juicio basado en la mediana, pero hacen poco para romperlo. La prueba más directa se encuentra en el estudio 7 de Fisher et al. (2018). Aquí, encontramos 3 tipos de pares de distribución. En los tres pares, la distribución con el sesgo positivo tiene una media ligeramente más baja que la distribución con el sesgo negativo. Dado que los números presentan valor en este experimento, todos los encuestados deben elegir entre la última distribución; sin embargo, la mayoría no lo hace, lo que es consistente con el sesgo binario. Los hallazgos son prácticamente los mismos cuando los 5 contenedores están etiquetados de “muy pobre” a “muy bueno”. Aquí, el rango medio coincide con la etiqueta neutral. Sin embargo, en la tercera condición, los encuestados encuentran una escala univalente que va desde “justo” (1) a “extremadamente bueno” (5). Alrededor de la mitad de estos encuestados aún prefieren la distribución con la media menor pero la desviación positiva. Los autores concluyen que si el sesgo es el origen del error, no debería importar la introducción de etiquetas.

Esta es una forma curiosa de tratar de separar hipótesis en competencia. La introducción de etiquetas de “justo” (1) a “extremadamente bueno” (5) genera una nueva competencia tanto para el sesgo binario como para la cuenta sesgada. En esta condición, el límite de la categoría sugerida semánticamente se ha movido de 3 a 1.5. Ahora hay una fuerte demanda para agrupar todas las calificaciones que contienen la palabra “bueno”. Y como resultado, la distribución con el promedio más bajo tiene menos artículos ‘justos’ que la distribución con el promedio más alto. Esta prueba no es sólida porque se conforma con la idea de que cualquier efecto significativo refuta la hipótesis que predice ningún efecto (Krueger & Heck, 2017). Al desplegar una manipulación fuerte y sugerente de la demanda, la plataforma se apila. Con el significado en la mano, es fácil pasar por alto que incluso en estas circunstancias urgentes, la mayoría de las respuestas fueron similares a las respuestas en las otras dos condiciones.

J. Krueger

¡Que haya bistec!

Fuente: J. Krueger

Aunque esta prueba puede no ser terrible, debe considerarse débil cuando se le pide que haga todo el trabajo. No es difícil encontrar otra forma complementaria de contrastar la hipótesis de sesgo binario contra la hipótesis de sesgo. Regresemos al paradigma del menú y agreguemos un artículo costoso (bistec chuletón por $ 30) a cada lista. La segunda figura muestra que los promedios han subido y que la segunda lista mantiene un precio medio más alto. Críticamente, la puntuación de desequilibrio ahora está equilibrada, por lo que no se predice ningún sesgo binario. El RFT, al usar información de rango medio y rango, predice una pequeña diferencia.

Con un poco más de investigación, entonces, podríamos saber si necesitamos el nuevo concepto de sesgo binario. Parte del atractivo (engañoso) de esta investigación en su forma actual es que utiliza la observación no controvertida de que las personas categorizan espontáneamente los estímulos continuos (Krueger y Clement, 1994; Tajfel, 1969) para afirmar que esta tendencia compromete la cognición categórica como la grandiosa promediando

Referencias

Fisher, M., y Keil, FC (2018). El sesgo binario: una distorsión sistemática en la integración de la información. Ciencia psicologica DOI: 10.1177 / 09567718792256

Fisher, M., Newman, GE, y Dhar, R. (2018). Ver estrellas: cómo el sesgo binario distorsiona la interpretación de las calificaciones de los clientes. Revista de investigación del consumidor . DOI: 10.1093 / jcr / ucy017

Krueger, JI (2018, 16 de julio). Problemas sociales y cognición humana. La psicología hoy en línea . https://www.psychologytoday.com/intl/blog/one-among-many/201807/social-problems-and-human-cognition

Krueger, J., & Clement, RW (1994). Juicios basados ​​en la memoria sobre múltiples categorías: una revisión y extensión de la teoría de acentuación de Tajfel. Revista de Personalidad y Psicología Social, 67 , 35-47.

Krueger, JI, & Heck, PR (2017). El valor heurístico de p en la inferencia estadística inductiva. Fronteras en psicología: psicología educativa [Tema de investigación: aspectos epistemológicos y éticos de la investigación en ciencias sociales] . https://doi.org/10.3389/fpsyg.2017.00908

Parducci, A. (1965). Categoría de juicio: Un modelo de frecuencia de rango. Revisión psicológica, 72 , 407-418.

Peterson, CR, y Beach, LR (1967). El hombre como estadístico intuitivo. Boletín psicológico, 68 , 29-46.

Wedell DH, y Parducci A. (2000). Comparación social. En: J. Suls, y L. Wheeler (eds.), Manual de comparación social: Teoría e investigación (pp. 223-252). Nueva York: Pleno / Kluwer.

Tajfel, H. (1969). Aspectos cognitivos del prejuicio. Revista de asuntos sociales, 25 , 79-97.