Sesgo en el autoconocimiento

Spock

Las autoevaluaciones de las personas sobre sus propias habilidades, habilidades y rendimiento en las pruebas son razonablemente precisas. Zell y Krizan (2014) informan una correlación promedio general de 0.3. Si este valor merece la etiqueta "razonablemente precisa" depende de una serie de suposiciones, el contexto de medición y la distribución de muestreo del coeficiente de correlación (consulte aquí para obtener más información). El coeficiente de correlación es un índice estadístico que captura la similitud entre dos perfiles de números: las autoevaluaciones de una muestra de individuos y sus puntajes verdaderos correspondientes (o las mejores medidas científicas de los mismos). Desde que Galton (1886) introdujo el coeficiente de correlación r (que significa regresión ), se ha vuelto omnipresente. Los metanálisis, como los resumidos por Zell y Krizan, lo usan rutinariamente para estimar y expresar tamaños de efectos empíricos (o usan índices como el d de Cohen, que es la diferencia entre dos medias en unidades estándar, y es fácilmente traducible a r ). En la medición, la confiabilidad y la validez también se expresan en términos de r .

Como medida de similitud de perfil, r se centra en un tipo de similitud entre dos conjuntos de puntajes. Las autoevaluaciones también pueden ser más variables que las puntuaciones verdaderas, o en general pueden ser más altas (más bajas). Estos diferentes tipos de (des) similitudes pueden separarse fácilmente unos de otros (Cronbach & Gleser, 1953; Krueger, 2009). En un comentario sobre Zell y Krizan, Dunning & Helzer (2014) argumentan que dicha separación de puntuaciones debería hacerse cuando la precisión de la autoevaluación está en juego. Señalan que la autoevaluación contiene un sesgo constante de tal manera que las estimaciones son más altas en promedio que las puntuaciones verdaderas. Otras evaluaciones, es decir, predicciones hechas por pares u observadores, son menos tendenciosas. Los coeficientes de correlación no capturan esta diferencia.

Este es un buen punto, pero Dunning y Helzer quieren más. Nos instan a "explorar la precisión y el error utilizando medidas completamente novedosas [y preguntarnos] si la predicción subjetiva o el rendimiento objetivo es más problemático para la auto-precisión. ¿Los errores en el autoconocimiento varían en función del pronóstico? ¿O el verdadero problema de la auto-precisión reside en el desempeño objetivo? "(P.128) Trazan (ya sean estos datos empíricos, no dicen) errores absolutos (| estimados – puntuación real |) contra el rendimiento previsto ( que se basa en la regresión de las puntuaciones reales estimadas), y luego grafica los errores absolutos contra el rendimiento real. En el primer caso, encuentran una línea horizontal plana; en el último caso, encuentran una función asimétrica en forma de U con una rama alta a la izquierda (puntajes reales bajos).

Dunning y Helzer creen que descubrieron algo importante. "Los errores de auto-predicción pueden no ser una función de la predicción en sí misma sino más bien el evento subyacente que las personas encontrarán posteriormente. Es decir, que una persona prediga alto o bajo no le dirá al investigador si esta persona tendrá más o menos posibilidades de equivocarse "(p. 128-129). Primero aclaremos lo que probablemente sea un error de impresión. Uno puede predecir a partir de las predicciones de las personas si están equivocados. Es más probable que las predicciones altas sean erróneas que las predicciones bajas. El sesgo de sobreestimación del nivel medio, enfatizado por Dunning & Helzer mismos, lo hace así. Lo que Dunning y Helzer probablemente quisieron escribir es que uno no puede predecir los errores de predicción del rendimiento previsto, ya que eso es lo que graficaron. Sin embargo, el gráfico simplemente muestra lo que se puede esperar de la lógica de la regresión, en lugar de un descubrimiento. La línea de regresión que mejor se ajusta minimiza los errores de predicción (| puntuación real – puntuación pronosticada |). Es matemáticamente posible que cuando los puntajes pronosticados son bajos, los puntajes reales sean más variables de lo que son cuando los puntajes pronosticados son altos. Esta es una situación poco probable, e incluso si se observara, su significado psicológico sería opaco.

El segundo reclamo de Dunning & Helzer es que el rendimiento real sí predice los errores de predicción. Esto tampoco es noticia. Sabiendo que la correlación entre puntajes estimados y reales no es perfecta (ver Zell y Krizan), y sabiendo que las estimaciones son en general demasiado altas, también sabemos que los errores de predicción de los puntadores bajos son mayores que los errores de los puntadores altos (Krueger Y Mueller, 2002). Aunque este patrón de resultados puede recuperarse de la lógica de la regresión y de la tendencia general a la autoestimación, ha alcanzado cierta notoriedad como un fenómeno supuestamente único conocido como el efecto Dunning-Kruger. Este tratamiento de un patrón derivado como un fenómeno sui generis no sería notable si no fuera por sus implicaciones. Dunning & Helzer sugieren que la auto-precisión no se puede mejorar al ayudar a las personas a hacer mejores predicciones, sino al elevar sus puntajes reales. La primera parte de este reclamo es falsa. Dunning & Helzer enfatizan el sesgo general de sobrestimación a nivel de grupo. De esto se desprende que si se aconsejara a las personas que redujeran sus autoevaluaciones en una cierta constante, sus errores absolutos disminuirían.

Texas sharpshooter fallacy

La segunda parte del reclamo también es problemática. Es cierto que si las auto-predicciones permanecen constantes mientras se elevan los puntajes reales, los errores absolutos disminuyen. Esto es, sin embargo, un ejemplo de la falacia del francotirador de Texas . Dejemos que las predicciones sean lo que son, traemos el criterio, eso, que se va a predecir, en línea con la predicción, después del hecho. El efecto Dunning-Kruger sugiere que los individuos de bajo desempeño en particular deben ser entrenados para mejorar. Cuando lo hagan, los errores absolutos disminuirán, pero también lo hará la correlación de precisión. A medida que el rango de puntajes verdaderos se acorta, el error aleatorio restante será relativamente mayor que la variabilidad sistemática en los puntajes reales. ¿Qué se gana cuando se mejora un tipo de puntaje de precisión a expensas de una disminución en otro? Una situación en la que todos lo hacen bien (es rico, saludable y feliz) es socialmente deseable, pero socava el valor de la medición. La medición (y la ciencia) requiere variabilidad.

Müller-Lyer illusion

La idea de que la auto-precisión se puede mejorar haciendo que los (bajos) artistas obtengan puntajes más altos implica un reclamo causal. Dunning & Helzer piensan que hay algo sobre el bajo rendimiento que impide que las personas vean la bajeza de su desempeño. "Los malos intérpretes no están en condiciones de reconocer las deficiencias de su desempeño" (p.129). Hacer que se desempeñen mejor "los ayuda a evitar el tipo de resultado que parecen incapaces de anticipar" (p. 129). A partir de este modelo causal, parece seguir que una vez que las personas se desempeñan mejor, harán predicciones más precisas. Dicho de otra manera, si el bajo rendimiento causa errores de predicción, un cambio a un alto rendimiento eliminará los errores. Esta sería una inferencia de toluens del modo lógicamente válido si no fuera por el hecho de que el bajo rendimiento es en sí mismo parte de cómo se define el error (error = estimado – rendimiento real). Los errores deben disminuir una vez que se eleve el rendimiento, incluso si no hay ningún efecto causal.

Ames room

Los errores de juicio, como la autoevaluación, a menudo se tratan como si fueran ilusiones cognitivas a la par de las ilusiones visuales. La mayoría no lo son, sin embargo (Krueger & Funder, 2004), y Dunning & Helzer deberían estar de acuerdo. Si no estaban de acuerdo, tendrían que querer corregir las ilusiones visuales cambiando la realidad. Tendrían que tratar de superar la ilusión de Müller-Lyer haciendo que la línea con las flechas de salida sea más larga que la línea con las flechas de entrada; tendrían que poner un enano y un gigante en la habitación de Ames; tendrían que voltear el cubo Necker siempre que las percepciones cambien a una interpretación espacial diferente. Las raíces de estas ilusiones radican en cómo el sistema visual interpreta una realidad ambigua. Los investigadores habrían aprendido menos sobre la percepción si nunca hubieran encontrado formas ingeniosas de engañarlo.

Necker cube

Cronbach, LJ, y Gleser, GC (1953). Evaluar la similitud entre los perfiles. Psychological Bulletin, 50 , 456-473.

Dunning, D., y Helzer, EG (2014). Más allá del coeficiente de correlación en estudios sobre la precisión de la autoevaluación. Perspectives on Psychological Science, 92 , 126-130.

Galton, F. (1886). Regresión hacia la mediocridad en estatura hereditaria. El Diario del Instituto Antropológico de Gran Bretaña e Irlanda, 15 , 246-263.

Krueger, JI (2009). Un modelo componencial de efectos de situación, efectos de persona y efectos de interacción de persona por persona en el comportamiento social. Revista de Investigación en Personalidad, 43 , 127-136.

Krueger, JI, y Funder, DC (2004). Hacia una psicología social equilibrada: causas, consecuencias y curas para el enfoque de búsqueda de problemas del comportamiento social y la cognición. Behavioral and Brain Sciences, 27 , 313-327.

Krueger, J., & Mueller, RA (2002). ¿No calificado, inconsciente o ambos? La contribución de las habilidades sociales-perceptivas y la regresión estadística a los sesgos de auto-mejora. Revista de Personalidad y Psicología Social, 82 , 180-188.

Zell, E., y Krizan, Z. (2014). ¿Las personas tienen una idea de sus habilidades? Una metasíntesis. Perspectives on Psychological Science, 9 , 111-125.