Más sobre Dunning-Kruger

Varios años atrás escribí una publicación sobre el efecto Dunning-Kruger. En ese momento, todavía estaba obteniendo mis piernas metafóricas para escribir y, como resultado, no creo que la publicación haya resultado tan bien como podría haberlo hecho. En aras de mantenerme a un nivel superior, hoy decidí volver a tratar el tema tanto para mejorar la publicación original como para generar una referencia futura para mí (y con suerte para usted) cuando la debato con otros. Esto es algo que me ahorra tiempo porque las personas hablan sobre el efecto frecuentemente a pesar de que, irónicamente, no lo entienden muy profundamente.

Lo primero es lo primero, ¿cuál es el efecto Dunning-Kruger? Como encontrará resumido casi en todas partes, se refiere a la idea de que las personas que tienen un desempeño inferior al promedio en algunos dominios, como el razonamiento lógico o el humor, tenderán a juzgar su desempeño como superior al promedio. En otras palabras, las personas son inexactas al juzgar qué tan bien sus habilidades se comparan con sus pares o, en algunos casos, con algún estándar objetivo. Además, este efecto se agranda cuanto más inexperto resulta ser . No solo los peores resultados son peores en la tarea que otros, sino que también son peores al entender que son malos en la tarea. Se dice que este efecto se obtiene porque la gente necesita saber qué es un buen desempeño antes de poder evaluarlo con precisión. Entonces, debido a que los intérpretes por debajo del promedio no entienden cómo realizar una tarea correctamente, también carecen de las habilidades para juzgar su desempeño con precisión, en relación con los demás.

Flickr/frankieleon
Ahora disponible en Ben & Jerry's: Dos cucharadas de fracaso
Fuente: Flickr / frankieleon

Como mencioné en mi publicación inicial (y por Kruger & Dunning mismos), este tipo de efecto no debe extenderse a dominios donde la producción y las habilidades de evaluación pueden ser desacopladas. Solo porque no puedas presionar una nota para salvar tu vida en la noche de karaoke, eso no significa que no podrás descubrir qué otros cantantes son malos. Este efecto también debe estar limitado principalmente a dominios en los que la retroalimentación que recibe no es objetiva o los estándares de desempeño son claros. Si le piden que vuelva a armar el motor de un automóvil, por ejemplo, las personas no calificadas pronto se darán cuenta de que no pueden hacerlo sin ayuda. Dicho esto, para resaltar la razón por la que la explicación original para este hallazgo no funciona del todo -ni siquiera para los dominios que se estudiaron en el documento original-, quería examinar un gráfico bastante importante del efecto de Kruger y Dunning (1999). ) con respecto a su estudio del humor:

Kruger, J. & Dunning, D. (1999)
Fuente: Kruger, J. y Dunning, D. (1999)

Mis flechas rojas añadidas crudamente demuestran el problema. En el lado izquierdo, vemos lo que las personas llaman el efecto Dunning-Kruger: los que obtuvieron los peores resultados en el ámbito del humor también fueron los más inexactos al juzgar su propio desempeño, en comparación con los demás. No eran expertos y no lo sabían. Sin embargo, el lado derecho delata el verdadero problema que me llamó la atención: los mejores intérpretes también fueron inexactos. El patrón que debe esperar, de acuerdo con la explicación original, es que cuanto más alto sea el rendimiento, más exactamente estimarán su posición relativa, pero lo que vemos es que los mejores resultados no son tan precisos como aquellos que solo están modestamente arriba promedio. En este punto, algunos de ustedes podrían pensar que este punto que estoy planteando es básicamente no problemático porque los mejores intérpretes fueron aún más precisos que los peores, y la imprecisión de la derecha que estoy destacando no es apreciable . Déjame intentar convencerte de lo contrario.

Supongamos por un momento que las personas solo están adivinando cómo se desempeñaron, en relación con los demás. Debido a que tener un buen sentido del humor es una habilidad socialmente deseable, todas las personas tienden a calificarse "modestamente por encima del promedio" en el dominio para tratar de persuadir a otros de que en realidad son divertidos (y porque, en ese momento, no hay consecuencias a estar equivocado). A pesar de estas suposiciones, aquellos que están modestamente por encima del promedio parecerán ser más precisos en su autoevaluación que aquellos que se encuentran en la mitad inferior de la población; esa precisión simplemente no tiene nada que ver con su verdadero nivel de comprensión de sus habilidades (conocidas como sus habilidades metacognitivas). Del mismo modo, aquellos que están más que modestamente por encima del promedio (es decir, están subestimando sus habilidades) también serán menos precisos; habrá menos de ellos que aquellos que sobreestiman sus habilidades.

Teniendo en cuenta los hallazgos de Kruger y Dunning (1999) en general, el escenario anterior que acabo de describir no refleja la realidad a la perfección. Hubo una correlación positiva entre el desempeño de las personas y su calificación de su posición relativa (r = .39), pero, en su mayor parte, los juicios de las personas sobre su propia capacidad (la línea negra) parecen relativamente uniformes. Por otra parte, si considera sus resultados en los estudios dos y tres de ese mismo artículo (razonamiento lógico y gramática), las correlaciones entre el rendimiento y los juicios de rendimiento en relación con los demás caen a un mínimo de r = .05 hasta un pico de r = .19, que fue estadísticamente significativo. Los juicios de las personas acerca de su desempeño relativo fueron casi constantes en varias tareas similares. En la medida en que estos juicios de rendimiento metacognitivos utilizan el rendimiento real como una entrada para determinar las posiciones relativas, claramente no es el factor principal para los jugadores de bajo o alto rendimiento.

Flickr/saturnism
Todos compran en la misma tienda cognitiva
Fuente: Flickr / saturnismo

De hecho, no se debe esperar que el rendimiento real sea la entrada principal para estos sistemas metacognitivos (los que generan juicios relativos de rendimiento) por dos razones. La primera de ellas es la explicación del rendimiento original postulada por Kruger y Dunning (1999): si el sistema que genera el rendimiento no tiene acceso a la respuesta "correcta", entonces parecería particularmente extraño que otro sistema – el metacognitivo uno: tendría acceso a la respuesta correcta, pero solo la usaría para juzgar el rendimiento, en lugar de ayudar a generarlo.

Para poner esto en un ejemplo de memoria rápida, digamos que estaba experimentando un estado de "la punta de la lengua", donde está seguro de que sabe la respuesta correcta a una pregunta, pero no puede recordarlo del todo. En este caso, tenemos un sistema de memoria a largo plazo que genera rendimiento (tratando de recordar una respuesta) y un sistema metacognitivo que genera juicios de confianza (el estado de la punta de la lengua). Si el sistema metacognitivo tiene acceso a la respuesta correcta, debe simplemente compartirla con el sistema de memoria a largo plazo, en lugar de usar la respuesta correcta para indicarle al otro sistema que siga buscando la respuesta correcta. El último camino es claramente ineficiente y redundante. En cambio, el sistema metacognitivo debería usar algunas señales que no sean el acceso directo a la información para generar sus juicios.

La segunda razón por la que el rendimiento real (en relación con los demás) no sería un insumo para estos sistemas metacognitivos es que las personas no tienen un acceso confiable y preciso a los datos del nivel de la población. Si le preguntas a las personas cuán divertidas son en relación con los demás , podrían tener algún sentido (qué gracioso eres, en relación con algunas personas en particular que conoces), pero ciertamente no tienen acceso a lo gracioso que todos son porque no conocen a todos; ellos ni siquiera conocen a la mayoría de las personas. Si no tiene la información relevante, entonces no hace falta decir que no puede usarla para ayudar a informar sus respuestas.

Flickr/Amy West
Mejor empezar a conocer a más personas para mejorar en el próximo experimento
Fuente: Flickr / Amy West

Entonces, si estos sistemas metacognitivos están utilizando entradas que no sean información precisa para generar sus juicios sobre cómo nos comparamos con los demás, ¿cuáles serían esas entradas? Una posible entrada sería la dificultad de la tarea , no en el sentido de qué tan difícil es para la persona completar la tarea, sino más bien en términos de cuán difícil se siente una tarea. Esto significa que factores como la rapidez con la que se puede recordar una respuesta probablemente tengan un papel en estos juicios, incluso si la respuesta en sí es incorrecta. Si juzgar el valor humorístico de una broma parece fácil, las personas pueden estar inclinadas a decir que están por encima del promedio en ese dominio, incluso si no lo son.

Esto arroja una predicción importante: si les proporciona a las personas tareas que les resultan difíciles , debería verlas comenzar a adivinar que están por debajo del promedio en ese dominio. Si todos adivinan efectivamente que están por debajo del promedio (independientemente de su desempeño real), esto significa que aquellos que rinden lo mejor serán los más inexactos al juzgar su capacidad relativa. En tareas que se sienten fáciles, las personas pueden ser no calificadas y no ser conscientes; para aquellos que se sienten duros, las personas pueden ser expertas pero aún no ser conscientes.

Esto es precisamente lo que Burson, Larrick y Klayman (2006) probaron, en tres estudios. Si bien no voy a entrar en detalles sobre los detalles de todos sus estudios (esto ya es largo), recrearé un gráfico de uno de sus tres estudios que captura bastante bien su patrón general de resultados:

Burson, K., Larrick, R., & Klayman, J. (2006)
Fuente: Burson, K., Larrick, R., y Klayman, J. (2006)

Como podemos ver, cuando los dominios que se probaron se volvieron más difíciles, ahora se dio el caso de que los peores resultados fueron más precisos al estimar su rango de percentiles que los mejores. En tareas de dificultad moderada, los mejores y peores ejecutantes fueron igualmente calibrados. Sin embargo, no parece que esta precisión se deba principalmente a su percepción real de su desempeño; daba la casualidad de que sus conjeturas se acercaban más a la verdad. Cuando la gente piensa, "esta tarea es difícil", todos parecen estimar que su desempeño está modestamente por debajo del promedio; cuando la tarea parece fácil, todos parecen estimar que su desempeño es modestamente superior a la media. El grado en que esto concuerda con la realidad se debe en gran parte al azar, en relación con la verdadera percepción.

Vale la pena señalar que cuando le pides a las personas que hagan diferentes tipos de juicios, existe (o al menos puede haber) una ventaja promedio modesta para los mejores intérpretes, en comparación con los más bajos. Específicamente, cuando le pides a las personas que juzguen su desempeño absoluto (es decir, ¿cuántas de estas preguntas obtuviste bien?) Y las comparas con su desempeño real, los mejores intérpretes algunas veces entendieron mejor ese estimado que los peores, pero el tamaño de esa ventaja varía según la naturaleza de la tarea y no es del todo coherente. Promediado a través de los estudios reportados por Burson et al (2006), los artistas de la mitad superior mostraron una mejor correlación entre su desempeño absoluto percibido y real (r = .45), en comparación con los de menor desempeño (r = .05). Las correlaciones correspondientes para percentiles reales y relativos fueron en la misma dirección, pero menores (rs = .23 y .03, respectivamente). Si bien puede haber algo de cierto en la idea de que los mejores ejecutantes son más sensibles a su rango relativo, la mayor parte de la mala calibración parece estar impulsada por otros factores.

Flickr/Ruin Raider
Conducir todavía se siente fácil, así que todavía estoy por encima del promedio
Fuente: Flickr / Ruin Raider

Estos juicios sobre la posición relativa de uno en comparación con otros parecen ser bastante difíciles para que las personas sean precisas. Como deberían, realmente; en su mayor parte, carecemos de acceso a la información / retroalimentación relevante y hay posibles problemas de apetencia social a los que enfrentar, junto con la falta de consecuencias por el error. Esta es básicamente una tormenta perfecta para la inexactitud. Tal vez valga la pena señalar que la correlación entre el rendimiento relativo de uno y su rendimiento real fue bastante estrecha para un dominio en particular en Burson et al (2006): conocimiento de trivia de música pop (el gráfico de los cuales se puede ver aquí). Como la música pop es el tipo de cosas con las que las personas tienen más experiencia para aprender y hablar con los demás, es un buen candidato para un caso cuando estos juicios pueden ser más precisos porque las personas tienen más acceso a la información relevante.

El punto importante que debe alejarse de esta investigación es que las personas no parecen ser particularmente buenas para juzgar sus habilidades en relación con las demás , y esto se obtiene independientemente de si los jueces son hábiles o no calificados. Al menos para la mayoría de los contextos estudiados, de todos modos; es perfectamente plausible que las personas -de nuevo, hábiles y no calificadas- sean más capaces de juzgar su desempeño relativo (y absoluto) cuando tienen experiencia con un dominio en cuestión y han recibido comentarios significativos sobre su desempeño. Esta es la razón por la cual la gente a veces abandona una especialidad o un trabajo después de recibir comentarios negativos consistentes, optando por creer que no están tan preparados para ello en lugar de persistir para creer que en realidad están por encima del promedio en ese contexto. Es probable que vea la menor calibración para los dominios donde los juicios de las personas sobre su capacidad deben afectar a la realidad y hay consecuencias por estar equivocado.

Referencias: Burson, K., Larrick, R., y Klayman, J. (2006). Calificados o no calificados, pero aún desconocen: cómo las percepciones de la dificultad generan una mala calibración en las comparaciones relativas. Journal of Personality and Social Psychology, 90 , 60-77.

Kruger, J. y Dunning, D. (1999). No calificado y sin darse cuenta: cómo las dificultades para reconocer la propia incompetencia conducen a autoevaluaciones infladas. Revista de Personalidad y Psicología Social, 77 , 1121-1134.