Evaluación de la investigación en psicología

Muchos famosos estudios psicológicos no pueden ser reproducidos.

Los estudios en psicología a menudo encuentran resultados diferentes. Incluso en campos como la medicina, donde uno podría pensar que existe una relación directa entre la intervención que se prueba y sus efectos, los resultados pueden variar.

Wikimedia Commons

Experimento de la prisión de Stanford

Fuente: Wikimedia Commons

Por ejemplo, un estudio encontró que beber un vaso de jugo de naranja al día podría aumentar el riesgo de una persona de contraer diabetes tipo 2 en un 18 por ciento. Los investigadores de la Universidad de California, Davis, sin embargo, descubrieron que beber jugo 100% reduce el riesgo de varias enfermedades crónicas, incluido el cáncer.

Wikimedia Commons

Malvaviscos blancos

Fuente: Wikimedia Commons

Pero muchos piensan que la situación es peor en psicología.

Un artículo reciente del New York Times menciona algunos estudios de psicología famosos sobre el comportamiento humano que no pueden reproducirse, incluido el famoso experimento de la prisión de Stanford que mostraba cómo las personas que actuaban como guardias actuaban con crueldad para burlarse de los prisioneros, así como la famosa “prueba de malvaviscos” que mostró que los niños pequeños que podrían retrasar la gratificación demostraron un mayor rendimiento educativo años más tarde que aquellos que no pudieron hacerlo.

¿Por qué los resultados de la investigación varían y no se replican?

La relación entre una intervención y sus efectos puede depender de muchos factores. Y las diferencias en el contexto o la implementación pueden tener un gran impacto en los resultados de un estudio. Existen otros motivos por los que los estudios podrían informar diferentes efectos: los errores de probabilidad podrían afectar los resultados de un estudio. Los investigadores también pueden influir consciente o inadvertidamente en sus resultados.

Todas estas fuentes de variabilidad han llevado a temer una “crisis de replicación” en psicología y otras ciencias sociales. Ante esta preocupación, ¿cómo deberíamos evaluar la investigación en psicología y ciencias sociales?

La primera regla general es no depender únicamente de ningún estudio. Si es posible, revise los metanálisis o las revisiones sistemáticas que combinan los resultados de múltiples estudios. Los metanálisis pueden proporcionar evidencia más creíble. Los metanálisis pueden sugerir razones por las cuales los resultados difieren.

Un metanálisis es un análisis estadístico que combina los resultados de múltiples estudios de investigación. El principio básico detrás del metanálisis es que hay una verdad común detrás de todos los estudios de investigación conceptualmente similares, pero cada estudio individual se ha medido con un cierto error dentro de los estudios individuales. El objetivo es usar estadísticas para obtener una estimación combinada, más cercana a la verdad común desconocida. Un metanálisis, entonces, arroja un promedio ponderado de los resultados de todos los estudios individuales.

Además de proporcionar una estimación de la verdad común desconocida, el metanálisis también puede contrastar los resultados de diferentes estudios e identificar patrones entre los resultados del estudio. También puede identificar las fuentes de desacuerdo entre estos resultados. Y puede identificar otras relaciones interesantes que surgen en el contexto de múltiples estudios. Un beneficio clave del enfoque metaanalítico es la agregación de información que conduce a un poder estadístico más alto y una estimación puntual más robusta de lo que es posible a partir de la medida derivada de muchos estudios individuales.

Sin embargo, hay algunas limitaciones del enfoque meta-analítico a considerar también. El investigador debe tomar decisiones sobre qué estudios incluir que puedan afectar los resultados del metanálisis (p. Ej., Solo estudios publicados). El investigador debe decidir cómo buscar los estudios. Y el investigador debe decidir cómo tratar datos incompletos, analizar los datos y dar cuenta del sesgo de publicación.

A veces, sin embargo, queremos evaluar un único estudio de psicología individual. Entonces, ¿cómo deberíamos hacerlo? Al considerar cuánto peso dar a un estudio y sus resultados, concéntrese en el tamaño de la muestra. Es más probable que los estudios no se repliquen si usaron muestras pequeñas. Los resultados más positivos y negativos son a menudo aquellos con las muestras más pequeñas o los intervalos de confianza más amplios. Es más probable que los estudios más pequeños no se reproduzcan en parte debido a la posibilidad, pero los efectos también pueden ser menores a medida que aumenta el tamaño de la muestra, por numerosas razones. Si el estudio estaba probando una intervención, puede haber limitaciones de capacidad que impidan la implementación de alta calidad a gran escala. Los estudios más pequeños también suelen centrarse en la muestra deseable exacta que produciría los mayores efectos.

Hay una línea de razonamiento para esto: si, por ejemplo, tiene un costoso programa educativo de diversidad que solo puede usar con una cantidad limitada de estudiantes, es posible que solo tenga una clase y que tenga estudiantes que puedan beneficiarse al máximo. Eso significa que el efecto probablemente sería menor si implementara la educación sobre la diversidad en un grupo más grande. Entonces, de manera más general, puede ser útil pensar qué cosas podrían ser diferentes si el programa educativo se amplió. Por ejemplo, es poco probable que los programas educativos pequeños de diversidad afecten a la institución, la comunidad o la sociedad en general. Pero si se amplía, la cultura institucional, comunitaria o social puede cambiar en respuesta.

Del mismo modo, considere las características específicas de la muestra, el contexto y la implementación. ¿Cómo vinieron los investigadores a estudiar el programa educativo de diversidad, incluida la institución y los estudiantes que hicieron? ¿Esperaría que esta muestra se desempeñara mejor o peor que la muestra que le interesaba? Por ejemplo, si estuviera interesado en probar el resultado del método de enseñanza que utilizo en mi curso de conferencia web, la configuración de Psicología de la Diversidad en Harvard (por ejemplo, Harvard, conferencia web, campus) también podría haber afectado los resultados. ¿Hubo algo único acerca de la configuración que podría haber hecho que los resultados fueran más grandes?

Si el estudio estaba evaluando un curso educativo sobre diversidad, también es importante cómo se implementó ese curso. Por ejemplo, suponga que escucha que un curso de conferencia web sobre la diversidad puede mejorar los sentimientos de pertenencia e inclusión de los estudiantes. Si estaba considerando implementar un curso similar, probablemente desee conocer el formato del curso de la conferencia web y el contenido del curso y la capacitación del personal docente para evaluar si puede obtener resultados diferentes.

También puede tener más confianza en los resultados de un estudio si existe algún mecanismo claro que explique los hallazgos y sea constante en todos los entornos. Algunos resultados en la economía del comportamiento, por ejemplo, sugieren que ciertas reglas del comportamiento humano están cableadas. Pero estos mecanismos pueden ser difíciles de descubrir. Y muchos experimentos en economía del comportamiento que inicialmente parecían reflejar una regla cableada no han podido replicarse, como encontrar que la felicidad aumenta la paciencia y el aprendizaje.

Pero, si hay una razón convincente de que podríamos esperar ver los resultados que ha encontrado un estudio, o si existe una fuerte razón teórica de que podríamos esperar que un resultado específico se generalice, eso debería llevarnos a confiar en los resultados de un estudio. solo estudio un poco más. Pero deberíamos tener cuidado de examinar por qué creemos que hay una razón convincente.

Finalmente, si parece demasiado bueno para ser verdad, probablemente lo sea. Esto se basa en un principio de las estadísticas bayesianas: las aserciones más extrañas deberían requerir evidencia más sólida para cambiar los “priores” o las creencias de uno. Si tomamos nuestras creencias con seriedad, y hay razones para concluir que, en promedio, los humanos son bastante buenos para hacer predicciones, entonces los resultados que parecen improbables, en realidad son menos probables de ser ciertos.

En conclusión, toda investigación de psicología está sujeta a error y, por lo tanto, los resultados pueden variar y no replicarse. Es mucho mejor ser consciente de esto que estar desinformado de los errores potencialmente ocultos en la investigación. El método científico fue desarrollado para aprovechar el razonamiento empírico para ayudarnos a resolver casos en los cuales los estudios varían o no se replican. La aplicación del método científico al estudio del comportamiento humano y la psicología no ha simplificado el comportamiento humano; en cambio, ha sugerido cuán complejo es el comportamiento humano.

Referencias

Weissmark, M. (próximo). La ciencia de la diversidad Oxford University Press, EE. UU.

Weissmark, M. (2004). Cuestiones Justas: Herencias del Holocausto y la Segunda Guerra Mundial . Oxford University Press, EE. UU.

Weissmark, M. y Giacomo, D. (1998). Hacer psicoterapia de manera efectiva. U niversidad de Chicago Press, EE. UU.