Correlaciones espurias de Tyler Vigen: una reseña de libro

El libro de Tyler Vigen, Correlaciones falsas , es cálido, divertido y hace varios puntos muy importantes. Según Vigen, su libro se basa en docenas de correlaciones entre conjuntos de datos completamente no relacionados. Él confió en una computadora para generar correlaciones al azar producto-momento de Pearson (r) entre variables tan sin sentido como la inscripción en la escuela secundaria pública y el consumo de crema agria. Y, de hecho, la correlación entre la matriculación en la escuela secundaria pública y el consumo de crema agria es bastante alta, r = .95. No solo es esto aleatorio y sin sentido, sino que el problema más grande es que vemos tonterías como esta todos los días y las personas basan las conclusiones en estas correlaciones. Por ejemplo, me preocupa la inscripción escolar. ¿Esta alta correlación significa que si como más crema agria, más niños permanecerán en la escuela?

El libro de Vigen es muy divertido porque tiene casi doscientas de estas correlaciones tontas y aleatorias que se derivan de bases de datos serias. Por ejemplo, cuando los datos del Centro para el control de enfermedades, CDC, se correlacionan con los datos de la base de datos de películas de Internet, encontró que las apariciones en cine de Ben Affleck tienen una correlación muy alta con intoxicaciones accidentales por pesticidas, r = .92. ¿Esto significa que las películas de Ben Affleck causan envenenamientos accidentales por pesticidas? Por supuesto no. Como todos los estudiantes de psicología de pregrado saben, la correlación no implica causalidad. Una correlación es simplemente una relación matemática entre dos conjuntos de datos. Significa que dos variables van juntas o covary.

Aunque divertido y tonto, este libro demuestra muchos principios importantes. Junto con 1) tenga cuidado con la interpretación de sus datos y 2) la correlación no implica que la causalidad sea el tercer concepto de correlación espuria. De hecho, el libro de Vigen se titula Correlaciones espurias. Estrictamente hablando, una correlación espuria es cuando la relación entre variables con una fuerte correlación se explica por una tercera variable. Aquí es donde el libro de Vigen se vuelve aún más interesante. Aquí hay otro ejemplo. Los ingresos publicitarios de March Madness TV y las cervecerías en los Estados Unidos se correlacionan .94. Así que a medida que aumentan los ingresos publicitarios también lo hacen las cervecerías. ¿Podrían ambos ser explicados por una economía en auge? Una mejor economía genera más dinero para gastar en todo, incluidos anuncios de televisión y cervecerías. Y esto sugiere otro principio de las ciencias sociales, La Ley de la Parsimonia. La Ley de parsimonia sostiene que cuando las cosas son ambiguas, la explicación más simple que explica la mayoría de las observaciones es la mejor.

Hmmm …., Ahora las cosas se están volviendo complejas. No es suficiente observar una relación de correlación entre variables y saltar a una conclusión. Desafortunadamente, esto sucede todo el tiempo y es por eso que este libro es un adjunto tan bueno para una clase formal en estadística. De todos modos, comienza a ser obvio que las ciencias sociales tratan sobre el razonamiento, la lógica y no solo las correlaciones generadas por computadora al azar. Usamos el razonamiento deductivo para formar hipótesis, el razonamiento inductivo para probar las hipótesis, y replicamos cuidadosamente nuestros hallazgos antes de sacar conclusiones precipitadas. La investigación en ciencias sociales es fundamentalmente un ejercicio de lógica. Desafortunadamente, en la era del big data, esto no está sucediendo lo suficiente. Diariamente, estamos abrumados con los datos. Ni siquiera puedo comer chocolate de Sees sin saber cuántas calorías me costará. Los científicos se apresuran a publicar los resultados y los resultados negativos ni siquiera se publican. Los medios y los maestros captan la conclusión más rápida y la difunden como si fueran chismes o niños que tocan el teléfono. Todo sucede muy rápido sin mucho pensamiento o examen crítico. Y, esta es exactamente la razón por la cual el libro de Vigen es tan importante. Al burlarse de las correlaciones sin sentido, llama la atención sobre el pensamiento descuidado. Lea este libro por diversión y luego pare y piense en las implicaciones de todas las conclusiones sin sentido que formamos todos los días.