Usando Big Data para estudiar psicología

Amazon
Fuente: Amazon

Existe una gran cantidad de discusión sobre el valor del big data para las empresas. Por ejemplo, Amazon compara tus compras y vistas de página con las de otros compradores e intenta encontrar personas con intereses similares. Luego, Amazon sugiere compras de productos que les gustaron a las personas bajo la suposición de que también les gustarán.

¿Se pueden usar grandes datos para responder preguntas de interés para la comunidad investigadora en psicología? Seth Stephens-Davidowitz exploró esta misma pregunta con detalle en su fascinante libro, Everybody Lies .

Lo que me gusta del libro de Stephens-Davidowitz es qué tan claro se trata tanto de lo que podemos aprender de los macrodatos como de algunas cosas difíciles de usar con éxito.

El Big Data es particularmente bueno para responder a preguntas que, de otro modo, las personas podrían ser reacias a responder en las encuestas. A menudo, la forma en que las personas interactúan con las computadoras revela aspectos de sus intereses que no expresarían en una entrevista o incluso en una encuesta anónima.

Por ejemplo, Stephens-Davidowitz explora datos relacionados con la orientación sexual. Señala que hay grandes diferencias regionales en la cantidad de hombres que informan que son homosexuales. Por ejemplo, muchos más hombres en Rhode Island se identifican como gay en las encuestas que los hombres en Mississippi. Podría ser que los hombres homosexuales se muden a estados que son más tolerantes, pero también podría ser que los hombres homosexuales en estados menos tolerantes sean menos propensos a responder con sinceridad a las encuestas.

Stephens-Davidowitz usó datos de Facebook sobre dónde nacieron los hombres que se autoidentificaron como homosexuales y dónde se mudaron. Hubo cierta tendencia al movimiento de lugares menos tolerantes a lugares más tolerantes. Pero ese movimiento por sí solo no explicaría las grandes diferencias regionales observadas en las encuestas.

A continuación, utilizó los datos de Google, que realiza un seguimiento de los tipos de búsquedas que realizan las personas y proporciona información sobre las ubicaciones a partir de las cuales se originaron las búsquedas. En particular, analizó la proporción de búsquedas de pornografía que buscan específicamente la pornografía entre hombres y mujeres homosexuales. Aproximadamente el 5 por ciento de todas las búsquedas de pornografía realizadas por hombres fueron por pornografía de hombres homosexuales. Esto fue cierto básicamente en todos los estados de EE. UU., Independientemente de cuán tolerante sea el estado. Esto sugiere que aproximadamente el 5 por ciento de la población masculina se siente atraída por los hombres y que esto es cierto en todos los estados.

Big Data también se puede usar para abordar preguntas que podrían ser difíciles o imposibles de responder de otras maneras. Mi ejemplo favorito en el libro proviene de una exploración de los sueños. Freud sugirió que los sueños pueden revelar deseos sexuales inconscientes simbólicamente. Un plátano o un pepino en un sueño, entonces, podría ser un sustituto de un pene.

Es difícil refutar una teoría como esta porque se suponía que los deseos que Freud discutía eran inconscientes. Eso significa que incluso si las personas hablan de sus sueños, por definición no pueden saber lo que significa el sueño.

Stephens-Davidowitz tomó datos de una aplicación que recopilaba descripciones de los sueños de los usuarios y miraba las descripciones de los sueños y encontraba todos los alimentos que se mencionaron. Observó los factores que predicen la frecuencia con que un alimento en particular aparecería en los sueños y luego descubrió que la frecuencia con la que se consumían esos alimentos era un gran predictor de su apariencia en los sueños, así como de la exquisitez de los alimentos.

Por lo tanto, hay alimentos en forma de falo en los sueños, como los pepinos y las bananas, pero parecen aparecer más con la frecuencia con que se comen que con cualquier otra cosa. Por ejemplo, los pepinos son el séptimo vegetal más popular en los sueños, y también son el séptimo vegetal más popular en general. Esto sugiere que no hay razón para creer que un plátano en un sueño sea algo más que un plátano.

Finalmente, Stephens-Davidowitz hace un buen trabajo al explorar algunos de los factores que pueden hacer que el análisis de big data no sea confiable. Supongamos que tiene algún rasgo complejo, como la inteligencia, y quiere saber si hay predictores genéticos de la inteligencia. Puede tratar de correlacionar las puntuaciones en las pruebas de coeficiente de inteligencia con los genes de las personas que toman esas pruebas. Ahora que los científicos tienen datos sobre secuencias de genes para mucha gente, este análisis se ha realizado varias veces en diferentes conjuntos de datos.

Cada vez que se realiza este análisis, los genes particulares aparecen como buenos predictores de las puntuaciones de CI dentro de ese conjunto de datos. El problema es que diferentes genes han aparecido en diferentes análisis. Esto sucede porque incluso cuando tienes muchos datos si tienes un gran número de posibles predictores (como genes) y tienes muchas oportunidades para notar una correlación que es solo el resultado de una variación aleatoria en ese conjunto de datos. Como resultado, si escucha un informe de que se ha encontrado un gen particular que predice algún rasgo, como la inteligencia, debe tratarlo con escepticismo hasta que se haya validado en varios conjuntos diferentes de datos.

Big Data no reemplazará las formas tradicionales en que hacemos psicología. En definitiva, los macrodatos nos brindan la oportunidad de ver cómo se relacionan los diferentes aspectos del entorno, pero no pueden decirnos qué factores causan comportamientos particulares. Para hacer eso, la psicología debe continuar haciendo el tipo de experimentación que ha sido central en el campo durante el último siglo. Pero, los grandes datos tienen un gran potencial para ser una herramienta importante para comprender el comportamiento de las personas.

Sigueme en Twitter.

Y en Facebook y en Google+.

Aquí hay información sobre mi libro más reciente Brain Briefs .

Eche un vistazo a mis libros Smart Thinking y Habits of Leadership, y Smart Change .

Escucha mi programa de radio en la radio KUT en Austin Two Guys on Your Head y sigue a 2GoYH en Twitter y en Facebook. El programa está disponible en iTunes y Stitcher.