¿Por qué las estadísticas inferenciales?

Imagina que tenemos una pregunta: "¿Difieren los hombres y las mujeres en X?"

No importa cuál sea la "X": altura, empatía, conocimiento de la historia española del siglo XIII , o cualquier otra cosa, sabemos que cualquier hombre será diferente a cualquier mujer, pero lo que no sabemos es cómo los hombres " el promedio "difiere de las mujeres" en promedio. "Es decir, cuando hicimos nuestra pregunta inicial, probablemente quisimos saber cómo es la media para los hombres en comparación con la media para las mujeres. Pero nunca sabremos la media real para los hombres o la media real para las mujeres, porque eso implicaría medir a más de 7 mil millones de personas. Entonces, necesitamos, de alguna manera, obtener una muestra de hombres y una muestra de mujeres, compararlas y sacar una conclusión de eso.

Digamos que obtenemos una muestra de 100 hombres y 100 mujeres, y les preguntamos sobre la historia de España. En nuestra muestra, las mujeres tienen un promedio del 68% y los hombres un promedio del 63%. Ese es el resultado de nuestra muestra y es un resultado sólido como una roca. Pero, recuerde, no estamos particularmente interesados ​​en nuestra muestra: estamos interesados ​​en "hombres versus mujeres", no "hombres a los que miramos" versus "mujeres que miramos". Queremos usar nuestro muestra para inferir algo sobre la población más grande (y eso es lo que pone la inferencia en las estadísticas infermentales).

Hacer estas inferencias tiene un serio desafío: ¡cualquier diferencia que veamos en nuestras muestras podría deberse a la casualidad! Claro, nuestro grupo de hombres difiere de nuestro grupo de mujeres, pero eso no nos dice mucho en sí mismo, porque si escogiéramos dos grupos de hombres al azar, también serían diferentes. Este es un problema serio: dado que dos muestras obviamente diferirán entre sí en prácticamente todo lo que tratamos de medir (si podemos medir con suficiente detalle), ¿cómo podemos usar muestras para sacar conclusiones?

No todo está perdido, sin embargo, como nos dirá una pequeña intuición. Es probable que las diferencias encontradas por casualidad sean pequeñas, y es probable que sean de un tamaño muy diferente si realizamos la misma prueba nuevamente. Si pudiéramos repetir nuestra prueba una y otra vez (con nuevas muestras), nos ayudaría a hacer mejores inferencias: si obtuvimos muestras de 100 hombres y 100 mujeres 20 veces, y cada vez que encontramos mujeres que puntúan 5 puntos más que los hombres, sería mucho más seguro de nuestro hallazgo. Si bien la replicación no suele ser práctica, podemos usar una muestra para adivinar qué sucedería si la replicamos. Y nuestra intuición también nos puede ayudar a nosotros aquí: si encontramos una pequeña diferencia entre los grupos después de medir solo a un pequeño número de personas, es más probable que se deba a una posibilidad aleatoria que si encontramos una gran diferencia entre los grupos después de medir una mucha gente. Descomponiendo eso: 1) Es menos probable que las grandes diferencias se deban a la casualidad que las pequeñas diferencias, y 2) cuanto mayor sea el tamaño de la muestra, más verdadero es el punto 1.

Si pudiéramos obtener un buen manejo matemático de la parte "menos probable" frente a la "más probable" de esas afirmaciones, podríamos comenzar a usar nuestras muestras para hacer realmente buenas conjeturas sobre cuán replicables son nuestros resultados. Es decir, podríamos usar nuestra única muestra para predecir de manera fiable lo que sucedería si replicamos nuestro estudio un montón de veces. Ya acordamos anteriormente que si el resultado se repite una y otra vez, entonces tendremos confianza en sacar conclusiones sobre la población en general. Y ahora sabemos que podemos usar una sola muestra para sacar conclusiones sobre lo que sucedería si tuviéramos muchas muestras. Juntando las dos últimas oraciones: si pudiéramos sacar algo de matemática, podemos usar nuestra única muestra para hacer inferencias confiables sobre la población más grande.

Por lo tanto, no importa qué estadística inferencial utilizamos, la pregunta es siempre algo así como: "Esta diferencia que encontramos en nuestra muestra, ¿cuál es la probabilidad de que encontremos una diferencia tan grande, solo por casualidad?" Cuando es poco probable que nuestra diferencia observada se debe al azar, confiamos que es real.