Reformando nuestro sistema de prueba obsoleto

Los objetivos potenciales de la reforma escolar incluyen el plan de estudios (lo que debe enseñarse), la instrucción (cómo se imparte la enseñanza y quién lo hace) y las pruebas (el método por el cual se mide el aprendizaje). Como ya he discutido las instrucciones, me gustaría utilizar esta entrega para analizar qué se debe cambiar con respecto a las pruebas, un proceso actualmente tan obsoleto como la instrucción en el aula.

Gran parte de esta obsolescencia es el resultado de la continua confianza de la industria de las pruebas educativas en los supuestos que subyacen al modelo psicométrico clásico que nutrió, y fue avanzado por, los primeros intentos de desarrollar pruebas de inteligencia y aptitud. Las suposiciones que pueden haber sido sostenibles para construcciones que (a) eran de etiología desconocida, (b) poseían dominios de ítems que no podían ser especificados exhaustivamente, y (c) se creía (incorrectamente) que eran tanto estables como inmutables a la instrucción. De igual importancia, un puntaje perfecto (o un puntaje de cero) en las pruebas resultantes no podría interpretarse cuantitativamente porque era imposible para cualquier ser humano haber alcanzado la perfección en (o estar completamente desprovisto) de los atributos en cuestión.

El aprendizaje escolar, por otro lado, no posee ninguna de estas restricciones, aunque las pruebas de "logros" comerciales se construyen como si lo hiciera. Esto ha resultado muy desafortunado ya que los propósitos reales de las pruebas educativas son identificar qué parte del plan de estudios ha dominado cada estudiante y qué más se debe enseñar (o volver a enseñar).

Cómo deberían construirse las pruebas de aprendizaje escolar

Ya que sabemos qué causa el aprendizaje (instrucción) y qué debe enseñarse en nuestras escuelas (el plan de estudios), la evaluación del aprendizaje escolar no es ciencia de cohetes. Suponiendo que nuestro marco de tiempo de prueba continúe siendo un año escolar, "todo" lo que necesitamos hacer es:

1. Especifique todo el currículo de la escuela primaria a través del uso de los objetivos de instrucción con suficiente detalle para permitir que se escriban varios ítems de prueba para cada objetivo.

2. Construya pruebas de aprendizaje escolar mediante algún procedimiento defendible y transparente de esta lista de objetivos de instrucción y elementos de prueba. Estas pruebas pueden basarse en asignaturas académicas individuales (por ejemplo, matemáticas, comprensión de lectura) o temas de enseñanza más especializados dentro de una asignatura (por ejemplo, vocabulario de lectura a primera vista).

3. Administre cada prueba dos veces (preferiblemente a través de computadoras para que los resultados puedan estar disponibles de inmediato, almacenados de forma segura y distribuidos adecuadamente), una vez al principio del año y una vez al final. (No es necesario evaluar los objetivos o ítems idénticos dos veces dado que no es difícil garantizar la equivalencia si se emplean los mismos procedimientos de muestreo. Sin embargo, es necesario administrar las pruebas dos veces durante el mismo año, ya que la escuela tiene poco control sobre lo que ocurre durante los meses de verano.)

La diferencia entre el comienzo del año y los puntajes de las pruebas de fin de año representarán la cantidad absoluta del plan de estudios que cualquier estudiante determinado aprendió durante ese año. La mayor parte de esto será una función de la instrucción escolar, aunque hay (y siempre habrá) algún error asociado con inferencias basadas en puntajes de exámenes debido a muestreo, cómo un estudiante puede haber sentido durante una de las sesiones de prueba, exposición a escuela extra instrucción, y así sucesivamente. Nunca se desarrolló ninguna medida (física, psicológica o educativa) sin algún grado de error.)

Los puntajes de las pruebas construidos de esta manera tienen varias características interesantes, algunas de las cuales son:

1. No es necesario emplear puntajes estándar (como equivalencias de calificaciones, rangos de percentiles, etc.). Todas estas manipulaciones algebraicas, incluida la curva normal en sí, se utilizan únicamente para clasificar los puntajes de los pedidos con el fin de compararlos entre sí, lo cual es necesario solo cuando un examen es incapaz de medir la cantidad absoluta de algo. Las pruebas que evalúan el aprendizaje escolar deben ser capaces de producir ceros significativos (lo que indica que no se aprendió ningún plan de estudios) y puntajes perfectos (es decir, un dominio del 100% del plan de estudios). En otras palabras, los puntajes producidos por tales pruebas representarían la cantidad de aprendizaje que tiene lugar. Reducirlos a una lista ordenada de rango simple sería idiotez.

2. Las pruebas de este tipo tienen implicaciones de instrucción directa por sí mismas, ya que cada elemento representa un objetivo instructivo y, por lo tanto, un elemento perdido representa un concepto específico no aprendido que debe ser enseñado (o re-enseñado). Por lo tanto, la unidad de análisis más significativa a menudo se convierte en la respuesta de un alumno individual a cada elemento individual.

3. Porque todas las partes interesadas (maestros, padres y estudiantes) podrían tener acceso tanto a los objetivos de instrucción que deben ser enseñados como a los tipos de elementos que se usarán para evaluar el aprendizaje: (a) los maestros deben enseñar la prueba y deben emplear pruebas simuladas basadas en elementos similares (pero no idénticos) para determinar qué estudiantes han dominado qué objetivos inmediatamente después de la instrucción; (b) los padres también tendrían la capacidad de evaluar el progreso de sus hijos durante el año escolar; y (c) los estudiantes se familiarizarán tanto con el proceso de evaluación como con los tipos de elementos que enfrentarán al final del año.

4. Recursos como estos (es decir, la existencia de una traducción integral del currículo mediante objetivos instructivos, cada uno de los cuales iría acompañado de elementos de prueba) también podría acelerar el desarrollo de software suplementario de tutoría digital, hacer que la tutoría humana complementaria sea más efectiva y reducir los efectos de las habilidades diferenciales de toma de exámenes que contribuyen a la brecha de pruebas socioeconómicas.

Desde mi punto de vista, la única pregunta sin respuesta es por qué debería haber resistencia, fuera de la industria de pruebas, para sustituir ese proceso por nuestro modelo de prueba actualmente obsoleto.

Para una discusión más completa de las pruebas escolares, vea el Capítulo Ocho de TOO SIMPLE TO FAIL: un Caso para el Cambio Educativo (Oxford University Press) [[email protected]]