¿Se puede medir la sofisticación en la escritura?

Durante décadas, hemos tenido herramientas para medir la complejidad de la escritura que aún sobreviven en algunos programas de escritura como "Análisis de texto". Por ejemplo, la puntuación de Flesch Reading Ease y Flesch-Kincaid cuentan sílabas y palabras en oraciones. Sin embargo, la puntuación es cualquier cosa menos transparente. Para llegar a un puntaje de Flesch, usted -o, más probablemente, su software- usted confía en la fórmula:

206.835- (1.015 x longitud de frase promedio) – (84.6 x sílabas promedio por palabra).

Alternativamente, puede utilizar Flesch-Kincaid, que es más fácil de usar y que correlaciona el puntaje de Flesch con el porcentaje estimado de estadounidenses que pueden comprender el contenido medido por Flesch Reading Ease. Si un artículo obtiene una puntuación entre 0-30, solo los graduados universitarios pueden comprender completamente el contenido. En contraste, un alumno de quinto grado puede entender cualquier párrafo en el rango de 90-100, comprensible para más del 93 por ciento de los estadounidenses. Cuanto menor sea el puntaje, más fácil será la lectura. Puedes probar esta fórmula por ti mismo. Ejecuté los Huevos Verdes y el Jamón del Dr. Seuss a través de las fórmulas de Flesch-Kincaid y descubrí que el libro tiene un improbable -1.3. Este puntaje sugiere que el lector ideal de Huevos Verdes y Jamón es un feto.

Dejando a un lado las fórmulas opacas y los resultados extraños, las fórmulas de legibilidad revelan algo valioso sobre la forma en que medimos la complejidad de las oraciones: el conteo solo lo llevará tan lejos. Hasta la fecha, los estudios de estudiantes de primaria y segunda educación correlacionaron la creciente sofisticación en la escritura con longitudes de oraciones y cláusulas. Esta correlación tiene sentido, ya que las oraciones más largas se basan en frases y cláusulas, un marcador del comando del escritor sobre la estructura de la oración. Pero contar solo es problemático. Por ejemplo, contar las sílabas en una palabra para determinar su dificultad puede sesgar dramáticamente las medidas de complejidad. Incluso una palabra de dos sílabas puede variar drásticamente en las demandas que pone en la comprensión del lector. Considere la praxis y el béisbol , ambas palabras de dos sílabas. Mientras que un alumno promedio de tercer grado puede leer el béisbol con facilidad, la palabra praxis puede enviar incluso a algunos doctores a buscar sus diccionarios.

Ingrese el Marco Lexile®, un software disponible comercialmente que usa longitud de oraciones combinada con la frecuencia con la que los lectores suelen encontrar palabras. Además de contener un corpus de más de 100 millones de libros, artículos y sitios web en todo el mundo, Lexile también es muy influyente en la determinación de los niveles de lectura de los materiales en la educación primaria y secundaria. Además, los puntajes Lexile aparecen junto con los artículos en las bases de datos de las bibliotecas, proporcionando puntajes en todo, desde un artículo en un periódico local o The New Yorker hasta libros. Pero los investigadores se han centrado principalmente en la capacidad de Lexile para determinar la lectura apropiada para la edad de los estudiantes de educación primaria y secundaria. Esta omisión llevó a la estudiante graduada Samantha Miller a medir la validez de Lexile al evaluar la sofisticación general de oraciones y párrafos en un artículo publicado en The International Journal of Business Administration .

Encontramos que Lexile se correlacionaba positivamente con tres robustas medidas de sofisticación textual, que medimos utilizando un software que medía diecinueve medidas de la complejidad de la estructura de las oraciones. Lexile se correlacionó muy bien con las tres medidas más robustas de la complejidad de las oraciones: la longitud media de las oraciones y las cláusulas, así como el uso de nominales complejos o frases nominales. Lexile se correlacionó más con el uso del complejo nominal por cláusula u oración (p = <0,0001) y con la mediana de las cláusulas (p = <0,0002) y la mediana de la duración de la oración (p = 0,0013).

¿La comida para llevar? Los algoritmos de Lexile determinan con firmeza la sofisticación de las palabras emparejando las palabras que utilizan los escritores con un cuerpo en constante crecimiento de 100 millones de textos, valioso cuando se combina con otras medidas para evaluar la complejidad del nivel de las oraciones. ¿El resultado? Esos desconcertantes puntajes Lexile que surgen cuando se accede a un artículo de una base de datos de la biblioteca predicen de manera confiable la dificultad del contenido que está a punto de leer.