Medidas de “valor agregado” para evaluar maestras

Esta nota fue publicada en el periódico Observador en Uruguay el 30/09/2014.

Una pregunta muy importante para mejorar la educación es, por supuesto, ¿qué cosas influyen positivamente en la educación de los estudiantes? Dentro de los candidatos a “cosas que mejoran la educación”, se han estudiado infinidad de alternativas. Entre un conjunto aún mayor de variables, se han evaluado el gasto por alumno, los métodos de enseñanza, el nivel educativo de los padres, si hay libros o no en el hogar del niño, la calidad de las instalaciones donde se estudia, la calidad de los directores de escuela, la distancia que debe recorrer el niño para llegar a la escuela, el tamaño de las clases, qué tan buenos son los compañeros del estudiante, el tamaño de las escuelas, y la calidad de las maestras.

Pero para contestar la pregunta de “qué influye en la educación” en forma más o menos científica, uno debe primero ponerse de acuerdo sobre cómo medir las variables que uno intenta relacionar. La primera dificultad en tratar de responder la incógnita es cómo definir “educación”, o más bien, cómo medirla. También, uno debe preguntarse cómo medir por ejemplo la calidad de las maestras.

Sobre cómo medir la educación, dos respuestas simples, probablemente demasiado simples, son: “voy a medir la educación como el resultado de los alumnos en alguna prueba estándar”; o “voy a medir educación como años completos de estudio”. En dos trabajos que discutiré hoy sobre cómo influye la calidad de una maestra en la educación del niño toman medidas más “relevantes” que una prueba. Los autores se fijan: cuánto gana en el futuro el estudiante en el trabajo; cuál es la probabilidad que el chico termine yendo a la universidad; cuál es la “calidad” de la universidad a la que va el alumno más adelante; qué tan probable es que la chica tenga un embarazo adolescente; qué tan “bueno” es el barrio donde termina viviendo más adelante.

Antes de pasar a la medición de la calidad de las maestras y su influencia, se sabe por ejemplo que un determinante importante del éxito académico de un estudiante es el nivel educativo de los padres. Por eso, hay programas que intentan educar a los adultos jóvenes, por su propio bien, pero también para que luego sus hijos estudien. Pero una forma más directa de influir en la educación de los niños es intentar actuar sobre la calidad de las maestras. Lo cual nos lleva de lleno a la pregunta de cómo medirla.

El foco inicial de la literatura fue medir el nivel educativo de la maestra. Hanushek (“Education production functions”, 2010) reporta los resultados los 377 estudios sobre qué determina la educación de los niños (ese era el universo de los trabajos publicados sobre el tema hasta 1995), y encuentra que sólo en 9% de esos estudios el nivel educativo de la maestra tuvo un efecto positivo significativo (y otros tantos encontraron un efecto negativo y significativo). Sólo 29% de los estudios encontró un efecto positivo de la experiencia de la maestra sobre los resultados educativos (71% fueron negativos o insignificantes; hoy se sabe que la experiencia mejora los resultados sólo los primeros 2-3 años). Por lo tanto, las dos candidatas obvias para medir calidad (educación y experiencia), no funcionan. ¿Qué nos queda?

Un método que se está usando mucho (en Estados Unidos) es medir la calidad de las maestras por su “valor agregado”: cuánto mejor les va a los alumnos de una maestra en pruebas estandarizadas, que lo que les hubiera ido si hubieran tenido una maestra “promedio”. El método es controversial por dos motivos al menos.

En primer lugar, es posible que los “buenos estudiantes” (o sus padres) se preocupen por ir con maestras que tienen altas medidas de valor agregado, que resultaría en esas maestras teniendo altas medidas de valor agregado, pero no porque ellas sean buenas. En segundo lugar, es posible que las maestras con alto valor agregado realmente no agreguen nada a la educación de los chicos, sino que simplemente son mejores en enseñarles a los chicos a tomar pruebas.

En dos trabajos aparecidos el jueves pasado en el American Economic Review, los autores Chetty, Friedman y Rockoff analizan esas dos preguntas. Concluyen en primer lugar que una medida de Valor Agregado de las maestras que tome en cuenta los resultados académicos previos de sus alumnos no estará sesgada por los potenciales pasajes de alumnos “persiguiendo” maestras buenas (en particular, si el alumno es de ese tipo, eso se habrá reflejado en sus resultados académicos previos).

En segundo lugar, toman esa medida de valor agregado, y se fijan si tiene algún poder predictivo: se preguntan si maestras con alto valor agregado tienen algún efecto en la educación de los niños, más allá de aumentar las notas que obtienen en las pruebas. Concluyen que incrementar la calidad de una maestra de un alumno a los 12 años, por un año, tiene un efecto importante y duradero en la educación del niño. En particular, muestran que aumentar la calidad de la maestra “una cantidad razonable” (un incremento en una desviación estándar) incrementa la probabilidad de ir a la universidad en 2%, y mejora la calidad de la universidad a la que terminan yendo. Un cambio similar de maestra incrementa los sueldos de sus alumnos más adelante en 1,3% por año, que resulta en ganancias para el niño en valor presente de USD 7.000. Con los tamaños de clase considerados, el cambio de maestra incrementa la riqueza de sus estudiantes (en una sola clase) en un cuarto de millón de dólares.

Para estas estimaciones los autores utilizan dos métodos estadísticos distintos. Una ilustración sencilla del primero y más intuitivo, es que comparan (por ejemplo) dos clases de una misma escuela en un año dado, y se fijan cuánto más ganaron 15 años después aquellos que tenían la maestra con el mayor “valor agregado”. Para la comparación, controlan por las características individuales de los alumnos (raza, nivel socioeconómico, etc). El segundo método se basa en comparar los resultados de una clase, con la clase siguiente, luego de que la maestra de la primera generación se fuera y la reemplazara otra maestra. Este segundo método confirma los hallazgos del primero y es un poco más “potente” estadísticamente.

La significancia estadística de los resultados, y los tamaños de los efectos hacen de estos trabajos una lectura obligada para aquellos interesados en el debate educativo.