InterpretaciA?n de la Incidencia de la Pobreza Urbana en Argentina

Hace un par de semanas el Instituto Nacional de EstadA�stica y Censos (INDEC) publicA? la estimaciA?n de la incidencia de la pobreza urbana para del primer semestre de 2018. La mediciA?n dio 27.3% y la interpretaciA?n usual es que este es el porcentaje de personas debajo de la lA�nea de pobreza en la poblaciA?n urbana.

La Encuesta Permanente de Hogares (EPH) releva una muestra de hogares representativa de 31 aglomerados urbanos, por lo que para conocer el verdadero valor de la tasa de pobreza enA� la poblaciA?n urbana hay que considerar la variabilidad de la estimaciA?n. Esto es, si se seleccionara otra muestra representativa de los 31 aglomerados urbanos la estimaciA?n de la tasa de pobreza A?serA�a la misma? Probablemente la nueva estimaciA?n estarA�a cerca de 27.3% pero es muy difA�cil que de exactamente el mismo nA?mero. Es decir, hay cierta variabilidad en la estimaciA?n asociada a la selecciA?n aleatoria de las viviendas que componen la muestra. Existen varias formas de medir esta variabilidad. Una forma de medirla es a travA�s de la construcciA?n de intervalos de confianza. Con los datos publicados por el INDEC, el intervalo del 95% de confianza, por ejemplo, va desde 25.9% hasta 28.7% (ver Figura 1). La interpretaciA?n estadA�stica de este intervalo es que si uno pudiera seleccionar aleatoriamente muchas muestras (muchas EPH) de la poblaciA?n urbana en el primer semestre de 2018 y repitiera la estimaciA?n de la pobreza y la construcciA?n del intervalo del 95% de confianza, 95% de esos intervalos contendrA�a al verdadero valor del parA?metro poblacional (en este caso la tasa de pobreza en la poblaciA?n urbana en el primer semestre de 2018). Una interpretaciA?n habitual del intervalo de 95% de confianza es que es un intervalo que con el 95% de probabilidad contiene al verdadero valor de la incidencia de la pobreza urbana en el primer semestre de 2018. En otras palabras, con 95% de probabilidad la incidencia de la pobreza en la poblaciA?n urbana estA? entre 25.9% y 28.7%. La mitad del ancho del intervalo de confianza se conoce como margen de error y todo este procedimiento se conoce como inferencia estadA�stica. La inferencia estadA�stica nos permite afirmar, con cierta probabilidad, cual es el verdadero valor de la tasa de pobreza en la poblaciA?n urbana en el primer semestre de 2018.

Figura 1. EstimaciA?n de la Incidencia de la Pobreza Urbana

Nota: elaboraciA?n propia a partir de los datos oficiales publicados por INDEC.

A modo de ejemplo, antes de cada elecciA?n presidencial, diferentes consultoras toman muestras del padrA?n electoral y calculan el porcentaje de votos que sacarA�a cada partido el dA�a de la elecciA?n. Aun cuando las muestras representan a la misma poblaciA?n (padrA?n electoral) los resultados en cada muestra no son exactamente iguales, tienen variabilidad. Supongamos una de estas muestras representativas del padrA?n electoral. Sobre esta encuesta se podrA�a estimar el porcentaje de votos que saca el partido X, 40% digamos. A nadie se le ocurrirA�a, por ejemplo, declarar un ganador a partir de los resultados de una muestra sin realizar la elecciA?n (que revela el verdadero porcentaje de votos que saca el partido X en el total del padrA?n electoral). Las encuestas electorales, como solo son una muestra de la poblaciA?n bajo anA?lisis, tienen un margen de error. Este margen de error, digamos 3%, establece que el partido X podrA�a sacar entre 37% y 43% de los votos el dA�a de la elecciA?n. El margen de error representa la variabilidad que tiene el porcentaje de votos estimado para el partido X a partir de esa encuesta. Por otra parte, en la comparaciA?n con el porcentaje de votos de otro partido, W, tambiA�n se toma en cuenta este margen de error. Supongamos que el porcentaje de votos que saca el partido W en la muestra es de 36%, entonces podrA�a sacar entre 33 y 39% el dA�a de la elecciA?n. Esta situaciA?n se describe usualmente en los medios periodA�sticos como de a�?empate tA�cnico”, con estos resultados muestrales no podemos decir quiA�n ganarA? entre X y W.

Con la EPH pasa lo mismo. En el caso de la pobreza, el a�?40% de los votos” corresponde al 27.3% estimado para la incidencia y el margen de error es de 1.4%. La incidencia de la pobreza a�?sacarA�a” entre 25.9% y 28.7% a�?de los votos el dA�a de la elecciA?n” con un 95% de probabilidad. Sin embargo, es muy comA?n que tengamos en consideraciA?n el margen de error en la interpretaciA?n del resultado de una encuesta polA�tica pero no en la interpretaciA?n de los resultados de la Encuesta Permanente de Hogares. En esta A?ltima, la interpretaciA?n de los resultados se hace como si las estimaciones se hicieran a�?el dA�a de la elecciA?n y con todo el padrA?n electoral”. Se interpreta la estimaciA?n de la tasa de pobreza del primer semestre de 2018 de 27.3% como si fuera el a�?verdadero” valor de la incidencia en la poblaciA?n urbana del primer semestre de 2018 sin considerar el margen de error de la encuesta. Es decir, hay un 95% de probabilidad de que la incidencia de la pobreza en la poblaciA?n urbana sea 25.9% o 28.7% o cualquier valor entre esos lA�mites.

El mismo razonamiento se aplica cuando se quieren comparar dos estimaciones de la incidencia de la pobreza en el tiempo. Por ejemplo, para poder comparar la tasa de pobreza estimada para el segundo semestre de 2017 y la estimada para el primer semestre de 2018 hay que tomar en cuenta las variabilidades de las dos estimaciones (el margen de error de las dos estimaciones). En este caso, la inferencia se puede hacer mediante un contraste de hipA?tesis que establezca como hipA?tesis a contrastar que la incidencia de la pobreza en el total de la poblaciA?n urbana en el segundo semestre de 2017 es igual a la incidencia de la pobreza en el total de la poblaciA?n urbana del primer semestre de 2018. Denominando I�2sem17 a la tasa de pobreza urbana en la poblaciA?n del segundo semestre de 2017 y I�1sem18 a la misma tasa pero en el primer semestre de 2018, la hipA?tesis a contrastar es que I�2sem17 = I�1sem18, A? I�1sem18 – I�2sem17=0. Si se aceptara esta hipA?tesis se podrA�a afirmar, con cierta probabilidad, que la incidencia de la pobreza no ha aumentado entre esos dos semestres.

Para contrastar la hipA?tesis se utiliza un estadA�stico de contraste y su distribuciA?n muestral. En este caso el estadA�stico de contraste estA? basado en las dos tasas de pobreza estimadas. Intuitivamente si la resta de A�p1sem18=27.3% y p2sem17=25.7% da un valor cercano a 0 entonces se podrA�a afirmar que la tasa de pobreza no ha aumentado. Formalmente, este contraste se hace con el siguiente estadA�stico:

donde stderr(p1sem18 – p2sem17) es el error estA?ndar de la resta de los estimadores. Este estadA�stico, en muestras grandes como la de la EPH, tiene distribuciA?n normal estA?ndar. Para resolver el contraste se calcula el valor de t* y se lo compara con el valor crA�tico de la normal estA?ndar para algA?n nivel de significaciA?n. Por ejemplo, si uno utiliza como hipA?tesis alternativa a la que se contrasta la afirmaciA?n de que la tasa de pobreza en la poblaciA?n urbana en el primer semestre de 2018 es mayor a la del segundo semestre de 2017 (I�1sem18 – I�2sem17>0) el valor crA�tico relevante de la distribuciA?n normal para un nivel de significaciA?n del 5% es de 1.64. En este caso si t*<1.64 se acepta la hipA?tesis de que la incidencia de la pobreza urbana es igual en el primer semestre de 2018 que en el segundo de 2017 (al 5% de significaciA?n), mientras que si buy mentats fallout 3 t*>1.64 se puede afirmar con un 95% de probabilidad, que la tasa de pobreza ha aumentado. Si uno hace los cA?lculos a partir de los datos publicados por INDEC para esos dos semestres obtiene un t*=1.55. Este valor es menor a 1.64 y entonces se puede afirmar, con un 95% de probabilidad, que la incidencia de la pobreza en la poblaciA?n urbana se ha mantenido constante entre el segundo semestre de 2017 y el primero de 2018.

El mismo contraste se puede hacer si uno quiere saber si la tasa de pobreza urbana en el primer semestre de 2018 ha caA�do en relaciA?n a la tasa de pobreza A�del A�primer A�semestre A�de A�2017. A�En A�este A�caso A�el valor de t* es de -1.31 y la comparaciA?n con -1.64 nuevamente sugiere que al 5% de significaciA?n la incidencia de la pobreza en la poblaciA?n urbana no ha caA�do entre el primer semestre de 2017 y el primer semestre de 2018.

Cuando se utiliza el margen de error de las encuestas, la evidencia empA�rica presentada aquA� sugiere que la incidencia de la pobreza urbana en el primer semestre de 2018 no ha aumentado con respecto a la del segundo semestre de 2017 ni ha caA�do en relaciA?n al primer semestre de 2017 (a�?empate tA�cnico”).

Estos resultados resaltan la importancia de utilizar el margen de error de las encuestas cuando se interpretan los resultados de la mediciA?n de la pobreza en un semestre dado y en la comparaciA?n entre diferentes semestres. Si el margen de error se utiliza habitualmente en el anA?lisis de encuestas electorales serA�a deseable que se comenzara a usar tambiA�n para interpretar los resultados obtenidos con las encuestas a hogares.