This is an Eval Central archive copy, find the original at triplead.blog.
Hoy nos adentramos en un arte de medir el cambio: una lista esencial sobre diseños de evaluaciones de impacto. Incluye consejos prácticos sobre cuándo es mejor usarlas, cuándo no, y estudios de caso ilustrativos que demuestran la eficacia de cada método
1. Diseño Experimental (Aleatorizado)
Descripción: Asignación aleatoria de participantes en grupos de tratamiento y control.
Cuándo usarlo: Ideal cuando se puede controlar la asignación de los participantes y se busca obtener resultados robustos y libres de sesgo.
Cuándo NO usarlo: No es adecuado cuando la asignación aleatoria no es ética o factible.
Ejemplo 1: Evaluar el impacto de un nuevo programa educativo en el rendimiento académico de los estudiantes. Los estudiantes se asignan aleatoriamente a recibir el programa (grupo de tratamiento) o no (grupo de control).
Ejemplo 2 : Un estudio en Kenia evaluó el impacto de la distribución de mosquiteros tratados con insecticida en la reducción de la malaria. Los resultados mostraron una disminución significativa en los casos de malaria1.
2. Diseño Cuasi-Experimental
Descripción: Métodos como el diseño de regresión discontinua, diferencias en diferencias, y pareamiento.
Cuándo usarlo: Útil cuando la asignación aleatoria no es posible, pero se pueden identificar grupos comparables.
Cuándo NO usarlo: No es adecuado cuando no se pueden encontrar grupos comparables o cuando hay cambios simultáneos que afectan los resultados.
Ejemplo 1: Evaluar el impacto de una política de subsidios en el empleo. Se puede comparar el empleo antes y después de la implementación de la política en regiones con y sin subsidios.
Ejemplo 2: Un estudio en México utilizó diferencias en diferencias para evaluar el impacto del programa Oportunidades en la educación y salud de los niños. Se encontró que el programa mejoró significativamente la asistencia escolar y la salud infantil2.
3. Diseño No Experimental
Descripción: Observación y análisis de datos sin manipulación directa de variables.
Cuándo NO usarlo: No es adecuado cuando se requiere establecer una relación causal clara.
Ejemplo: Un análisis de la campaña de concienciación sobre el reciclaje en una ciudad mostró un aumento en las tasas de reciclaje, aunque no se pudo atribuir directamente a la campaña debido a la falta de un grupo de control3.
4. Diseño de Regresión Discontinua
Descripción: Utiliza un umbral claro para la asignación al tratamiento.
Cuándo usarlo: Ideal cuando existe un criterio de corte claro y se puede comparar a los que están justo por encima y por debajo del umbral.
Cuándo NO usarlo: No es adecuado cuando el umbral no es claro o cuando hay manipulación alrededor del umbral.
Ejemplo 1: Un estudio en Colombia evaluó el impacto de las becas educativas otorgadas a estudiantes con calificaciones justo por encima de un umbral específico. Se encontró que las becas aumentaron significativamente la probabilidad de graduación4.
5. Diferencias en Diferencias
Descripción: Compara los cambios en los resultados a lo largo del tiempo entre un grupo de tratamiento y un grupo de control.
Cuándo usarlo: Útil cuando se tienen datos longitudinales y se puede asumir que las tendencias habrían sido similares en ausencia del tratamiento.
Cuándo NO usarlo: No es adecuado cuando las tendencias preexistentes entre los grupos son diferentes.
Ejemplo: Un estudio en Estados Unidos utilizó diferencias en diferencias para evaluar el impacto de la reforma laboral en las tasas de empleo. Se encontró que la reforma aumentó las tasas de empleo en las regiones afectadas5.
6. Pareamiento (Matching)
Descripción: Empareja participantes del grupo de tratamiento con participantes del grupo de control que tienen características similares.
Cuándo usarlo: Adecuado cuando se dispone de datos detallados sobre las características de los participantes y se puede identificar un grupo de comparación adecuado.
Cuándo NO usarlo: No es adecuado cuando no se pueden encontrar suficientes coincidencias o cuando hay variables no observables importantes.
Ejemplo: Un estudio en India utilizó pareamiento por puntaje de propensión para evaluar el impacto de un programa de microcréditos en el empoderamiento de las mujeres. Se encontró que el programa mejoró significativamente el acceso a recursos financieros y la toma de decisiones en el hogar6.