Análisis de Factores Asociados empleando R
Los estudios de gran escala (Large Scale Assessment) proveen muy rica información para los países participantes, y para Latinoamérica como región, acerca de diferentes focos temáticos del proceso educativo, como lectura, matemáticas, ciencias y la educación cívica. Una de las ventajas de los estudios de gran escala, es que los datos producidos se hacen públicos facilitando el uso para agencias gubernamentales, organizaciones no gubernamentales, académicos u otros usuarios interesados. Sin embargo, el uso de este tipo de datos requiere de tratamientos particulares con diferentes aspectos de los estudios, de modo de garantizar la realización de inferencias y conclusiones adecuadas. Entre ellos, esto requiere atender al diseño muestral complejo, el escalamiento de pesos muestrales, la presencia de valores plausibles, entre otros elementos (Rutkowski et al., 2010). Ignorar estos diferentes aspectos, tiene consigo el riesgo de producir información de relevancia nacional y regional, que pudiera llevar a conclusiones erradas. Otra barrera de entrada al uso de este tipo de datos son los software estadísticos propietarios, capaces de realizar estimaciones con este tipo de diseños, los cuales poseen licencias de alto costo, no accesible para todos los usuarios (Sandoval-Hernández & Miranda, 2021). Frente a este escenario, el taller Análisis de Factores Asociados empleando R se propone como una buena oportunidad para subsanar estas dos barreras. Se le presenta a los participantes una introducción conceptual respecto de los aspectos críticos del diseño de estos estudios, junto a rutinas para producir resultados empleando software libre.
Instructores
Diego Carrasco, PhD., es académico e investigador del Centro de Medición MIDE UC, de la Pontificia Universidad Católica. Es Doctor en Psicología y Master en Métodos de investigación de la Universidad de Sussex, UK. Sus intereses de investigación se centran en la comparación de ambientes escolares, metodologías aplicadas al diseño, implementación y uso de datos estudios de gran escala.
Daniel Miranda, PhD., es académico e investigador del Centro de Medición MIDE UC, de la Pontificia Universidad Católica. Es Doctor en Sociología y Master en Psicología Social, de la Pontificia Universidad Católica. Sus intereses de investigación se encuentran enfocados en el estudio de la participación política, la socialización política y los métodos de investigación cuantitativa.
Ambos instructores cuentan con más de 5 años de experiencia realizando talleres de introducción al uso de datos secundarios empleando R para el Laboratorio Latinoamericano de Evaluación de la Calidad de la Educación (LLECE) de UNESCO, bajo el marco del Estudio Regional Comparativo y Explicativo (ERCE 2019); en el contexto de la conferencia internacional de la Comparative & International Education Society (CIES); y durante la conferencia de Istituto nazionale per la valutazione del sistema educativo di istruzione e di formazione (INVALSI), entre otros.
Contenidos
El taller cubre los contenidos de introducción a los aspectos centrales del diseño de los estudios de gran escala (e.g., muestreo probabilístico, muestras complejas, escalamiento de pesos, valores plausibles); preparación de datos y declaración de diseños para estimaciones poblaciones. Ejercicios de generación de descriptivos (e.g., medias, porcentajes), y modelos de regresión (lineal, y logística) con datos de estudios de gran escala, donde participan países de Latinoamérica (e.g., TIMSS, ICCS, PISA, ERCE).
Metodología
El enfoque de este taller es conceptual y práctico. Se introducen elementos conceptuales mediante presentaciones, y abordaje de preguntas por parte de la audiencia. Luego se ilustran ejemplos guiados de cómo realizar las diferentes tareas para producir resultados, bajo un “tidy framework” (Wickham & Grolemund, 2016), y un enfoque de desarrollo de análisis (Parker, 2017). Esto quiere decir que diferentes rutinas de procesos de análisis como la importación, preparación y generación de resultados son preparados como un proceso iterativo y reproducible.
Como taller introductorio el énfasis está en el uso del software R, mediante la revisión de ejemplos comentados y reproducibles. El estilo de código empleado es “opinionated” (Parker, 2017), en el sentido de que no es la única forma de producir resultados, sino que es presentado como una forma razonable de trabajo que posee diferentes ventajas para reproducibilidad y desarrollo de análisis estadísticos para la comunicación de resultados.