Statistical matching en la práctica – Una aplicación a la evaluación del sistema educativo mediante PISA y TALIS
Resumen
Con el nombre Statistical Matching se identifican un conjunto de técnicas que posibilitan integrar información obtenida mediante encuestas independientes con unidades muestrales distintas. El objetivo es obtener un fichero de datos sintético con información plausible para ítems provenientes de distintas fuentes. Método: El Matching parte de la existencia de variables comunes entre los ficheros, usualmente, variables sociodemográficas. Este bloque de información común se emplea para imputar los ítems específicos de las encuestas. Resultados: Explicitamos las fases principales del Statistical Matching y las aplicamos a las encuestas PISA 2012 y TALIS 2013 de España. Proporcionamos pautas para una validación de los resultados. En todas las fases se ha utilizado el software libre R. Conclusiones: La potencialidad de Statistical Matching es enorme en tanto que posibilita enlazar ficheros de origen distinto. Las técnicas de Statistical Matching son accesibles gracias al desarrollo de diversos paquetes de R. Su aplicación en Ciencias Sociales puede ser solución a multitud de problemas metodológicos y contribuir a un mejor conocimiento de la realidad social
Descargas
Citas
Breakspear, S. (2012). The policy impact of PISA: An Exploration of the Normative Effects of International Benchmarking in School System Performance. OECD Journals, 71, 1–32. http://dx.doi.org/10.1787/19939019
Choi, A., & Jerrim, J. (2016). The Use (and Misuse) of PISA in Guiding Policy Reform: The Case of Spain. Comparative education. 56(2), 230–245. http://dx.doi.org/10.1080/03050068.2016.1142739
D’Orazio, M., Di Zio, M., & Scanu, M. (2006). Statistical Matching: Theory and Practice. NJ: Wiley.
D’Orazio, M. (2012). StatMach: Statistical Matching. R package version 1.2.0. http://CRAN.R-project.org/package=StatMatch
D’Orazio, M. (2013). Statistical Matching: Metodological issues and practice with R-StatMatch (or. 69). XXVI. Seminario Internacional de Estadística. Eustat. http://www.eustat.es/prodserv/seminario_i.html#axzz2sF9JV1rV
Eurostat (2008). Recommendations on the use of methodologies for the integration of surveys and administrative data. http://www.cros-portal.eu/sites/default/files//Report_of_WP2.doc
Fernández-Díaz, M. J.; Rodríguez-Mantilla J. M., & Martínez-Zarzuelo, A. (2016). PISA y TALIS ¿congruencia o discrepancia? RELIEVE, 22(1), art. M6. http://dx.doi.org/10.7203/relieve.22.1.8247
González-Such, J., Sancho-Álvarez, C., & Sánchez-Delgado, P. (2016). Cuestionarios de contexto pisa: Un estudio sobre los indicadores de evaluación. RELIEVE, 22(1), art. M7. http://dx.doi.org/10.7203/relieve.22.1.8274
Gustafsson, J. E. (2003). What Do We Know About Effects of School Resources on Educational Results? Swedish Economic Policy Review, 10, 77-110.
Jolani S, Frank L.E., & van Buuren S (2014). Dual imputation model for incomplete longitudinal data. British Journal of Mathematical and Statistical Psychology, 67(2), 197-212. http://dx.doi.org/10.1111/bmsp.12021
Jong R., van Buuren S., & Spiess M. (2014). Multiple imputation of predictor variables using generalized additive models. Communications in Statistics - Simulation and Computation, 45(3), 1-18. http://dx.doi.org/10.1080/03610918.2014.911894
Kaplan, D., & Turner, A. (2012). Statistical Matching of PISA 2009 and TALIS 2008 Data in Iceland (OECD Education Working Papers). Paris: Organisation for Econo- mic Co-operation and Development. http://www.oecd-ilibrary.org/;jsessionid=2ah7v0n0eg9ce.x-oecd-live-02content/workingpaper/5k97g3zzvg30-en
Kaplan, D., & Turner, A. (2013). Data fusion with international large scale assessments: a case study using the OECD PISA and TALIS Surveys. Springer-Verlag. http://link.springer.com/article/10.1186%2F2196-0739-1-6/fulltext.html
Leulescu, A., & Agafitei, M. (2013). Statistical matching: A model based approach for data integration. Luxembourg: European Commission, Eurostat. Publications Office.
OECD (2012). Pisa 2012. http://www.oecd.org/pisa/keyfindings/pisa-2012-results.htm
OECD (2013). Talis 2013. http://www.oecd.org/edu/school/talis.htm
Rässler, S. (2002). Statistical matching. A frequentist theory, practical applications, and alternative Bayesian approaches. New York: Springer.
Rubin. D.B. (1987). An overview on multiple imputation. http://www.amstat.org/sections/srms/Proceedings/papers/1988_016.pdf
Taut, S., & Palacios, D. (2016). Interpretaciones no intencionadas e intencionadas y usos de los resultados de PISA: Una perspectiva de validez consecuencial. RELIEVE, 22(1), art. M8. http://dx.doi.org/10.7203/relieve22.1.8294
Van Buuren, S., & Groothuis-Oudshoorn, K. (2011). MICE: Multivariate Imputation by Chained Equations in R. Journal of Statistical Software, 45(3), 1–67.
Van Buuren, S. (2014). Mice. Imputation by random forests. http://www.inside-r.org/packages/cran/mice/docs/mice.impute.rf
Wheater, R. (2013). Achievement of 15 year olds in England: PISA 2012 national report. OECD Programme for International Student Assessment. https://www.nfer.ac.uk/publications/PQUK02/PQUK02.pdf
Las obras que se publican en esta revista están sujetas a los siguientes términos:
1. El Servicio de Publicaciones de la Universidad de Murcia (la editorial) conserva los derechos patrimoniales (copyright) de las obras publicadas, y favorece y permite la reutilización de las mismas bajo la licencia de uso indicada en el punto 2.
2. Las obras se publican en la edición electrónica de la revista bajo una licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 3.0 España (texto legal). Se pueden copiar, usar, difundir, transmitir y exponer públicamente, siempre que: i) se cite la autoría y la fuente original de su publicación (revista, editorial y URL de la obra); ii) no se usen para fines comerciales; iii) se mencione la existencia y especificaciones de esta licencia de uso.
3. Condiciones de auto-archivo. Se permite y se anima a los autores a difundir electrónicamente las versiones pre-print (versión antes de ser evaluada) y/o post-print (versión evaluada y aceptada para su publicación) de sus obras antes de su publicación, ya que favorece su circulación y difusión más temprana y con ello un posible aumento en su citación y alcance entre la comunidad académica.