Determinants of Spanish Students' Low Performance in Reading Comprehension in PISA

A Machine Learning Approach

Authors

DOI: https://doi.org/10.6018/rie.650791
Keywords: PISA, machine learning, low performance, reading competence

Abstract

Low performance in reading comprehension is one of the major challenges in the Spanish educational system. Therefore, the objective of this study is to investigate the contextual determinants associated with this low reading performance. The sample consists of a total of 35,943 Spanish students and 1,089 educational centers that participated in the 2018 PISA assessment. The criterion variable is reading competence, which has been dichotomized (0 = medium and high performance, 1 = low performance). A total of 721 predictors were selected as independent variables. For data analysis, Random Forest machine learning algorithm was applied, and a multilevel binary logistic regression was conducted. The 30 most important variables related to students and school center explain 46% and 24% of the criterion variable, respectively. The final model (comprising both predictors) explains 47%. Among the main conclusions, the significance of educational process variables and non-cognitive and meta-cognitive constructs in low reading performance stands out. Therefore, the importance of addressing this educational phenomenon from a perspective less linked to socio-economic determinants and more focused on pedagogical aspects is emphasized.

Downloads

Download data is not yet available.
Metrics
Views/Downloads
  • Abstract
    9
  • PDF (Español (España))
    13
  • PDF
    13

References

Arroyo Resino, D.; Constante Amores, I. A., y Asensio Muñoz, I. (2019). La repetición de curso a debate: un estudio empírico a partir de PISA 2015. Educación XX1, 22(2), 69-92. https://doi.org/10.5944/educxx1.22479

Akande, S. O., y Oyedapo, R. O. (2018). Developing the Reading Habits of Secondary School Students in Nigeria: The Way Forward. International Journal of Library Science, 7(1), 15-20. Developing the Reading Habits of Secondary School Students in Nigeria: The Way Forward

Albelda Esteban, B. (2019). Contribución de las bibliotecas escolares a la adquisición de competencias en comprensión lectora en educación primaria en España: una aproximación a partir de los datos del estudio PIRLS 2016. Revista de educación, 384, 1-9. https://doi.org/10.4438/1988-592X-RE-2019-384-408

Antelm Lanzat, A. M., Gil López, A. J., Cacheiro González, M. L., y Pérez Navío, E. (2018). Causas del fracaso escolar: Un análisis desde la perspectiva del profesorado y del alumnado. Enseñanza & Teaching: Revista Interuniversitaria de Didáctica, 36(1), 129-149. https://doi.org/10.14201/et2018361129149

Arroyo Resino, D., Constante-Amores, A., Castro, M., y Navarro, E. (2024b) School effectiveness and high reading achievement of Spanish students in PISA 2018: a machine learning approach. Educación XX1, 27(2), 223-251. https://doi.org/10.5944/educxx1.38634

Arroyo Resino, D., Constante-Amores, A., Gil-Madrona, P., y Carrillo-López, P. J. (2024a). Student well-being and mathematical literacy performance in PISA 2018: a machine-learning approach. Educational Psychology, 44(3), 340–357. https://doi.org/10.1080/01443410.2024.2359104

Asensio Muñoz, I., Carpintero Molina, E., Expósito Casas, E., y López Martín, E. (2018). ¿Cuánto oro hay entre la arena? Minería de datos con los resultados de España en PISA 2015. Revista Española de Pedagogía (REP), 76(270), 225-245. https://doi.org/10.22550/REP76-2-2018-02

Astakhova, K. V., Korobeev, A. I., Prokhorova, V. V., Kolupaev, A. A., Vorotnoy, M. V., y Kucheryavaya, E. R. (2016). The Role of Education in Economic and Social Development of the Country. International Review of Management and Marketing, 6(1S), 53-58. https://econjournals.com/index.php/irmm/article/view/1865

Barrera, J. E. C., Polanco, J. G., y Acosta, J. D. (2019). Comprensión lectora de estudiantes universitarios. Factores asociados y mecanismos de acción. Revista Venezolana de Gerencia, 24(87), 874-889. https://www.redalyc.org/articulo.oa?id=29060499015

Breiman, L. (2001). Random forests. Machine Learning, 45(1), 5–32. https://doi.org/10.1023/A:1010933404324

Beltrán, A. C., Seinfeld, J. C., Narro Llacza, O., y Lisboa Vásquez, C. (2011). Hacia una educación de calidad: La importancia de los recursos pedagógicos en el rendimiento escolar. Universidad del Pacífico, CIES.

Calero, J., Choi, A., y Waisgrais, S. (2010). Determinantes del riesgo de fracaso escolar en España: una aproximación a través de un análisis logístico multinivel aplicado a PISA-2006. Revista de Educación, numero extraordinario, 225-256. https://www.educacionfpydeportes.gob.es/revista-de-educacion/numeros-revista-educacion/numeros-anteriores/2010/re2010/re2010-09.html

Choi de Mendizábal, Á., y Calero Martínez, J. (2013). Determinantes del riesgo de fracaso escolar en España en PISA-2009 y propuestas de reforma. Revista de Educación, 362, 562-593. https://doi.org/10.4438/1988-592X-RE-2013-362-242

Constante-Amores, A., Arroyo-Resino, D., Sánchez-Munilla, M., y Asensio-Muñoz, I. (2024). Contribution of machine learning to the analysis of grade repetition in Spain: A study based on PISA data [Contribución del machine learning al análisis de la repetición escolar en España: un estudio con datos PISA]. Revista Española de Pedagogía, 82 (289), 539-562. https://doi.org/10.22550/2174-0909.4014

Cameron, A. C., y Windmeijer, F. A. (1997). An R-squared measure of goodness of fit for some common nonlinear regression models. Journal of econometrics, 77(2), 329-342. https://doi.org/10.1016/S0304-4076(96)01818-0

Carrillo-López, P. J., Constante-Amores, A., Arroyo-Resino, D., y Sánchez-Munilla, M. (2022). Self-concept and academic achievement in primary school: A predictive study. International Journal of Education in Mathematics, Science, and Technology (IJEMST), 10(4), 1057-1073. https://doi.org/10.46328/ijemst.2303

Comisión Europea. (2016). Abandono Escolar. Fichas temáticas del semestre europeo. Consejería de Educación. european-semester_thematic-factsheet_early-school-leavers_es.docx

Crespo Cebada, E. (2018). Fracaso escolar español: Una comparativa internacional con datos de PISA. Universidad de Extremadura, Servicio de Publicaciones. http://hdl.handle.net/10662/20543

Cordero, J. M., Crespo, E., y Pedraja, F. (2011). Rendimiento educativo y determinantes según PISA: Una revisión de la literatura en España. Revista de Educación, 362, 361‑388. http://dx.doi.org/10.4438/1988-592X-RE-2011-362-161

Cutimbo Estrada, P. M. (2008). Influencia del nivel de capacitación docente en el rendimiento académico de los estudiantes del Instituto Superior Pedagógico Público de Puno: caso de la Especialidad de Educación Primaria IX Semestre-2008 [Trabajo de fin de Grado, Universidad Nacional Mayor de San Marcos]. https://hdl.handle.net/20.500.12672/2395

Fernández-Lasarte, O., Goñi, E., Camino, I., y Zubeldia, M. (2019). Ajuste escolar y autoconcepto académico en la Educación Secundaria. Revista de Investigación Educativa, 37(1), 163-179. http://dx.doi.org/10.6018/rie.37.1.308651

Franco Montenegro, M. P., Cárdenas Rodríguez, R., y Santrich Sánchez, E. R. (2016). Factores asociados a la comprensión lectora en estudiantes de noveno grado de Barranquilla. Psicogente, 19(36), 296-310. https://doi.org/10.17081/psico.19.36.1299

García, M. A.; Arévalo D., M. A., y Hernández, C. A. (2018). La comprensión lectora y el rendimiento escolar. Cuadernos de Lingüística Hispánica, (32), 155-174. https://doi.org/10.19053/0121053X.n32.2018.8126

Garrido Yserte, R., Gallo-Rivera, M. T., y Martínez-Gautier, D. (2020). ¿Cuáles son y cómo operan los determinantes del fracaso escolar? Replanteando las políticas públicas para el caso de España y sus regiones. Revista Internacional de Ciencias del Estado y de Gobierno, 1(4), 509-540.

Gaviria Soto, J. L., y Castro Morera, M. (2005). Modelos jerárquicos lineales. La Muralla

Gil Flores, J., y García Gómez, S. (2017). Importancia de la actuación docente frente a la política educativa regional en la explicación del rendimiento en PISA. Revista de Educación, 378, 187 210. http://dx.doi.org/10.4438/1988-592x-RE-2017-378-361

González, R. L., y Jackon, C. L. (2014). Engaging with parents: The relationship between school engagement efforts, social class, and learning. School Effectiveness and School Improvement, 24(3), 225–316. http://dx.doi.org/10.1080/09243453.2012.680893

Gorostiaga, A., y Rojo-Álvarez, J. L. (2016). On the use of conventional and statistical-learning techniques for the analysis of PISA results in Spain. Neurocomputing, 171, 625–637. https://doi.org/10.1016/j.neucom.2015.07.001

Guerra-García, J., Saldívar-Llanos, A., y Sandria-López, S. (2021). Evaluación de comprensión lectora, uso de estrategias y su relación con variables académicas y sociodemográficas en estudiantes universitarios. Revista Innova Educación, 3(2), 360-373. https://doi.org/10.35622/j.rie.2021.02.005

Guio, J. M., y Choi, A. (2014). Evolución del riesgo de fracaso escolar en España durante la década del 2000: Análisis de los resultados de PISA con un modelo logístico de dos niveles. Estudios Sobre Educación, (26), 33-63. https://doi.org/10.15581/004.26.33-62

Hattie, J. (2009). Visible Learning: A Synthesis of Over 800 Meta-Analyses Relating to Achievement. Taylor & Francis. https://doi.org/10.4324/9780203887332

Hu, J., Peng, Y., y Ma, H. (2022). Examining the contextual factors of science effectiveness: a machine learning-based approach. School Effectiveness and School Improvement, 33, 21-50. https://doi.org/10.1080/09243453.2021.1929346

Huamán Herreros, J. A. (2024). Comprensión lectora y su relación con el rendimiento académico en estudiantes de secundaria. Revista Iberoamericana para la Investigación y el Desarrollo Educativo (RIDE), 15(29), e743. https://doi.org/10.23913/ride.v15i29.2109

Instituto Nacional de Estadística (2018). Panorama educativo de México. Indicadores del Sistema Educativo Nacional 2017. Educación básica y media superior. Instituto nacional para la evaluación de la educación. Pnorama_educativo.pdf

Jiménez-Pérez, E. D., Martínez León, N., y Cuadros Muñoz, R. (2020). La influencia materna en la inteligencia emocional y la competencia lectora de sus hijos. Revista de Estudios Sobre Lectura, 19(1), 80-89. https://doi.org/10.18239/ocnos_2020.19.1.2187

Kassambara, A. (2018). Machine learning essentials: Practical guide in R. STHDA.

Laukaityte, I., y Wiberg, M. (2017) Using plausible values in secondary analysis in large-scale assessments. Communications in Statistics - Theory and Methods, 46(22), 11341-11357. https://doi.org/10.1080/03610926.2016.1267764

Lee, V. E. (2000). Using hierarchical linear modeling to study social contexts: The case of school effects. Educational Psychologist, 35(2), 125-141. https://doi.org/10.1207/S15326985EP3502_6

Marchesi, A. (2003). El fracaso escolar en España. Fundación Alternativas-Documento de Trabajo 11/2003. https://fundacionalternativas.org/wp-content/uploads/2022/07/xmlimport-ZPRlx1.pdf

Martín-Ruiz, I., y González-Valenzuela, M. J. (2022). Autoconcepto académico, motivación y rendimiento escolar en estudiantes de Educación Secundaria Obligatoria. Anales de Psicología, 38(2), 251–259. https://dx.doi.org/10.6018/analesps.419111

Ministerio de Educación y Formación Profesional. (2020a). El sistema estatal de indicadores de la Educación. Instituto Nacional de Evaluación Educativa. https://www.libreria.educacion.gob.es/libro/sistema-estatal-de-indicadores-de-la-educacion-2020_180617/

Ministerio de Educación y Formación Profesional. (2020b). PISA 2018. Resultados de lectura en España. Instituto Nacional de Evaluación Educativa. https://www.libreria.educacion.gob.es/libro/pisa-2018-resultados-de-lectura-en-espana_181801/

Molina Ibarra, C. A. (2020). Comprensión lectora y rendimiento escolar. Revista Boletín Redipe, 9(1), 121-131. https://doi.org/10.36260/rbr.v9i1.900

Murillo, F. J., y Hernández-Castilla, R. (2020). ¿La implicación de las familias influye en el rendimiento? Un estudio en educación primaria en América Latina. Revista de Psicodidáctica, 25(1), 13-22. https://doi.org/10.1016/j.psicod.2019.10.002

Nakagawa, S., y Schielzeth, H. (2013). A general and simple method for obtaining R² from generalized linear mixed-effects models. Methods in Ecology and Evolution, 4(2), 133–142. https://doi.org/10.1111/j.2041-210x.2012.00261.x

Organización para la Cooperación y el Desarrollo Económicos (OCDE). (2015). Education Policy Outlook 2015: Making Reforms Happen. OECD Publishing. http:// dx.doi.org/10.1787/9789264225442-en

Organización para la Cooperación y el Desarrollo Económicos (OCDE). (2016). PISA. Low-Performing Students. Why they fall behind and how to help them succeed. OECD Publishing. https://doi.org/10.1787/9789264250246-en

Organización para la Cooperación y el Desarrollo Económicos (OCDE). (2018). Marco teórico de lectura PISA 2018. Instituto Nacional de Evaluación Educativa, Ministerio de Educación, Cultura y Deporte, España

Organización para la Cooperación y el Desarrollo Económicos (OCDE). (2019). PISA 2018 assessment and analytical framework. OECD Publishing. https://doi.org/10.1787/b25efab8-en

Organización para la Cooperación y el Desarrollo Económicos (OCDE). (2025). PISA 2022 Technical Report. OECD Publishing. https://doi.org/10.1787/01820d6d-en

Ostria Baltazar, C. E., López Padilla M. G., y Valenzuela González, J.R. (2014). Caracterización de las competencias transversales. La competencia lectora: identificación del nivel de logro. Investigaciones Sobre Lectura, 2, 32-43. http://hdl.handle.net/10481/33864

Pardo, M., y Ruiz, M. (2013). Análisis de Datos en Ciencias Sociales y de la Salud III. Síntesis.

Raschka, S., y Mirjalili, V. (2019). Python Machine Learning: aprendizaje automático y aprendizaje profundo con Python. Scikit-Learn y TensorFlow. Marcombo.

Rouse, C. E., y Krueger, A. B. (2004). Putting computerized instruction to the test: A randomized evaluation of a “scientifically based” reading program. Economics of Education Review, 23(4), 323-338. https://doi.org/10.1016/j.econedurev.2003.10.005

Vélez, E., Schiefelbein, E., y Valenzuela, J. (1994). Factores que afectan el rendimiento académico en la educación primaria: Revisión de la literatura de América Latina y el Caribe. Revista latinoamericana de Innovaciones Educativas, 17, 1-16. https://hdl.handle.net/20.500.12799/4317

Viramontes, E., Amparán, A., y Núñez, L. D. (2019). Comprensión lectora y el rendimiento académico en Educación Primaria. Investigaciones Sobre Lectura, 12, 65-82. http://hdl.handle.net/10481/60379

Published
06-03-2026
How to Cite
Constante Amores, A., Arroyo Resino, D., Navarro Asencio, E., & Castro Morera, M. (2026). Determinants of Spanish Students’ Low Performance in Reading Comprehension in PISA: A Machine Learning Approach. Revista De Investigación Educativa, (44). https://doi.org/10.6018/rie.650791
Issue
Section
Articles