Implicaciones técnicas y prácticas de las Redes Adversarias Generativas a la Ciencia Abierta en Educación

Anabel Bethencourt-Aguilar; Dagoberto  Castellanos-Nieves; Juan José  Sosa-Alonso; Manuel  Area-Moreira

doi:10.6018/riite.545881

Authors

Anabel Bethencourt-Aguilar Universidad de La Laguna https://orcid.org/0000-0002-3823-0835
Dagoberto Castellanos-Nieves Universidad de La Laguna https://orcid.org/0000-0002-3230-8638
Juan José Sosa-Alonso Universidad de La Laguna https://orcid.org/0000-0001-5615-5536
Manuel Area-Moreira Universidad de La Laguna https://orcid.org/0000-0003-0358-7663

DOI: https://doi.org/10.6018/riite.545881

Keywords: Artificial Intelligence, Synthetic Data, Privacy Protection, Open Science, Educational Technology

Supporting Agencies

Ministerio de Ciencia, Innovación y Universidades
Departamento de Didáctica e Investigación Educativa
Universidad de La Laguna
EDULLAB: Laboratorio de Educación y Nuevas Tecnologías
Escuela de Doctorado y Estudios de Postgrado
Gabinete de Planificación y Comunicación
Vicerrectorado de Agenda Digital, Modernización y Campus Central
Vicerrectorado de Innovación Docente, Calidad y Campus Anchieta
Unidad de Docencia Virtual (UDV)

Abstract

Generative Adversarial Networks (GANs), which are characteristic of Artificial Intelligence, allow the creation of synthetic anonymised data useful for Open Science in educational research. This study experiments with the creation of artificial data from a dataset obtained from a survey on levels of use of digital tools and frequency of personal activities with technology. The original data belong to a sample of students from postgraduate degrees at the University of La Laguna. The results show an adequate degree of similarity between the original data set and the set artificially created through predictive algorithms. Obtaining synthetic datasets equivalent to the original ones in structure, shape and extension allows the release of the data to the academic community, safeguarding the protection of confidential information and contrasting a technique that allows the promotion of Open Science from the collection and processing of the data. Generative Adversarial Networks can be used in educational research for the purpose of transparency in methodological and technical procedures and the dissemination of datasets for academic, research and educational purposes.

Downloads

Download data is not yet available.

Author Biographies

Anabel Bethencourt-Aguilar, Universidad de La Laguna

Contratada Predoctoral en el Programa de Formación del Profesorado Universitario del Ministerio de Universidades del Gobierno de España, en el Departamento de Didáctica e Investigación Educativa de la Facultad de Educación, Universidad de La Laguna. Miembro del grupo de investigación e innovación EDULLAB (Laboratorio de Nuevas Tecnologías y Educación) desde 2017 hasta la actualidad y miembro de la Red Universitaria de Investigación e Innovación Educativa (REUNI+D). Miembro de la Cátedra Fundación Mapfre Guanarteme de Tecnología y Educación de la Universidad de La Laguna (TECNOEDU)

Dagoberto Castellanos-Nieves, Universidad de La Laguna

Profesor Titular de Universidad en el departamento de Ingeniería Informática y de Sistemas de la ULL. Su ámbito de investigación se ha centrado a diversos temas relacionados con el aprendizaje profundo, análisis predictivos, computación de altas prestaciones, representación del conocimiento, sistemas recomendadores, localización inteligente y, con las nuevas tendencias en educación y las tecnologías educativas. Forma parte de los grupos de investigación " Grupo de Computación Inteligente" (GCI) y " Grupo de Computación de Altas Prestaciones (GCAP), ambos de la Universidad de La Laguna.

Juan José Sosa-Alonso, Universidad de La Laguna

Profesor Ayudante Doctor en el departamento de Didáctica e Investigación Educativa de la ULL. Su ámbito de investigación se ha centrado a diversos temas relacionados con evaluación psicopedagógica, atención al alumnado con NEAE, evaluación institucional, asesoramiento a familias y, más recientemente, con las nuevas tendencias en educación y la tecnología educativa. Forma parte de los grupos de investigación consolidados "Laboratorio de Educación y Nuevas Tecnologías" (EDULLAB) y "Poder, Saber y Subjetividad en la Educación" (POSASUE), ambos de la Universidad de La Laguna

Manuel Area-Moreira, Universidad de La Laguna

Dr. en Pedagogía y Catedrático de la Universidad de La Laguna ULL (Islas Canarias. España) en el Departamento de Didáctica e Investigación Educativa en la Facultad de Educación. Su ámbito de investigación y docencia es la Tecnología Educativa (Cultura digital y educación, Enseñanza con medios y tecnologías, eLearning, Alfabetización y TIC, Políticas educativas y ciudadanía digital, …). Es Investigador Principal del Laboratorio de Educación y Nuevas Tecnologías (EDULLAB) y Director de la Cátedra de Tecnología y Educación de Mapfre-Guanarteme en la ULL.

References

Abadal, E., & Anglada, L. (2020). Ciencia abierta: cómo han evolucionado la denominación y el concepto. Anales de Documentación, 23(1). https://doi.org/10.6018/analesdoc.378171

Alés, N. S. (2020). La Ciencia y Educación Abierta como movimientos articuladores de la investigación, la tecnología y la innovación: Experiencias del proyecto de Acceso Abierto de la Facultad de Comunicación de la Universidad de La Habana. Revista Publicando, 7(27), 65-72.

Alhadad, S. S. J., Searston, R. A., & Lodge, J. M. (2018). Interdisciplinary open science: What are the implications for educational technology research?. In M. Campbell, J. Willems, C. Adachi, D. Blake, I. Doherty, S. Krishnan, S. Macfarlane, L. Ngo, M. O’Donnell, S. Palmer, L. Riddell, I. Story, H. Suri & J. Tai (Eds.), Open Oceans: Learning without borders. Proceedings ASCILITE 2018 Geelong, (pp. 303-308).

Al-Qizwini, M., Barjasteh, I., Al-Qassab, H., & Radha, H. (2017). Deep learning algorithm for autonomous driving using GoogLeNet. 2017 IEEE Intelligent Vehicles Symposium (IV), 89-96. https://doi.org/10.1109/IVS.2017.7995703

Barua, S., Islam, M. M., Yao, X., & Murase, K. (2014). MWMOTE--Majority Weighted Minority Oversampling Technique for Imbalanced Data Set Learning. IEEE Transactions on Knowledge and Data Engineering, 26(2), 405-425. https://doi.org/10.1109/TKDE.2012.232

Bethencourt Aguilar, A., Castellanos Nieves, D., Sosa Alonso, J. J., & Area Moreira, M. (2022). Synthetic student dataset on levels of use of digital tools and frequency of personal activities with ICTs, Mendeley Data, v1, http://dx.doi.org/10.17632/rwz59sxtpn.1

Bethencourt-Aguilar, A., Area-Moreira, M., Sosa-Alonso, J. J., & Castellano-Nieves, D. (2021). The digital transformation of postgraduate degrees. A study on academic analytics at the University of La Laguna. 2021 XI International Conference on Virtual Campus (JICV), 1-4. https://doi.org/10.1109/JICV53222.2021.9600311

Bethencourt-Aguilar, A., Sosa-Alonso, J. J., Castellanos-Nieves, D. C., & Area-Moreira, M. (2021). Uso del campus virtual y el rendimiento académico del alumnado: Análisis antes, durante y después del impacto de la Covid-19 en la educación superior. InnoEduca Tic 2021: Libro de Actas de las VIII Jornadas Iberoamericanas de Innovación Educativa en el ámbito de las TIC y las TAC Las Palmas de Gran Canaria, 18 y 19 de noviembre de 2021, 2021, ISBN 978-84-09-35708-6, págs. 293-297. https://dialnet.unirioja.es/servlet/articulo?codigo=8227886

Bishop, C. M. (1995). Training with Noise is Equivalent to Tikhonov Regularization. Neural Computation, 7(1), 108-116. https://doi.org/10.1162/neco.1995.7.1.108

Burgos, D. (2020). Radical Solutions and Open Science: An Open Approach to Boost Higher Education. Springer Nature. https://doi.org/10.1007/978-981-15-4276-3

Chawla, N. V., Bowyer, K. W., Hall, L. O., & Kegelmeyer, W. P. (2002). SMOTE: Synthetic Minority Over-sampling Technique. Journal of Artificial Intelligence Research, 16, 321-357. https://doi.org/10.1613/jair.953

Conole, G., & Brown, M. (2018). Reflecting on the Impact of the Open Education Movement. Journal of Learning for Development, 5(3). https://doi.org/10.56059/jl4d.v5i3.314

Creswell, A., White, T., Dumoulin, V., Arulkumaran, K., Sengupta, B., & Bharath, A. A. (2018). Generative Adversarial Networks: An Overview. IEEE Signal Processing Magazine, 35(1), 53-65. https://doi.org/10.1109/MSP.2017.2765202

Douzas, G., & Bacao, F. (2017). Self-Organizing Map Oversampling (SOMO) for imbalanced data set learning. Expert Systems with Applications: An International Journal, 82(C), 40-52. https://doi.org/10.1016/j.eswa.2017.03.073

Douzas, G., & Bacao, F. (2018). Effective data generation for imbalanced learning using conditional generative adversarial networks. Expert Systems with Applications, 91, 464-471. https://doi.org/10.1016/j.eswa.2017.09.030

DeRouin, E. & Brown, J. (1991). Neural Network Training on Unequally Represented Classes. Intelligent Engineering Systems through Artificial Neural Networks, 135-140.

Fiore, U., De Santis, A., Perla, F., Zanetti, P., & Palmieri, F. (2019). Using generative adversarial networks for improving classification effectiveness in credit card fraud detection. Information Sciences, 479, 448-455. https://doi.org/10.1016/j.ins.2017.12.030

Fressoli, J. M., & Arza, V. (2018). Los desafíos que enfrentan las prácticas de ciencia abierta. Teknokultura. Revista de Cultura Digital y Movimientos Sociales, 15(2). https://doi.org/10.5209/TEKN.60616

González-Pérez, L. I., Ramírez-Montoya, M. S., & García-Peñalvo, F. J. (2022). Technological Enablers 4.0 to Drive Open Science and Education: Input to UNESCO Recommendations. RIED-Revista Iberoamericana de Educación a Distancia, 25(2), 23-48. https://doi.org/10.5944/ried.25.2.33088

Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., Courville, A., & Bengio, Y. (2014). Generative Adversarial Nets. Advances in Neural Information Processing Systems, 27. https://papers.nips.cc/paper/2014/hash/5ca3e9b122f61f8f06494c97b1afccf3-Abstract.html

Gou, C., Wu, Y., Wang, K., Wang, F.-Y., & Ji, Q. (2016). Learning-by-synthesis for accurate eye detection. 2016 23rd International Conference on Pattern Recognition (ICPR), 3362-3367. https://doi.org/10.1109/ICPR.2016.7900153

Han, H., Wang, W.-Y., & Mao, B.-H. (2005). Borderline-SMOTE: A New Over-Sampling Method in Imbalanced Data Sets Learning. En D.-S. Huang, X.-P. Zhang, & G.-B. Huang (Eds.), Advances in Intelligent Computing (pp. 878-887). Springer. https://doi.org/10.1007/11538059_91

He, H., Bai, Y., Garcia, E. A., & Li, S. (2008). ADASYN: Adaptive synthetic sampling approach for imbalanced learning. 2008 IEEE International Joint Conference on Neural Networks (IEEE World Congress on Computational Intelligence), 1322-1328 https://doi.org/10.1109/ijcnn.2008.4633969

Hinton, G. E., & Salakhutdinov, R. R. (2006). Reducing the dimensionality of data with neural networks. Science (New York, N.Y.), 313(5786), 504-507. https://doi.org/10.1126/science.1127647

Jones, N. (2015). Artificial-intelligence institute launches free science search engine. Nature. https://doi.org/10.1038/nature.2015.18703

Li, D.-C., & Fang, Y.-H. (2009). A non-linearly virtual sample generation technique using group discovery and parametric equations of hypersphere. Expert Systems with Applications, 36(1), 844-851. https://doi.org/10.1016/j.eswa.2007.10.029

Li, D.-C., & Lin, Y.-S. (2006). Using virtual sample generation to build up management knowledge in the early manufacturing stages. European Journal of Operational Research, 175(1), 413-434. https://doi.org/10.1016/j.ejor.2005.05.005

Li, J., Monroe, W., Shi, T., Jean, S., Ritter, A., & Jurafsky, D. (2017). Adversarial Learning for Neural Dialogue Generation https://doi.org/10.48550/arXiv.1701.06547

Logan, J. A. R., Hart, S. A., & Schatschneider, C. (2021). Data Sharing in Education Science. AERA Open, 7, Cornell University. https://doi.org/10.1177/23328584211006475

Mohamed, A., Dahl, G. E., & Hinton, G. (2012). Acoustic Modeling Using Deep Belief Networks. IEEE Transactions on Audio, Speech, and Language Processing, 20(1), 14-22. https://doi.org/10.1109/TASL.2011.2109382

Parti, K., & Szigeti, A. (2021). The Future of Interdisciplinary Research in the Digital Era: Obstacles and Perspectives of Collaboration in Social and Data Sciences - An Empirical Study. Cogent Social Sciences, 7(1). https://doi.org/10.1080/23311886.2021.1970880

Pascual, S., Bonafonte, A., & Serrà, J. (2017). SEGAN: Speech Enhancement Generative Adversarial Network, Cornell University. https://doi.org/10.48550/arXiv.1703.09452

Peset, F., & Millán González, L. (2017). Ciencia abierta y gestión de datos de investigación: RDM. Ediciones Trea.

Radford, A., Metz, L., & Chintala, S. (2015). Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks, Computer Science, abs/1511.06434.

Ramírez-Montoya, M. S., McGreal, R., & Agbu, J.-F. O. (2022). Complex Digital Horizons in the Future of Education 4.0: Insights from UNESCO Recommendations. RIED-Revista Iberoamericana de Educacion a Distancia, 25(2), 09-21. https://doi.org/10.5944/ried.25.2.33843

UNESCO (2021) Recomendación de la UNESCO sobre la Ciencia Abierta—UNESCO Biblioteca Digital. Recuperado 2 de noviembre de 2022, de https://unesdoc.unesco.org/ark:/48223/pf0000379949_spa

Santana, E., & Hotz, G. (2016a). Learning a Driving Simulator. En ArXiv e-prints. https://ui.adsabs.harvard.edu/abs/2016arXiv160801230S

Strcic, J., Civljak, A., Glozinic, T., Pacheco, R. L., Brkovic, T., & Puljak, L. (2022). Open data and data sharing in articles about COVID-19 published in preprint servers medRxiv and bioRxiv. Scientometrics, 127(5), 2791-2802. https://doi.org/10.1007/s11192-022-04346-1

Theodoridis, S., & Koutroumbas, K. (2006). Pattern Recognition, Third Edition. Academic Press, Inc.

Van der Zee, T., & Reich, J. (2018). Open Education Science. AERA Open, 4(3). https://doi.org/10.1177/2332858418787466

Van Dijk, W., Schatschneider, C., & Hart, S. A. (2021). Open Science in Education Sciences. Journal of Learning Disabilities, 54(2), 139-152. https://doi.org/10.1177/0022219420945267

Wang, K., Gou, C., Duan, Y., Lin, Y., Zheng, X., & Wang, F.-Y. (2017). Generative adversarial networks: Introduction and outlook. IEEE/CAA Journal of Automatica Sinica, 4(4), 588-598. https://doi.org/10.1109/JAS.2017.7510583

Wang, L., & Sng, D. (2015). Deep Learning Algorithms with Applications to Video Analytics for A Smart City: A Survey, Cornell University. https://doi.org/10.48550/arXiv.1512.03131

Xie, Z., Jiang, L., Ye, T., & Li, X. (2015). A Synthetic Minority Oversampling Method Based on Local Densities in Low-Dimensional Space for Imbalanced Learning. En M. Renz, C. Shahabi, X. Zhou, & M. A. Cheema (Eds.), Database Systems for Advanced Applications (pp. 3-18). Springer International Publishing. https://doi.org/10.1007/978-3-319-18123-3_1

Zhou, Z.-H., & Jiang, Y. (2004). NeC4.5: Neural ensemble based C4.5. IEEE Transactions on Knowledge and Data Engineering, 16(6), 770-773. https://doi.org/10.1109/TKDE.2004.11

Zhuang, Y., Wu, F., Chen, C., & Pan, Y. (2017). Challenges and opportunities: From big data to knowledge in AI 2.0. Frontiers of Information Technology & Electronic Engineering, 18(1), 3-14. https://doi.org/10.1631/FITEE.1601883

Technical and Practical Implications of Generative Adversarial Networks for Open Science in Education

Authors

Supporting Agencies

Abstract

Downloads

Author Biographies

Anabel Bethencourt-Aguilar, Universidad de La Laguna

Dagoberto Castellanos-Nieves, Universidad de La Laguna

Juan José Sosa-Alonso, Universidad de La Laguna

Manuel Area-Moreira, Universidad de La Laguna

References

Those authors who have publications with this journal accept the following terms:

Language

Make a Submission

Information

plazos

Deadlines

gite

twitter

dialnetmetricas