También la educación y la formación continua (o long-life learning) se han visto sacudidas por la digitalización. Primeramente, aparecieron Learning Management Systems (LMS, como por ejemplo Moodle[1]), más o menos sencillos, que permitían la gestión de estudiantes, contenidos y cuestionarios simples (de respuesta única). Pronto, la tecnología evolucionó para permitir la corrección automática de preguntas abiertas y complejas en diferentes ámbitos de conocimiento (como por ejemplo LEARN-SQL[2]). Esto fue rápidamente aprovechado por las universidades para crear Massive Open Online Courses (como por ejemplo Coursera[3]) que podían ser seguidos gratuitamente por cientos de miles de estudiantes en todo el mundo de forma totalmente remota.
Como cualquier otro sistema informático, un LMS permite guardar trazas de las actividades realizadas por sus usuarios. Estas trazas pueden corresponder a acciones simples como una conexión, u otras más complejas como la propia resolución de ejercicios. Además, para cada una de estas acciones se pueden recoger todo tipo de características asociadas (además obviamente de las propias respuestas a cuestionarios), como el tiempo requerido para la resolución del ejercicio o el tipo de errores cometidos. Así, la aparición de tecnología Big Data, abre nuevas oportunidades en este ámbito gestionando y analizando esas trazas de forma eficaz y eficiente.
Desde el punto de vista de la gestión de los datos, los provenientes del LMS deben moverse a plataformas orientadas a su explotación, tales como bases de datos columnares, clave-valor, de gestión de documentos, de gestión de grafos, etc. En Big Data, es bien conocido que la plataforma de gestión de datos debe elegirse dependiendo de las características de los datos y el tipo de análisis que va a llevarse a cabo. Por ejemplo, para grandes volúmenes de datos, el ecosistema Hadoop (p.e., el stack HDFS, HBase, SparkSQL / SparkR), basado en el modelo clave-valor, es el estándar de facto. Por otro lado, desde el punto de vista del análisis de esos datos de aprendizaje, las técnicas utilizadas se conocen como Learning Analytics. Esta área se encarga en general del análisis del sistema educativo a todos los niveles, y en particular del análisis de los procesos de aprendizaje y su gestión. Para ello utiliza técnicas estadísticas, de minería de datos, inteligencia empresarial, modelización conceptual, visualización de datos, etc.
En definitiva, en Big Data no hay una solución de gestión y análisis universal, y es por ese motivo que es importante entender el problema, saber cuáles son los objetivos concretos y definir una solución a medida, adecuada para el problema que tengamos entre manos. Los sistemas Big Data, consecuentemente, pueden ser muy diversos entre ellos, y un arquitecto Big Data requiere un conocimiento transversal y profundo de tareas de gestión y análisis avanzadas. Este perfil tan completo y complejo es el verdadero motivo de las altas barreras de entrada en el área del Big Data, pues requiere una formación especializada y en profundidad en tareas diversas que tradicionalmente hacían roles bien diferenciados.
Formar profesionales capaces de aportar valor y aumentar la competitividad de sus organizaciones, al analizar y generar información relevante para la toma de decisiones en el negocio, es el objetivo del máster en Big Data Management, Technologies and Analytics de la UPC School. Esta especialización se basa en un doble perfil: el de gestión de datos en sistemas Big Data (Big Data Management) y el de explotación de estos datos para extraer conocimiento de interés para la organización con algoritmos de Data Mining y Machine Learning (Big Data Analytics).
En el caso específico de la formación y la educación, los resultados del análisis pueden usarse para optimizar los recursos utilizados, pero también para mejorar los resultados académicos de los estudiantes. En este último caso se habla de Adaptive Learning, refiriéndose a la posibilidad de personalizar el aprendizaje, detectando los problemas y dificultades de cada estudiante, para así adaptar los itinerarios y las actividades concretas, su cantidad, dificultad e incluso temática a cada necesidad particular. De esta manera, el Big Data se convierte en una herramienta imprescindible para la tarea de tutorización y orientación totalmente adaptada a cada individuo, que ayudará sin duda no solo a mejorar resultados académicos, sino también a optimizar la utilización de recursos por parte de los profesionales y del sistema en general.
No obstante, toda oportunidad viene acompañada de retos y amenazas. En este caso, la privacidad de los estudiantes puede quedar comprometida, pues los datos almacenados también pueden ser usados con el objetivo de identificar características del aprendizaje que promuevan la discriminación. El Big Data ya ha permitido encontrar correlaciones muy altas entre el comportamiento de usuarios de redes sociales genéricas como Facebook[4] y rasgos concretos de personalidad como la curiosidad para experimentar nuevas situaciones, la espontaneidad, la extraversión, o la inestabilidad emocional. Así, con el análisis de datos tan específicos como los de aprendizaje, se pueden obtener perfiles psicológicos mucho más concretos y precisos.
Además, por otro lado, aunque los docentes no aparecen especialmente amenazados por la robotización debido al nivel de creatividad necesario en sus tareas [5], el hecho de disponer de todos estos datos y la capacidad de analizarlos potencia y facilita claramente la automatización de las tareas de tutorización y orientación.
[1] www.moodle.org
[2] www.upc.edu/learn-sql
[3] www.coursera.org
[4] Personality and Patterns of Facebook Usage by Y. Bachrach, M. Kosinski, T. Graepel, P. Kohli, D. Stillwell, ACM Web Science Conference (WebSci), 2012.
[5] Creativity vs Robots by H. Bakhshi, C. Benedikt Frey and M. Osborne, Nesta 2015.