automático, integración de datos institucionales y sistemas de alerta temprana. A continuación, se
presenta una síntesis de los avances más relevantes entre 2021 y 2025, estructurados en cuatro ejes:
fundamentos conceptuales, modelos de predicción, sistemas de alerta temprana y consideraciones
institucionales y éticas.
Fundamentos conceptuales de la analítica del aprendizaje
Los trabajos de Papadogiannis et al. (2024) ofrecen una visión fundacional del campo, distinguiendo
claramente entre Educational Data Mining y Learning Analytics, y describiendo los métodos
tradicionales utilizados en educación, como clasificación, regresión, clustering y análisis secuencial.
Esta perspectiva demuestra que la analítica ha pasado de un enfoque centrado en la descripción de
patrones a uno orientado a la predicción y toma de decisiones. En la misma línea, Albreiki et al. (2021)
realizaron una revisión sistemática que muestra el predominio de técnicas de aprendizaje supervisado
(como Decision Trees, Naive Bayes y Logistic Regression) en la literatura previa a 2021, destacando la
importancia de los datos académicos y de interacción en LMS como insumos predictivos clave.
Zhang et al. (2021) complementan esta base conceptual al proponer un marco en cinco etapas para el
proceso analítico —recolección, formulación del problema, extracción de características, modelado y
aplicación— identificando desafíos persistentes como la fragmentación de datos, la falta de
integración entre plataformas y la baja calidad de las variables disponibles. Estas limitaciones siguen
presentes en instituciones que no han integrado plenamente sus sistemas académicos, como ocurre
con Moodle, Teams o plataformas internas de calificaciones.
Modelos predictivos y tendencias recientes
El desarrollo de modelos predictivos ha avanzado significativamente con la incorporación de técnicas
de aprendizaje profundo y modelos híbridos. Nguyen Thi Cam et al. (2024) demuestran que la
combinación de redes recurrentes (RNN) con máquinas de soporte vectorial semisupervisadas (S3VM)
alcanza precisiones superiores al 92%, mostrando que los modelos secuenciales son especialmente
eficaces en el análisis de datos educativos longitudinales. De forma complementaria, Andrade-Girón
et al. (2023) identifican, mediante una revisión sistemática, que algoritmos como Random Forest
continúan siendo altamente utilizados por su equilibrio entre interpretabilidad, rendimiento y robustez,
alcanzando precisiones cercanas al 99% en algunos contextos.
Por otro lado, Luo et al. (2024) introducen un enfoque multidimensional que integra características
académicas, temporales y contextuales, usando SHAP para mejorar la transparencia del modelo.
Finalmente, Kim et al. (2023) muestran que los datos académicos recientes —como calificaciones,
carga de cursos y progreso acumulado— tienen mayor poder predictivo que los datos demográficos,
una tendencia que se repite en estudios contemporáneos y que refuerza la importancia de integrar
plataformas institucionales.
Sistemas de alerta temprana y analítica aplicada
La incorporación de modelos predictivos en los sistemas de alerta temprana ha adquirido una
relevancia creciente en el ámbito de la educación superior. Chang et al. (2025) describen propuestas
que combinan técnicas de predicción algorítmica con estrategias de intervención personalizada,
evidenciando que la integración de alertas tempranas con acciones pedagógicas concretas contribuye
de manera significativa al incremento de las tasas de aprobación. Estos resultados ponen de
manifiesto que los sistemas de alerta temprana no deben limitarse únicamente a la identificación de
riesgos, sino que deben contemplar mecanismos que aseguren la implementación efectiva de
intervenciones oportunas.
LATAM Revista Latinoamericana de Ciencias Sociales y Humanidades, Asunción, Paraguay.
ISSN en línea: 2789-3855, abril, 2026, Volumen VII, Número 2 p 367.