LATAM Revista Latinoamericana de Ciencias Sociales y Humanidades, Asunción, Paraguay.
ISSN en línea: 2789-3855, agosto, 2022, Volumen 3, Número 2, p. 193.
INTRODUCCIÓN
El primer paso para extraer información es recolectar los datos. Para proceder al análisis se
tienen que tomar en cuenta los KPI (indicadores) que mejor satisfagan a los objetivos
establecidos en un principio; este análisis permite examinar los datos en crudo para intentar
llegar a una solución con base a la información resultante.
La minería de datos tiene como finalidad prevenir a los dirigentes de las empresas o instituciones
sobre situaciones interesantes, anomalías o peligros que no se pueden detectar a simple vista
(Martínez Luna, 2011). La minería de datos es un área multidisciplinar, por lo que no es de
extrañar que se aplique al área de la enseñanza.
La minería de datos aplicada a la educación, es una disciplina emergente que busca desarrollar
nuevos métodos para explorar la información que se genera dentro de los ambientes educativos
con el fin de entender la forma en que los estudiantes aprenden (Rosado Gómez & Verjel Ibáñez,
2017), y así, tomar las decisiones que mejor se acoplen en la búsqueda de mejorar el proceso
educativo.
Entre los análisis que se pueden llevar a cabo en dichas instituciones están el predecir el
desempeño de los estudiantes, crear modelos de estudiantes, comparar el desempeño de los
profesores, encontrar patrones en la deserción escolar, entre otros. Es por ello que en las
instituciones educativas se llevan a cabo procesos ya sean manuales o automáticos para el
concentrado de datos y posterior procesamiento.
Uno de los problemas más recurrentes, no solo en las instituciones educativas sino en cualquier
empresa u organización, es la forma en que los datos son almacenados, pues es muy común que
se guarden en diferentes gestores, con diferente formato, o que los datos guardados difieran
entre semestres.
El caso particular que se analizó durante el desarrollo de este proyecto fue el concentrado de
información que el departamento de Sistemas y Computación del Instituto Tecnológico Nacional
de México Campus Colima lleva a cabo todos los semestres en hojas de cálculo, las cuales se
van llenando de manera manual a lo largo de los seis meses con las entregas de evaluación que
los docentes realizan al jefe del departamento.
Dado que el vaciado de información es completamente manual, existe la posibilidad de que
ocurran los famosos “errores de dedo” que por falta de tiempo no son corregidos la mayor parte
de las veces, también cabe señalar que las gráficas que son generadas en los archivos se hacen
mediante referencia de datos, por lo que, con un solo cambio de dato o movimiento afectará la
visualización del gráfico o la integridad de la información resultante.
Como una posible solución le fue propuesto al Departamento de Sistemas y Computación el
diseño de un formato para las fuentes de datos y Data Warehouse, además del desarrollo de una
plataforma web responsiva que permita la lectura de dichas fuentes y el análisis de los datos
recabados, dando así oportunidad a los jefes de docencia de realizar consultas dinámicas.
MATERIAL Y MÉTODOS
Para el desarrollo del proyecto se consultó una amplia variedad de herramientas, aplicaciones y
librerías, entre las cuales se seleccionaron aquellas de código abierto, que cuentan con licencia
gratuita o que son utilizadas por el Departamento de Sistemas y Computación. Como fuente de
datos se utilizan hojas de cálculo de Excel, en la cual, la primera hoja es la que contendrá la
información que será extraída por la plataforma.