Inteligencia artificial generativa y aprendizaje matemático:  
revisión sistemática de variables mediadoras cognitivas,  
metacognitivas y afectivas  
Generative artificial intelligence and mathematics learning: systematic  
review of cognitive, metacognitive, and affective mediating variables  
Melvin Ramírez Bogantes  
Tecnológico de Costa Rica  
Heredia Costa Rica  
Artículo recibido: 18 de diciembre de 2025. Aceptado para publicación: 24 de abril de 2026.  
Conflictos de Interés: Ninguno que declarar.  
Resumen  
La integración de la inteligencia artificial generativa en la educación matemática ha producido  
resultados científicos heterogéneos desde el año 2022. Se realizó una revisión sistemática con  
protocolo PRISMA 2020 que sintetizó 165 artículos publicados entre 2020 y primer trimestre 2026,  
identificados en siete bases de datos: ERIC, Dialnet, Redalyc, Scopus, Web of Science, IEEE Xplore y  
SciELO. El análisis se estructuró en cuatro preguntas de síntesis: efectos cognitivos, metacognitivos,  
afectivos y moderadores del impacto. Los resultados revelan un efecto positivo moderado sobre el  
rendimiento cuando el diseño pedagógico incorpora salvaguardas (g = 0.534; Liu et al., 2026), pero un  
efecto negativo significativo cuando el acceso es irrestricto (−17%; Bastani et al., 2025). Se identificó  
la paradoja de la autorregulación: los estudiantes más vulnerables son quienes más necesitan y más  
riesgo tienen con la herramienta sin soporte metacognitivo. Los efectos afectivos muestran reducción  
consistente de la ansiedad matemática en tres contextos culturales distintos, aunque la motivación  
global no alcanza significación estadística. Se propone el modelo de impacto mediado: inteligencia  
artificial generativa [diseño pedagógico × autorregulación del aprendizaje × alfabetización en  
inteligencia artificial] aprendizaje matemático, con nueve moderadores identificados.  
Palabras clave: inteligencia artificial generativa, educación matemática, revisión sistemática,  
autorregulación del aprendizaje, ansiedad matemática  
Abstract  
The integration of generative artificial intelligence in mathematics education has produced  
heterogeneous scientific results since 2022. A PRISMA 2020 systematic review synthesized 165  
articles published between 2020 and the first quarter of 2026, identified in seven databases: ERIC,  
Dialnet, Redalyc, Scopus, Web of Science, IEEE Xplore, and SciELO. Analysis was organized around  
four synthesis questions: cognitive, metacognitive, and affective effects, and moderators of impact.  
Results reveal a moderate positive effect on performance when pedagogical design incorporates  
guardrails (g = 0.534; Liu et al., 2026), but a significant negative effect when access is unrestricted  
(−17%; Bastani et al., 2025). The self-regulation paradox is identified: the most vulnerable students  
need the tool most and are most at risk without metacognitive support. Affective effects show  
consistent mathematics anxiety reduction across three cultural contexts, though global motivation  
LATAM Revista Latinoamericana de Ciencias Sociales y Humanidades, Asunción, Paraguay.  
ISSN en línea: 2789-3855, abril, 2026, Volumen VII, Número 2 p 1647.  
effects are not statistically significant. A mediated impact model is proposed: generative AI →  
[pedagogical design × self-regulated learning × AI literacy] mathematics learning, with nine identified  
moderators.  
Keywords: generative artificial intelligence, mathematics education, systematic review, self-  
regulated learning, mathematics anxiety  
Todo el contenido de LATAM Revista Latinoamericana de Ciencias Sociales y Humanidades,  
publicado en este sitio está disponibles bajo Licencia Creative Commons.  
Cómo citar: Ramírez Bogantes, M. (2026). Inteligencia artificial generativa y aprendizaje matemático:  
revisión sistemática de variables mediadoras cognitivas, metacognitivas y afectivas. LATAM Revista  
Latinoamericana de Ciencias Sociales y Humanidades 7 (2), 1647 1661.  
LATAM Revista Latinoamericana de Ciencias Sociales y Humanidades, Asunción, Paraguay.  
ISSN en línea: 2789-3855, abril, 2026, Volumen VII, Número 2 p 1648.  
INTRODUCCIÓN  
Contexto y justificación  
El lanzamiento de ChatGPT en noviembre de 2022 inauguró un período de transformación acelerada  
en la educación matemática. Por primera vez, un sistema de inteligencia artificial generativa basado  
en un modelo de lenguaje de gran escala (LLM) estuvo disponible de forma masiva, gratuita e inmediata  
para estudiantes y docentes de todos los niveles. Desde entonces, la producción científica sobre el  
tema ha crecido de forma acelerada: la búsqueda sistemática realizada para este estudio identificó  
535 registros en siete bases de datos internacionales, reflejando la heterogeneidad metodológica y la  
frecuente contradicción de resultados que caracterizan un campo en formación  
La educación matemática latinoamericana enfrenta este desafío tecnológico en un contexto de  
brechas estructurales que amplifican tanto las oportunidades como los riesgos. La posibilidad de  
acceder a retroalimentación personalizada e inmediata podría democratizar el apoyo pedagógico; sin  
embargo, si la integración no va acompañada de diseño instruccional adecuado y formación docente  
sólida, existe el riesgo de ampliar las desigualdades educativas existentes.  
METODOLOGÍA  
Enfoque y diseño  
Esta revisión sistemática sigue el estándar PRISMA 2020 (Page et al., 2021). El diseño es de tipo  
síntesis mixta: cuantitativa para los meta-análisis disponibles en el corpus y narrativa estructurada para  
los estudios primarios. El protocolo fue definido antes de ejecutar las búsquedas, garantizando la  
independencia entre el diseño metodológico y los resultados hallados.  
Estrategia de búsqueda y fuentes  
Las búsquedas sistemáticas se ejecutaron en siete bases de datos internacionales: ERIC (acceso  
abierto), Dialnet (acceso abierto), Redalyc (acceso abierto), Scopus (acceso institucional TEC), Web of  
Science (acceso institucional TEC), IEEE Xplore (acceso institucional TEC) y SciELO (acceso abierto).  
La búsqueda cubrió el período enero de 2020 a marzo de 2026, ejecutada en cuatro rondas entre enero  
y marzo de 2026.  
Las ecuaciones de búsqueda combinaron los términos: ("generative artificial intelligence" OR  
"ChatGPT" OR "large language model" OR "LLM" OR "inteligencia artificial generativa") AND  
("mathematics education" OR "educación matemática" OR "mathematics learning" OR "aprendizaje  
matemático") AND ("cognitive" OR "metacognitive" OR "affective" OR "anxiety" OR "self-regulated  
learning" OR "motivation"). Las ecuaciones se adaptaron a la sintaxis específica de cada base. La  
búsqueda identificó 535 registros brutos; tras eliminar 10 duplicados entre bases, quedaron 525  
registros únicos para cribado.  
Criterios de elegibilidad  
La Tabla 1 presenta los criterios de inclusión y exclusión aplicados. Su definición siguió las  
recomendaciones PICOS (Población, Intervención, Comparación, Resultado, Diseño) adaptadas a  
revisiones en educación tecnológica.  
LATAM Revista Latinoamericana de Ciencias Sociales y Humanidades, Asunción, Paraguay.  
ISSN en línea: 2789-3855, abril, 2026, Volumen VII, Número 2 p 1649.  
Tabla 1  
Criterios de inclusión y exclusión protocolo PRISMA 2020  
Tipo  
INCLUSIÓN  
Código  
CI1  
Criterio  
Período 2020-2026  
CI2  
Participantes: estudiantes de secundaria, universitaria o docentes en  
formación en contexto de educación matemática  
Intervención: sistema de inteligencia artificial generativa (LLM: ChatGPT,  
GPT-4, Gemini, Claude u otro modelo de lenguaje grande) usado en  
actividades matemáticas  
Resultado: al menos una variable cognitiva, metacognitiva o afectiva  
relacionada con matemáticas, O revisión sistemática/meta-análisis sobre  
el tema  
CI3  
CI4  
CI5  
CI6  
Documento revisado por pares en revista indexada  
Idioma: español o inglés  
EXCLUSIÓN  
CE1  
CE2  
Solo técnico: benchmarks sin estudiantes reales  
Sin foco matemático específico: IA generativa en otras disciplinas sin  
componente matemático  
CE3  
CE4  
CE5  
CE6  
CE7  
Sin datos empíricos: editorial u opinión sin síntesis sistemática  
Revisión no sistemática: sin protocolo PRISMA o equivalente  
IA no generativa: sistemas expertos o tutores inteligentes pre-LLM  
Preprint sin revisión por pares certificada  
Duplicado entre bases de datos  
Nota: CI = criterio de inclusión; CE = criterio de exclusión. Los criterios se aplicaron en orden secuencial,  
deteniéndose en el primer CE aplicable para cada registro.  
Fuente: elaboración propia.  
Flujo de selección  
La Tabla 2 presenta el flujo completo de selección de estudios. El principal motivo de exclusión fue la  
ausencia de foco matemático específico (CE2, n = 223), seguido de la identificación de sistemas de  
inteligencia artificial no generativos, anteriores a los modelos de lenguaje grande (CE5, n = 89).  
Tabla 2  
Flujo de selección de estudios PRISMA 2020  
Fase  
N
Descripción  
Identificación total  
535  
Registros identificados en siete bases de datos (incluyendo  
duplicados entre bases)  
Tras deduplicación  
Excluidos en cribado  
525  
360  
Registros únicos sometidos a cribado  
CE2 (sin foco matemático, n=223); CE5 (no IA-G, n=89);  
CE1/CE3/CE4/CE6/CE7 (n=48)  
ELEGIBLES  
Para síntesis narrativa  
Para síntesis  
165  
127  
38  
Artículos que cumplen todos los criterios CI1-CI6  
Estudios primarios cualitativos, mixtos y encuestas  
Meta-análisis y revisiones con datos de efecto  
cuantitativa  
LATAM Revista Latinoamericana de Ciencias Sociales y Humanidades, Asunción, Paraguay.  
ISSN en línea: 2789-3855, abril, 2026, Volumen VII, Número 2 p 1650.  
Nota: k = número de artículos; EM = educación matemática; HOT = pensamiento de orden superior. La  
categoría 'Síntesis cuantitativa' incluye únicamente artículos con datos de tamaño de efecto o  
estimaciones estadísticas suficientes para síntesis numérica.  
Fuente: elaboración propia.  
Extracción de datos y calidad metodológica  
La extracción se realizó mediante un instrumento estructurado de 36 campos distribuidos en seis  
módulos: (A) identificación bibliográfica; (B) características del estudio; (C) descripción de la  
intervención con inteligencia artificial generativa; (D) variables de resultado y tamaños de efecto; (E)  
moderadores y contexto geográfico; y (F) evaluación de calidad metodológica. La calidad se evaluó  
con el instrumento CASP (Critical Appraisal Skills Programme), adaptado al tipo de diseño de cada  
artículo, en una escala de 0 a 20 puntos. El cribado inicial fue realizado por el investigador principal; un  
segundo revisor verificó de forma independiente una muestra aleatoria del 20% de las decisiones de  
inclusión, obteniendo un acuerdo del 91.3% (κ = 0.84).  
La síntesis cuantitativa reporta los tamaños de efecto originales de los meta-análisis disponibles  
(Hedges' g, d de Cohen, SMD) sin reestimación propia. La síntesis narrativa organiza los hallazgos  
según las cuatro preguntas de síntesis, destacando patrones de convergencia y condiciones  
moderadoras.  
Consideraciones éticas  
Este estudio sintetiza la investigación publicada y revisada por pares. No involucra participantes  
humanos directos y no requirió aprobación del comité de ética. Las fuentes citadas se atribuyen con  
fidelidad a sus autores originales y se respetan los criterios de propiedad intelectual en todos los casos.  
DESARROLLO  
Los meta-análisis disponibles sobre inteligencia artificial generativa en  
educación general reportan tamaños de efecto positivos de magnitud moderada (SMD  
= 0.45 (Han et al., 2025) y d = 0.68 (Ma & Zhong, 2025)), pero incluyen las  
matemáticas como uno de varios dominios sin especificidad en los moderadores. El  
meta-análisis más específico en educación matemática (Liu et al., 2026) reporta g  
= 0.534 sobre 22 estudios primarios (N = 5.232), con el dominio de la geometría y  
el modo de transformación creativa como moderadores de mayor tamaño de efecto. En  
sentido contrario, el ensayo controlado aleatorio de Bastani et al. (2025)  
documenta un efecto de −17% en el rendimiento de estudiantes de secundaria cuando  
el acceso a la herramienta es irrestricto, lo que apunta a que el diseño pedagógico  
condiciona, bajo determinadas condiciones, el signo del efecto.  
En el plano metacognitivo, Fan et al. (2024) acuñan el término pereza metacognitiva para describir la  
reducción sistemática de los procesos de planificación y autoevaluación ante el acceso irrestricto al  
sistema. Xu et al. (2025) demuestran que el soporte metacognitivo estructurado revierte este efecto.  
Sobre los efectos afectivos, Wang & Wei (2025), Polydoros et al. (2025) y Etcuban (2025) documentan  
reducciones consistentes de la ansiedad matemática en China, Grecia y Filipinas respectivamente,  
aunque el meta-análisis de Xia et al. (2025) no detecta cambios significativos en la motivación global  
(g = 0.299, NS).  
LATAM Revista Latinoamericana de Ciencias Sociales y Humanidades, Asunción, Paraguay.  
ISSN en línea: 2789-3855, abril, 2026, Volumen VII, Número 2 p 1651.  
Problema de investigación y objetivos  
El campo carece de una síntesis sistemática que articule los efectos cognitivos, metacognitivos y  
afectivos con el análisis de sus moderadores desde una perspectiva iberoamericana. Esta revisión  
tiene como objetivo sintetizar la evidencia disponible sobre los efectos de la inteligencia artificial  
generativa en el aprendizaje matemático, con énfasis en las variables mediadoras e implicaciones para  
el contexto latinoamericano.  
Las cuatro preguntas de síntesis que guían el análisis son: (PS1) ¿Qué efectos cognitivos produce la  
inteligencia artificial generativa en el aprendizaje matemático?; (PS2) ¿Cómo afecta a los procesos  
metacognitivos y de autorregulación?; (PS3) ¿Qué efectos tiene sobre variables afectivas como la  
ansiedad matemática y la motivación?; y (PS4) ¿Qué factores modulan la magnitud y el signo de estos  
efectos?  
La inteligencia artificial generativa designa sistemas computacionales basados en modelos de  
lenguaje grande (LLM, por sus siglas en inglés) que generan respuestas coherentes y contextualizadas  
en lenguaje natural. Una limitación estructural de estos sistemas con implicaciones directas para la  
educación matemática es su tendencia a producir respuestas matemáticamente incorrectas  
formuladas con aparente corrección, fenómeno denominado alucinación (Kalai & Vempala, 2024).  
Desde la Teoría de la Carga Cognitiva (Sweller et al., 2011), puede liberar carga extrínseca para el  
procesamiento germano o, en ausencia de diseño pedagógico, hacia la pasividad. Desde el marco  
vigotskiano, opera en la Zona de Desarrollo Próximo pero, a diferencia del tutor humano, no percibe la  
señal de retirar el andamio oportunamente. La Teoría de la Autorregulación del Aprendizaje  
(Zimmerman, 2000; Pintrich, 2004) proporciona la explicación más robusta de la paradoja central del  
corpus: los estudiantes con menor autorregulación previa son quienes más riesgo tienen de desarrollar  
dependencia disfuncional. El framework Intelligent-TPACK propuesto por Chiu (2025) integra estos  
marcos desde la perspectiva del conocimiento pedagógico docente para la inteligencia artificial.  
RESULTADOS  
Características del corpus (N = 165)  
El corpus presenta un sesgo temporal marcado hacia los años 2024-2025 (71.5% de los artículos),  
reflejo de la aceleración de producción científica posterior al lanzamiento de ChatGPT. Por región, Asia  
Oriental concentra el 40.0% (n = 66), seguida de Europa (20.6%, n = 34), América Latina (17.0%, n = 28)  
y los Estados Unidos y Canadá (14.5%, n = 24). Por diseño metodológico, predominan los estudios  
cuasi-experimentales y los estudios de caso (57.0% en conjunto), seguidos de revisiones sistemáticas  
y meta-análisis (21.2%). El sistema más estudiado es ChatGPT en sus versiones GPT-3.5 y GPT-4  
(72.1% del corpus). La calidad metodológica, evaluada mediante CASP, fue alta (17-20 puntos) en el  
28.9% del corpus, moderada (12-16) en el 53.3% y baja-aceptable (10-11) en el 17.8%.  
PS1: Efectos cognitivos  
La Tabla 3 sintetiza los tamaños de efecto reportados en los meta-análisis y ensayos controlados del  
corpus.  
LATAM Revista Latinoamericana de Ciencias Sociales y Humanidades, Asunción, Paraguay.  
ISSN en línea: 2789-3855, abril, 2026, Volumen VII, Número 2 p 1652.  
Tabla 3  
Tamaños de efecto sobre resultados cognitivos en educación matemática  
Estudio  
Liu et al. (2026) EM  
específico  
k
22  
N
5.232  
Tamaño de efecto  
g = 0.534*  
Métrica  
Hedges' g Matemáticas  
Dominio  
Han et al. (2025)  
68  
51  
N/R  
SMD = 0.45*  
d = 0.68*  
SMD  
Múltiple  
Múltiple  
Ma & Zhong (2025)  
Wang & Fan (2025)  
d Cohen  
g = 0.867* / g =  
0.457*  
Hedges' g STEM incl. EM  
Hedges' g Múltiple  
Xia et al. (2025) —  
afectivo  
g = 0.299 (NS)  
Bastani et al. (2025) —  
RCT  
Wu et al. (2024) RCT  
PA-GPT  
Pardos & Bhandari  
(2024) RCT  
1
1
1
~1.000  
61  
Otro  
Álgebra sec.  
17%*  
Positivo HOT*  
Otro  
STEM/Matemáticas  
Álgebra/Estadística  
274  
d Cohen  
≈0 vs tutor  
humano  
Lu et al. (2025) AI  
hints  
1
1
Positivo  
rendimiento*  
Otro  
Matemáticas/Física  
Sánchez-Ruiz et al.  
(2023)  
Negativo*  
d Cohen  
Matemáticas  
ingeniería  
Nota: g = Hedges' g; d = d de Cohen; SMD = diferencia de medias estandarizada; * = estadísticamente  
significativo (p < 0.05); NS = no significativo; HOT = pensamiento de orden superior; RCT = ensayo  
controlado aleatorio; N/R = no reportado.  
Fuente: elaboración propia.  
El meta-análisis de Liu et al. (2026), con mayor especificidad temática (22 estudios, N = 5.232),  
documenta un efecto positivo moderado (g = 0.534, IC 95%: [0.37, 0.70]) cuando la intervención con  
inteligencia artificial generativa está pedagógicamente diseñada. El ensayo controlado aleatorio de  
Bastani et al. (2025) el único RCT de gran escala específico en educación matemáticaaporta uno  
de los resultados más relevantes del corpus: los estudiantes con acceso irrestricto al sistema  
obtuvieron un rendimiento 17% inferior al grupo control en evaluaciones sin asistencia de la  
herramienta. Este efecto se revierte cuando el acceso está mediado por pistas pedagógicas diseñadas  
por docentes (GPT Tutor), que no mostró diferencias respecto al control. Pardos y Bhandari (2024)  
matizan estos resultados: en un experimento factorial (N = 274), ChatGPT produjo ganancias de  
aprendizaje equivalentes a las de un tutor humano en álgebra y estadística universitaria cuando se  
implementó un protocolo de verificación que redujo la tasa de errores del modelo. Sánchez-Ruiz et al.  
(2023) replican el patrón negativo en matemáticas para ingeniería en España.  
En el plano cualitativo, Kock et al. (2025) identifican tres esquemas de uso de ChatGPT en estudiantes  
de matemáticas de ingeniería: (a) procedimental, centrado en obtener resultados sin comprensión; (b)  
conceptual, orientado a construir entendimiento mediante el diálogo; y (c) estratégico, en el que el  
estudiante planifica su propio proceso de resolución con el sistema como interlocutor crítico. Este  
marco ofrece la taxonomía más precisa disponible para caracterizar la calidad de la interacción y  
LATAM Revista Latinoamericana de Ciencias Sociales y Humanidades, Asunción, Paraguay.  
ISSN en línea: 2789-3855, abril, 2026, Volumen VII, Número 2 p 1653.  
predice diferencialmente la profundidad del aprendizaje. Malik et al. (2025) documentan,  
adicionalmente, la viabilidad de usar modelos de lenguaje grande para generar tareas curriculares de  
calentamiento en secundaria mediante un proceso estructurado de tres etapas: observación,  
formulación de estrategia e implementación.  
PS2: Efectos metacognitivos y sobre la autorregulación  
El hallazgo estructural de PS2 es la paradoja de la autorregulación: los estudiantes con menor  
capacidad de autorregulación del aprendizaje son quienes más se beneficiarían de un apoyo externo,  
pero son también quienes presentan mayor riesgo de desarrollar dependencia disfuncional si el acceso  
no está diseñado con soporte metacognitivo explícito. Fan et al. (2024) denominan pereza  
metacognitiva al patrón de reducción de planificación, monitoreo y autoevaluación que se observa  
cuando los estudiantes tienen acceso total a ChatGPT sin estructura pedagógica. Xu et al. (2025)  
demuestran experimentalmente (N = 68) que el soporte metacognitivo estructurado revierte este  
efecto: el grupo con andamios explícitos mejora las tres dimensiones del ciclo de autorregulación,  
mientras el grupo control las deteriora.  
Contel y Cusi (2024) profundizan en este hallazgo mostrando que GPT-4 puede estructurar activamente  
la revisión metacognitiva durante la resolución de problemas cuando el estudiante mantiene una  
postura epistémica activa cuestionando, verificando y reformulandoen contraste con el uso pasivo  
como oráculo de respuestas. Huda et al. (2025) confirman este patrón en el contexto específico del  
cálculo diferencial (límites), documentando mejoras significativas en las tres dimensiones  
metacognitivas evaluadas cuando ChatGPT se integra en un entorno de indagación guiada.  
PS3: Efectos afectivos  
Tres estudios cuasi-experimentales independientes en China (Wang & Wei, 2025), Grecia (Polydoros et  
al., 2025) y Filipinas (Etcuban, 2025) documentan reducciones estadísticamente significativas de la  
ansiedad matemática, con mayor beneficio para estudiantes con alta ansiedad previa. Rizos et al.  
(2024) extienden este hallazgo a estudiantes con necesidades educativas especiales en matemáticas  
de secundaria en Grecia, identificando beneficios en participación y motivación un subgrupo que el  
corpus global había prácticamente ignorado. Chen et al. (2025) matizan el panorama positivo:  
mediante un modelo de ecuaciones estructurales demuestran que la ansiedad matemática predice  
significativamente la dependencia de la herramienta, la cual a su vez predice negativamente la  
autonomía cognitiva, configurando un circuito que puede deteriorar el aprendizaje a largo plazo.  
Sobre la motivación, el meta-análisis de Xia et al. (2025) reporta un efecto global no significativo (g =  
0.299, NS), coherente con la interpretación de que la motivación en matemáticas está mediada por  
factores profundos historia de fracasos, creencias sobre capacidad innata, ansiedad arraigadaque  
no se modifican con la mera disponibilidad de una herramienta. Estudios que integran la herramienta  
en metodologías activas (Susilawati et al., 2025, en Indonesia) sí reportan mejoras motivacionales, lo  
que sugiere que el efecto depende del diseño de la actividad, no del sistema en sí.  
PS4: Moderadores del impacto  
La Tabla 4 sintetiza los nueve moderadores identificados en el corpus, con su evidencia principal y nivel  
de certeza empírica.  
LATAM Revista Latinoamericana de Ciencias Sociales y Humanidades, Asunción, Paraguay.  
ISSN en línea: 2789-3855, abril, 2026, Volumen VII, Número 2 p 1654.  
Tabla 4  
Moderadores del impacto de la inteligencia artificial generativa en educación matemática  
Moderador  
Evidencia  
principal  
Dirección  
Certeza  
Implicación práctica  
Diseño pedagógico  
(guardrails)  
Bastani et al.  
(2025); Wu et al.  
(2024)  
Determina el  
signo del efecto  
Alta  
Sin diseño: efecto  
negativo posible  
Soporte  
metacognitivo  
Xu et al. (2025);  
Huda et al.  
(2025)  
Heung & Chiu  
(2025); Fan et al.  
(2024)  
Amplificador  
positivo  
Alta  
Alta  
Andamios explícitos  
imprescindibles  
SRL previo del  
aprendiz  
Amplificador  
positivo  
Paradoja: vulnerable =  
mayor riesgo  
Tipo de esquema  
de uso  
Kock et al.  
(2025)  
Amplificador  
positivo  
Moderada Uso estratégico >  
conceptual >  
procedimental  
Dominio  
matemático  
Liu et al. (2026)  
Moderador de  
magnitud  
Alta  
Geometría: mayor  
efecto; cálculo: mixto  
Ansiedad  
matemática previa  
Wang & Wei  
(2025); Chen et  
al. (2025)  
Doble efecto  
Moderada  
ansiedad pero posible  
dependencia  
Versión LLM  
Korkmaz Guler et Moderador de  
Moderada GPT-4 > GPT-3.5 en  
tareas complejas  
al. (2024)  
calidad  
Personalidad  
agente  
Lyu et al. (2025)  
Moderador  
afectivo  
Baja  
Alta apertura mayor  
engagement  
Necesidades  
educativas  
especiales  
Rizos et al.  
(2024)  
Potencial  
amplificador  
Baja  
Subgrupo con alto  
potencial. Prioridad  
agenda  
Nota: Certeza Alta = respaldada por RCT o meta-análisis con N > 500; Moderada = cuasi-experimentos  
con N razonable o múltiples estudios convergentes; Baja = estudio de caso único o evidencia inicial.  
SRL = autorregulación del aprendizaje.  
Fuente: elaboración propia.  
El moderador con mayor respaldo empírico en el corpus es el diseño pedagógico: la evidencia  
disponible sugiere que condiciona el signo del efecto, no sólo su magnitud. El soporte metacognitivo  
explícito y el nivel previo de autorregulación del aprendizaje son los dos moderadores de  
características del aprendiz con mayor certeza. Los esquemas de uso de ChatGPT (Kock et al., 2025)  
ofrecen un marco analítico nuevo que operacionaliza la calidad de la interacción con una precisión no  
disponible previamente en el campo. La brecha digital y el contexto latinoamericano tienen alta  
urgencia, pero baja certeza empírica: sólo el 17.0% del corpus corresponde a estudios de la región, y la  
mayoría son descriptivos o exploratorios. Panqueban y Huincahue (2024), en la única revisión  
sistemática disponible con foco latinoamericano, confirman esta subrepresentación y señalan que la  
brecha de acceso digital amplifica las desigualdades preexistentes en educación matemática.  
LATAM Revista Latinoamericana de Ciencias Sociales y Humanidades, Asunción, Paraguay.  
ISSN en línea: 2789-3855, abril, 2026, Volumen VII, Número 2 p 1655.  
DISCUSIÓN  
Interpretación de los resultados  
La síntesis del corpus permite formular el modelo de impacto mediado: inteligencia artificial generativa  
[diseño pedagógico × autorregulación del aprendizaje × alfabetización en inteligencia artificial] →  
aprendizaje matemático.  
Figura 1  
Modelo de impacto mediado de la inteligencia artificial generativa en el aprendizaje matemático  
Fuente: elaboración propia a partir de la síntesis del corpus (N = 165 artículos).  
En este modelo, el efecto de la herramienta no es directo ni unidireccional: ninguno de los tres  
mediadores opera de forma independiente. El diseño pedagógico puede compensar parcialmente  
déficits en autorregulación mediante andamios, pero no puede compensar la ausencia de  
alfabetización crítica hacia el sistema: un estudiante que acepta acríticamente respuestas incorrectas  
deteriora sus esquemas conceptuales independientemente de cómo esté estructurada la tarea.  
La taxonomía de esquemas de uso (Kock et al., 2025) operacionaliza la dimensión de alfabetización  
en inteligencia artificial de forma precisa: el uso procedimental representa una alfabetización mínima;  
el uso conceptual, una intermedia; y el uso estratégico, una plena. Esta gradación tiene implicaciones  
inmediatas para el diseño curricular: las intervenciones deberían secuenciar actividades que desplacen  
progresivamente el uso procedimental hacia el estratégico, en lugar de asumir que el estudiante  
desarrollará ese desplazamiento de forma espontánea.  
Implicaciones teóricas y prácticas  
La paradoja de la autorregulación tiene una dimensión de equidad que el corpus permite articular con  
precisión. Los estudiantes más vulnerables con mayor ansiedad, menor autorregulación y menor  
acceso material a tecnología de calidadson quienes más pueden beneficiarse y más riesgo tienen  
en implementaciones no diseñadas. Esto configura un dilema de diseño central: la restricción del  
acceso reproducirá inequidades; su apertura sin diseño las amplificaba. La solución no es ninguno de  
LATAM Revista Latinoamericana de Ciencias Sociales y Humanidades, Asunción, Paraguay.  
ISSN en línea: 2789-3855, abril, 2026, Volumen VII, Número 2 p 1656.  
los extremos sino la diferenciación: intervenciones con guardias pedagógicas más robustas para  
estudiantes con menor autorregulación previa, y progresiva reducción del andamio a medida que se  
consolida la autonomía.  
Los docentes en servicio, por su parte, muestran actitudes que oscilan entre la apertura y la cautela  
(Busuttil & Calleja, 2025), lo que subraya la necesidad de acompañar la integración con formación  
especializada. Para los formadores de docentes, el framework I-TPACK (Chiu, 2025) ofrece el marco  
más operativo disponible: el conocimiento pedagógico de inteligencia artificial (AI-PK) saber cómo  
diseñar interacciones con modelos de lenguaje grande que activen los procesos cognitivos del  
aprendizaje matemáticoes la competencia que, según el corpus revisado, más consistentemente se  
asocia con si la herramienta produce beneficio o daño en el aula. Este conocimiento no es transferible  
de la formación en tecnología general: requiere formación específica en educación matemática con  
inteligencia artificial generativa.  
Limitaciones  
Cuatro limitaciones merecen señalamiento explícito. Primera, la subrepresentación latinoamericana: el  
17.0% del corpus proviene de la región, con predominio de estudios descriptivos y ningún ensayo  
controlado con grupo de comparación realizado en América Latina. Segunda, el predominio de estudios  
breves: el 61% de los estudios primarios tiene una intervención de ocho semanas o menos, lo que  
impide pronunciarse sobre efectos a largo plazo. Tercera, la posible inflación de los tamaños de efecto  
promedio por sesgo de publicación (predominio de resultados positivos). Cuarta, la evolución  
tecnológica acelerada: los estudios con modelos GPT-3.5, dominantes hasta 2023, pueden no ser  
representativos del comportamiento de modelos actuales con mayores capacidades de razonamiento  
matemático.  
CONCLUSIÓN  
Esta revisión sistemática PRISMA 2020, basada en 165 artículos de siete bases de  
datos internacionales, permite identificar cuatro tendencias que, en el corpus  
revisado, muestran convergencia a través de estudios independientes. Primera: la  
evidencia del corpus sugiere un efecto positivo moderado sobre el rendimiento en  
educación matemática cuando el diseño pedagógico incorpora salvaguardas y soporte  
metacognitivo (g = 0.534, bajo condiciones controladas). Segunda: sin esas  
condiciones, puede deteriorar el aprendizaje de forma significativa (−17% en el  
RCT con mayor muestra del corpus), aunque la generalización de este hallazgo  
requiere réplica en otros contextos. Tercera: en el corpus revisado se asocia con  
reducción de la ansiedad matemática en tres contextos culturales distintos, aunque  
los efectos sobre la motivación global no alcanzaron significación estadística.  
Cuarta: la paradoja de la autorregulación que los estudiantes más vulnerables  
tienen el mayor potencial de beneficio y el mayor riesgoexige diseños  
diferenciados, no restricción de acceso.  
El modelo de impacto mediado propuesto sintetiza estos hallazgos en un marco accionable:  
inteligencia artificial generativa [diseño pedagógico × autorregulación × alfabetización en inteligencia  
artificial] aprendizaje matemático. La educación matemática latinoamericana dispone de evidencia  
orientadora aunque aún insuficiente para conclusiones causales regionalespara diseñar  
intervenciones informadas; lo que aún necesita con urgencia es investigación propia, con poblaciones  
LATAM Revista Latinoamericana de Ciencias Sociales y Humanidades, Asunción, Paraguay.  
ISSN en línea: 2789-3855, abril, 2026, Volumen VII, Número 2 p 1657.  
propias, en contextos propios. Generar esa evidencia es la contribución más valiosa que los  
investigadores de la región pueden hacer al campo en los próximos cinco años.  
Recomendaciones para futuras investigaciones  
La agenda de investigación más urgente para el contexto latinoamericano comprende: (1) estudios  
longitudinales de al menos un año académico completo sobre efectos en la competencia matemática,  
inexistentes en el corpus actual; (2) ensayos controlados en contextos de América Latina que permitan  
conclusiones causales regionales; (3) investigación sobre estudiantes con necesidades educativas  
especiales en matemáticas, con evidencia casi ausente en el corpus global; y (4) desarrollo y validación  
de instrumentos de medición en español de las dimensiones de autorregulación, ansiedad matemática  
y alfabetización en inteligencia artificial, herramientas instrumentales previas a cualquier síntesis  
empírica regional.  
LATAM Revista Latinoamericana de Ciencias Sociales y Humanidades, Asunción, Paraguay.  
ISSN en línea: 2789-3855, abril, 2026, Volumen VII, Número 2 p 1658.  
REFERENCIAS  
Bastani, H., Bastani, O., Sungu, A., Ge, H., Kabakcı, Ö., & Mariman, R. (2025). Generative AI without  
guardrails can harm learning: Evidence from high school mathematics. Proceedings of the National  
Academy of Sciences, 122(26), e2422633122. https://doi.org/10.1073/pnas.2422633122  
Busuttil, L., & Calleja, J. (2025). Teachers' beliefs and practices about the potential of ChatGPT in  
teaching mathematics in secondary schools. Digital Experiences in Mathematics Education, 11, 140-  
Chen, F., Chen, J., & Xu, Y. (2025). The more anxious, the more dependent? The impact of math anxiety  
on  
AI-assisted  
problem-solving.  
Psychology  
in  
the  
Schools,  
62,  
2685-2701.  
Chiu, T. K. F. (2025). Developing intelligent-TPACK (I-TPACK) framework from AI literacy and  
competency. Interactive Learning Environments, 33(7), 4189-4192.  
Contel, F., & Cusi, A. (2024). Investigating the role of ChatGPT in supporting metacognitive processes  
during problem-solving activities. Digital Experiences in Mathematics Education, 11, 167-191.  
Etcuban, J. O. (2025). The use of ChatGPT in addressing algebra anxiety and promoting confidence.  
International Electronic Journal of Mathematics Education, 20(1), em0804. https://www.iejme.com  
Fan, Y., Tang, L., Le, H., Shen, K., Tan, S., Zhao, Y., Shen, Y., Li, X., & Gašević, D. (2024). Beware of  
metacognitive laziness: Effects of generative AI on learning motivation, processes, and performance.  
British Journal of Educational Technology, 56(2), 489-530. https://doi.org/10.1111/bjet.13544  
Han, X., Peng, H., & Liu, M. (2025). Impact of generative artificial intelligence on learning outcomes: A  
systematic  
review  
and  
meta-analysis.  
Educational  
Research  
Review,  
48,  
100714.  
Heung, K., & Chiu, T. K. F. (2025). Does generative AI improve students' higher-order thinking? Meta-  
analysis of 29 experiments. PMC. https://doi.org/10.3389/fpsyg.2025.1543822  
Huda, N., Anwar, K., Novferma, N., & Kurniawan, W. (2025). ChatGPT scaffolding in supporting  
metacognition for limit concepts in guided inquiry mathematics learning. Journal of Information  
Technology Education, 24. https://doi.org/10.28945/5567  
Kalai, A., & Vempala, S. (2024). Calibrated language models must hallucinate. Proceedings of the 56th  
Annual  
ACM  
Symposium  
on  
Theory  
of  
Computing  
(STOC  
2024).  
Kock, Z.-j., Salinas-Hernández, U., & Pepin, B. (2025). Engineering students' initial use schemes of  
ChatGPT as an instrument for learning. Digital Experiences in Mathematics Education, 11, 192-218.  
Korkmaz Guler, N., Dertli, Z. G., Boran, E., & Yildiz, B. (2024). ChatGPT academic achievement in a  
mathematics exam. Pedagogical Research, 9(2), em0188. https://doi.org/10.29333/pr/14145  
LATAM Revista Latinoamericana de Ciencias Sociales y Humanidades, Asunción, Paraguay.  
ISSN en línea: 2789-3855, abril, 2026, Volumen VII, Número 2 p 1659.  
Liu, B., Zhang, W., & Wang, F. (2026). Can generative AI effectively enhance students' mathematics  
learning outcomes? A meta-analysis of empirical studies from 2023 to 2025. Education Sciences, 16(1),  
Liu, J., Sun, D., Sun, J., Wang, J., & Yu, P. L. H. (2025). Designing a generative AI enabled learning  
environment for mathematics word problem solving in primary schools. Computers and Education:  
Artificial Intelligence, 9, 100438. https://doi.org/10.1016/j.caeai.2025.100438  
Lu, Y., Supriya, K., Shaked, S., Simmons, E. H., & Kusenko, A. (2025). Incentivizing supplemental math  
assignments and using AI-generated hints is associated with improved exam performance. Physical  
Review  
Physics  
Education  
Research,  
21,  
010160.  
Lyu, X., Song, Y., Wang, X., Chen, M., & Liu, Z. (2025). The role of teachable agents' personality traits on  
student-AI interactions and mathematical learning. Computers and Education: Artificial Intelligence, 8,  
Ma, N., & Zhong, Z. (2025). A meta-analysis of the impact of generative AI on learning outcomes. Journal  
of Computer Assisted Learning, 41(5), e70117. https://doi.org/10.1111/jcal.70117  
Malik, R., Abdi, D., Wang, R., & Demszky, D. (2025). Scaffolding middle school mathematics curricula  
with  
large  
language  
models.  
British  
Journal  
of  
Educational  
Technology,  
56(2).  
Page, M. J., McKenzie, J. E., Bossuyt, P. M., Boutron, I., Hoffmann, T. C., Mulrow, C. D., Shamseer, L.,  
Tetzlaff, J. M., Akl, E. A., Brennan, S. E., Chou, R., Glanville, J., Grimshaw, J. M., Hróbjartsson, A., Lalu, M.  
M., Li, T., Loder, E. W., Mayo-Wilson, E., McDonald, S., ... Moher, D. (2021). The PRISMA 2020 statement:  
An updated guideline for reporting systematic reviews. BMJ, 372, n71. https://doi.org/10.1136/bmj.n71  
Panqueban, D., & Huincahue, J. (2024). Inteligencia artificial en educación matemática: Una revisión  
Pardos, Z. A., & Bhandari, S. (2024). ChatGPT-generated help produces learning gains equivalent to  
human  
tutor-authored  
help  
on  
mathematics  
skills.  
PLOS  
ONE,  
19(5),  
e0304013.  
Pintrich, P. R. (2004). A conceptual framework for assessing motivation and self-regulated learning in  
college students. Educational Psychology Review, 16(4), 385-407.  
Polydoros, G., Tsanaktsidis, C., Tsinakos, A., & Gkioxari, A. (2025). Innovative AI-driven approaches to  
mitigate math anxiety and enhance resilience in low-performing students. Psychology International,  
Rizos, I., Foykas, E., & Georgakopoulos, S. V. (2024). Enhancing mathematics education for students  
with special educational needs through generative AI: A case study in Greece. Contemporary  
Sánchez-Ruiz, L. M., Moll-López, S., Nuñez-Pérez, A., Moraño-Fernández, J. A., & Vega-Fleitas, E. (2023).  
ChatGPT challenges blended learning in engineering education: A case study in mathematics. Applied  
LATAM Revista Latinoamericana de Ciencias Sociales y Humanidades, Asunción, Paraguay.  
ISSN en línea: 2789-3855, abril, 2026, Volumen VII, Número 2 p 1660.  
Susilawati, W., Sharov, S., Pasqa, M., & Malik, H. (2025). Integrating realistic mathematics education, AI,  
and gamification to enhance students' learning motivation and problem-solving skills. Journal on  
Mathematics Education, 16(4), 1257-1282. https://doi.org/10.22342/jme.v16i4.pp1257-1282  
Sweller, J., Ayres, P., & Kalyuga, S. (2011). Cognitive load theory. Springer.  
Wang, J., & Fan, W. (2025). The effect of ChatGPT on students' learning performance, learning  
perception, and higher-order thinking: Insights from a meta-analysis. Humanities and Social Sciences  
Communications, 12, Art. 621. https://doi.org/10.1057/s41599-025-04787-y  
Wang, X., & Wei, C.-L. (2025). Influence of generative AI assisted learning on primary school students'  
math  
anxiety:  
An  
intervention  
study.  
Applied  
Cognitive  
Psychology,  
39(4),  
e70088.  
Wu, T.-T., Huang, Y.-M., Lee, H.-Y., Chen, P.-H., & Lin, C.-J. (2024). Integrating peer assessment cycle  
into ChatGPT for STEM education: A randomised controlled trial on knowledge, skills, and attitudes  
enhancement. Journal of Computer Assisted Learning, 41, e13085. https://doi.org/10.1111/jcal.13085  
Xia, Q., Li, W., Yang, Y., Weng, X., & Chiu, T. K. F. (2025). Systematic review and meta-analysis of  
generative AI effectiveness on students' motivation and engagement. Computers and Education: AI, 9,  
Xu, X., Qiao, L., Cheng, N., Liu, H., & Zhao, W. (2025). Enhancing self-regulated learning in generative AI  
environments: Critical role of metacognitive support. British Journal of Educational Technology, 56,  
Zimmerman, B. J. (2000). Attaining self-regulation: A social cognitive perspective. En M. Boekaerts, P.  
R. Pintrich, & M. Zeidner (Eds.), Handbook of self-regulation (pp. 13-39). Academic Press.  
Todo el contenido de LATAM Revista Latinoamericana de Ciencias Sociales y Humanidades, publicados en este  
sitio está disponibles bajo Licencia Creative Commons  
.
LATAM Revista Latinoamericana de Ciencias Sociales y Humanidades, Asunción, Paraguay.  
ISSN en línea: 2789-3855, abril, 2026, Volumen VII, Número 2 p 1661.