MIME-Version: 1.0 Content-Type: multipart/related; boundary="----=_NextPart_01DC6E7D.D6A99E80" Este documento es una página web de un solo archivo, también conocido como "archivo de almacenamiento web". Si está viendo este mensaje, su explorador o editor no admite archivos de almacenamiento web. Descargue un explorador que admita este tipo de archivos. ------=_NextPart_01DC6E7D.D6A99E80 Content-Location: file:///C:/63CA2365/file1717.htm Content-Transfer-Encoding: quoted-printable Content-Type: text/html; charset="windows-1252"
DOI: https://doi.org/10.56712/latam.v6i6.5034
Ajuste del modelo de Heligman
Pollard a la mortalidad de México mediante redes
neuronales recurrentes
Adjustment of=
the
Heligman-Pollard model to mortality in Mexico u=
sing
recurrent neural networks
Gerardo =
Núñez
Medina
gnunez@colef.mx
https://orcid.org/0000-0001-8038-091X
El Colegio de la
Frontera Norte
Tijuana BC – México
Artículo recibido: 14 de agosto de 2025.
Aceptado para publicación: 16 de diciembre de 2025.
Conflictos de Interés: Ninguno que declarar.
Resumen
El modelo de Heligman Pollard
es una de las herramientas paramétricas más utilizadas para describir la
mortalidad por edad. Este trabajo explora el uso de una red neuronal
recurrente, programada en Python con TensorFlow=
con
el objetivo de aprender la relación entre tasas específicas de mortalidad y=
los
parámetros del modelo, utilizando como caso de estudio las tasas de mortali=
dad
de las entidades federativas de México para el periodo 2015 2025. Se diseño=
una
arquitectura recurrente con tres capas, que recibe secuencias de tasas de
mortalidad por edad y que produce una secuencia de salida de ocho parámetro=
s;
la red se entrenó con 1,024 secuencias (820 de entrenamiento y 204 de
validación) y su desempeño se evalúo mediante la raíz cuadrada del error cu=
adrático
medio (RMSE). Los resultados para el estado de =
Oaxaca
en 2019 muestran que la red neuronal entrenada es capaz de generar conjunto=
s de
parámetros demográficamente coherentes y una curva suavizada que reproduce
adecuadamente los patrones de mortalidad por edad, pero el ajuste obtenido
indica que, bajo las condiciones de datos y diseño considerados, el método
clásico sigue ofreciendo un mejor desempeño global.
Palabras clave: tasas específicas de mortalidad, aprendizaje profundo, tensorflow
Abstract
The Heligman-Pollard model is one of the=
most
widely used parametric tools for describing age-specific mortality. This pa=
per
explores the use of a recurrent neural network, programmed in Python with
TensorFlow, with the aim of learning the relationship between specific
mortality rates and model parameters, using as a case study the mortality r=
ates
of the federal entities of Mexico for the period 2015-2025. A three-layer
recurrent architecture was designed, which receives sequences of age-specif=
ic
mortality rates and produces an output sequence of eight parameters; the
network was trained with 1,024 sequences (820 for training and 204 for
validation) and its performance was evaluated using the root mean square er=
ror
(RMSE). The results for the state of Oaxaca in =
2019
show that the trained neural network can generate demographically consistent
parameter sets and a smoothed curve that adequately reproduces age-specific
mortality patterns, but the fit obtained indicates that, under the data and=
design
conditions considered, the classical method continues to offer better overa=
ll
performance.
Keywords: specific mortality rates, deep learning, tensorflow
<= o:p>
<= o:p>
<= o:p>
<= o:p>
<= o:p>
<= o:p>
<= o:p>
<= o:p>
<= o:p>
<= o:p>
<= o:p>
<= o:p>
<= o:p>
<= o:p>
<= o:p>
<= o:p>
<= o:p>
<= o:p>
<= o:p>
Todo el contenido de LATAM Revista Latinoamerica=
na
de Ciencias Sociales y Humanidades, publicado en este sitio está disponibles
bajo Licencia Creative Commons.=
C=
ómo
citar: Núñez Medina, G. (2025). Aj=
uste
del modelo de Heligman Pol=
lard
a la mortalidad de México mediante redes neuronales recurrentes. LATAM
Revista Latinoamericana de Ciencias Sociales y Humanidades 6 (6), 2044 – 20=
57.
https://doi.org/10.56712/latam.v6i6.5034
INTRODUCCIÓN
El modelo de Heligman-Pol=
lard
es una herramienta fundamental para el ajuste de tasas específicas de
mortalidad, debido a su gran capacidad para capturar las variaciones origin=
adas
por el riesgo diferencial de muerte a lo largo de la vida humana. La capaci=
dad
para modelar adecuadamente las tasas de mortalidad por edad y sexo es una
habilidad de suma importancia para evaluar el nivel, comportamiento y efect=
os
de la mortalidad sobre la población. Uno de los modelos más utilizados para
ajustar las tasas de mortalidad por edad y sexo es precisamente el modelo d=
e Heligman-Pollard debido a su enorme capacidad para aj=
ustar
el comportamiento de las tasas de mortalidad observadas en distintas socied=
ades
(Kostaki, 1991).
Por otra parte, el modelo de Lee-Carter tiene =
por
objetivo ajustar y proyectar las tasas de mortalidad capturando tendencias
dinámicas históricas, observadas tanto por edad como por año calendario. Se
trata de un modelo basado en el uso de componentes principales, que captura=
n la
tendencia promedio de las tasas específicas de mortalidad además de la
variación por edad y temporal de las fluctuaciones en la mortalidad, mientr=
as
el modelo de Heligman-Pollard es una función de
parametrización que modelar particularidades de ciertos grupos de edad (Thi=
ele,
1871).
La importancia en el uso del modelo de Heligman-Pollard radica en su flexibilidad para model=
ar la
curva de mortalidad, en particular, el particular en su capacidad para
describir el comportamiento de la mortalidad desde el nacimiento hasta edad=
es
avanzadas mediante una fórmula que estima ocho parámetros, mismos que captu=
ran
componentes clave como mortalidad infantil (disminución rápida en los prime=
ros
años de vida), la mortalidad joven y adulta temprana (como la joroba de
mortalidad en adolescentes y adultos jóvenes) y la mortalidad de adultos
mayores (aumento exponencial en edades avanzadas) (Deb=
ón,
Montes & Sala, 2006).
Modelos como el de Gomper=
tz
o Makeham permiten ajustar adecuadamente la
mortalidad adulta (Makeham, 1889), pero no así =
la
mortalidad infantil o juvenil, en contraparte, el modelo de Heligman-Pollard
puede ajustar comportamientos no monótonos, y por lo tanto capturar, como se
mencionó anteriormente, variaciones de mortalidad en edades jóvenes (por
accidentes o violencia) y adultas (Congdon, 199=
3). De
manera que su uso presenta claras ventajas sobre otros modelos. Las
limitaciones del modelo de Heligman-Pollard gir=
an en
el sentido de su complejidad (8 parámetros) debido a que requiere una impor=
tante
cantidad de datos (de calidad) y utiliza métodos de estimación robustos (co=
mo
mínimos cuadrados no lineales), además de que en edades extremas (de 100 añ=
os o
más), puede necesitar ajustes adicionales (Dellaportas=
,
Smith & Stavropoulos, 2001).
METODOLOGÍA
Debido a que la estructura de la mortalidad en
sociedades modernas se ha vuelto más compleja, producto del incremento
paulatino en el número de defunciones, especialmente entre los adultos jóve=
nes,
se hace necesario crear modelos más avanzados que permitan capturar estos
nuevos patrones de mortalidad (Carriere, 1992).=
Así,
el modelo de Heligman-Pollard (1980) combina la
precisión matemática con una importante capacidad de ajuste empírico, por lo
que se ha convertido en uno de los métodos más utilizados para modelar el
comportamiento de patrones de mortalidad por edad. Así, el ajuste del model=
o de
Heligman-Pollard se realiza a un conjunto de ta=
sas de
mortalidad observadas, lo que requiere múltiples parámetros (Irnawaty, 2008).
La ecuación original de H=
eligman-Pollard
está dada por:
El modelo se compone de la suma de tres términ=
os
que describen los patrones de mortalidad a lo largo de toda la vida de las
personas. Donde los términos involucrados representan:
=
=
=
Cada uno de los
términos de la ecuación representa una componente distinta de la mortalidad=
y
tiene una interpretación demográfica particular. El primer término modela u=
na
función exponencial de decrecimiento rápido que captura la disminución de la
mortalidad experimentada durante la primera infancia, para edades inferiore=
s a
los 10 años (Heligman & Pollard,
1980). El parámetro A representa un valor similar a q0=
y mide el nivel de mortalidad infantil, el parámetro B representa la mortal=
idad
infantil entre el nacimiento y el primer año de vida, en la práctica su val=
or
está próximo a cero y por lo que su efecto sobre las probabilidades de
fallecimiento es prácticamente nulo, mientras que el valor del parámetro C =
se
asocia a la velocidad de descenso la tasa de mortalidad infantil, a mayores
valores de C más rápido decrecerá la mortalidad infantil, al aumentar la ed=
ad.
El segundo término captura la mortalidad adult=
a a
través de una expresión matemática similar a una curva lognormal.
En la literatura demográfica y actuarial se le conoce como la joroba de los
accidentes y cuantifica las defunciones por accidentes para el caso de los
hombres y la sobre mortalidad materna para el caso de la población femenina=
. Es
decir, modela los excedentes de mortalidad adulta, por lo que se ubica entre
los quince y cincuenta años. El parámetro D especifica la severidad de la
joroba, a mayor D se observarán mayores niveles de sobre mortalidad, al tie=
mpo
que el parámetro E define la dispersión de la joroba y el parámetro F muest=
ra
la localización de la joroba, sus valores van de los 15 a los 60 años (Irnawaty, 2008).
El tercer sumando representa la ley de Gompertz, misma que refleja el crecimiento de la mort=
alidad
para las edades adultas mayores, de modo que los parámetros G y H refleja la
severidad y velocidad con la que la mortalidad crece en durante el último t=
ramo
de la vida.
Estimación del modelo de =
Heligman-Pollard
Los métodos más utilizados para ajustar el
comportamiento de un conjunto de tasas específicas de mortalidad —es decir,
suavizar su comportamiento, eliminar irregularidades y describir su evoluci=
ón—
comprenden técnicas estadísticas, demográficas y de modelado. Así, los
principales métodos comprenden el uso de: técnicas de suavizamiento, de mod=
elos
paramétricos, modelos estadísticos/estocásticos y modelos de inteligencia
artificial (Hartmann, 1987).
La elección del método depende principalmente =
de
la cantidad y calidad de los datos disponibles, así como del objetivo del
análisis: ajuste, pronóstico o suavizamiento. En el ámbito demográfico, el =
uso
de modelos paramétricos como el modelo de Heligman-Pol=
lard,
Gompertz o Makeham =
o de
modelos estocásticos como el método de Lee-Carter suelen considerarse el
estándar, estos son aplicables siempre que se cuente con información sufici=
ente
(Heligman & Pollard,
1980). Debido a que el método de Lee-Carter requiere de grandes cantidades =
de
información histórica, éste suele utilizarse mayormente para pronósticos. En
este punto es importante señalar que el objetivo general del trabajo se cen=
tra
en el ajuste del modelo de Heligman-Pollard en
particular en el análisis de técnicas de ajuste paramétricas basadas en mod=
elos
de inteligencia artificial (Kostaki, 1991).
Existen diferentes métodos para ajustar el
comportamiento de las tasas específicas de mortalidad del modelo de Heligman-Pollard, consisten principalmente de técnica=
s de
estimación paramétrica y de optimización basadas en la utilización de técni=
cas
de mínimos cuadrados, que es el método clásico más extendido, en contrapart=
e,
en años recientes has surgidos métodos de estimación basados en la aplicaci=
ón
de modelos de inteligencia artificial, en particular las redes neuronales
recurrentes. Mientras los métodos clásicos de estimación minimizan la suma =
de
los cuadrados de las diferencias entre las tasas observadas y las calculadas
para el modelo Heligman-Pollard en cada grupo de
edad, los métodos de estimación basados en el uso de redes neuronales
recurrentes combinan la formulación paramétrica del modelo de Heligman-Pollard con la flexibilidad de aprendizaje
secuencial proporcionados por la inteligencia artificial (Manaswi,
2018).
En investigaciones recientes se ha explorado el
uso de redes neuronales para aprender los patrones de mortalidad y estimar =
de
manera automática los parámetros del modelo de Heligma=
n-Pollard,
lo que evidentemente requiere de grandes cantidades de datos, en contraste =
con
los métodos de ajuste tradicional que consiste en encontrar los parámetros =
que
mejor representan los datos observados utilizando generalmente técnicas de
optimización, es decir, estiman una función que minimiza la distancia entre=
los
datos observados y la probabilidad de muerte estimada para cada edad.
El uso una red neuronal recurrente enfocada a
estimar un modelo de Heligman-Pollard va a perm=
itir
capturar dependencias secuenciales y patrones complejos presentes en los
patrones de mortalidad observados, lo que eventualmente mejorará el grado de
ajuste, una vez que el modelo haya sido entrenado con suficientes datos.
Las redes neuronales recurrentes son un tipo de
red neuronal diseñada específicamente para procesar datos secuenciales. Este
tipo de redes son esenciales para tareas donde el orden y el contexto son
importantes, esto se debe a que en una red neuronal recurrente cada neurona=
(o
celda) recibe no solo información en la entrada actual, sino información
procesada en pasos previos la cual puedes ser vista como “memoria”, de modo=
que
la red puede “recordar” lo ocurrido en secuencias anteriores. Dichos
“recuerdos” son básicamente iteraciones de una neurona hacia sí misma y hac=
ia
el siguiente paso, lo que forma bucles internos que se mantienen activos por
largos periodos del tiempo (Sarkar, Bali & =
Ghosh,
2018).
A diferencia de las redes neuronales
tradicionales, en una red neuronal recurrente las neuronas tienen conexiones
que viajan hacia el futuro pero también hacia sí
mismas (ciclo), lo que les permite recordar información de pasos anteriores=
en
la secuencia; de manera que una celda recurrente procesa una entrada (
Una vez definida la estructura de una celda o
neurona, una red neuronal recurrente se diseña y organiza en capas —al igual
que otras arquitecturas de redes neuronales— con la finalidad de modular,
abstraer y profundizar el procesamiento de información secuencial. Cada capa
puede aprender representaciones más complejas a partir de la secuencia de
entrada, dada su capacidad de abstracción progresiva. Las capas iniciales
detectan patrones simples y sucesivamente las capas posteriores capturan
patrones más abstractos o relaciones de mayor orden. El uso de capas mejora=
la
capacidad de modelado, dado que el apilamiento de varias capas recurrentes =
(“lo
que se conoce como aprendizaje profundo”) amplía la capacidad de la red para
modelar dependencias complejas, además de que el uso de diferentes capas
permite la especialización en distintas tareas (Gulli<=
/span>,
Kapoor & Pal 2019).
Las principales capas en una red neuronal recu=
rrente
son: (1) la capa de entrada (Input layer) que r=
ecibe
una secuencia de datos de entrada, en la que cada elemento de la secuencia =
se
representa como un vector, mismo que introduce de manera secuencial a la re=
d.
Es decir, la capa de entrada tiene como función ingresar los datos en el
formato y orden requeridos para que las siguientes capas puedan procesar la
información secuencialmente. (2) Capas recurrentes (capa oculta recurrente)=
que
conforman el núcleo de la red neuronal recurrente, en estas capas cada nodo
procesa la entrada actual y recibe información del estado oculto anterior, =
lo
que le permite a la red conserva una memoria en la que se almacena informac=
ión
contextual y dependencias temporales. (3)
Capa de salida, la cual transforma los estados ocultos en la salida
final esperada (Lee, Singh & Cho, 2021).
Así, una red neuronal recurrente se construye
apilando capas recurrentes usando como entrada secuencias de datos,
provenientes de la capa anterior. La clave de este tipo de redes descansa en
los bucles internos que conservan memoria durante toda la secuencia. La eta=
pa
crítica que permite la fase de entrenamiento se realiza como cualquier red
neuronal, pero los gradientes se calculan hacia atrás en toda la secuencia.=
Una vez diseñada, la red neuronal recurrente d=
ebe
pasar por una fase de entrenamiento debido a que una vez creada, la red, no
tienen conocimiento previo acerca del comportamiento de los datos, ni de las
relaciones presentes entre los elementos que definen el problema modelado, =
en
este caso las relaciones de la curva de Heligman-Polla=
rd.
De manera que, durante la fase de entrenamiento, se van a ajustar los pesos=
y
sesgos internos de la red, para aprender a reconocer patrones, dependencias=
y
estructuras presentes en los datos de entrada, lo que le permitirá a la red
neuronal minimizar la diferencia entre las estimaciones realizadas y los da=
tos
observados (Manaswi, 2018).
Durante la fase de entrenamiento, la red va a
utilizar un conjunto de datos conocidos como datos de entrenamiento, mismos=
que
contienen los parámetros correctos que ajustan el modelo de Heligman-Pollard
respecto de los datos de mortalidad observados, esto permite que a la red
ajustar sus parámetros internos (matrices de pesos y sesgos) para minimizar=
el
error de predicción o función de pérdida empleando algoritmos como el de retro-propagación. El objetivo final de la fase de
entrenamiento es que la red neuronal recurrente pueda aprender a hacer
predicciones a partir de un nuevo conjunto de datos, no observados (Gulli, Kapoor & Pal 2=
019).
El algoritmo implementado para estimar los
parámetros del modelo Heligman-Pollard, a parti=
r del
uso de una red neuronal recurrente consistió en (Sarka=
r,
Bali & Ghosh, 2018):
Preparar los datos de entradas. Se ordenaron l=
as
tasas de mortalidad por edad y por año de ocurrencia, lo que implicó organi=
zar
los datos como secuencias de entrada para la red neuronal, para lo que se
estandarizaron los datos.
Definir los datos de salida. Se ordenó la sali=
da
de cada secuencia estimada por la red neuronal recurrente como un vector de
ocho parámetros (
Construir la red neuronal recurrente. Se defin=
ió
una red neuronal recurrente a partir de una estructura básica compuesta por
tres capas recurrentes, la primera capa, definida como capa de entrada se
conformó de 21 neuronas, la capa densa con 16 neuronas y la capa de salida,=
con
8 neuronas, la cual fue la encargada de entregar los parámetros de predicci=
ón
de la red neuronal. En este punto es importante señalar que la red fue
programada íntegramente en Python con base en el paquete TensorFlow
(Lee, Singh & Cho, 2021).
Fase de entrenamiento del modelo. Una vez defi=
nida
la estructura de la red neuronal recurrente, el siguiente paso es la fase de
entrenamiento, durante esta fase se separan los datos en entrenamiento y
validación. La red neuronal recurrente se entrena para aprender la asociaci=
ón
entre la secuencia de tasas y los parámetros óptimos correspondientes. De e=
sta
manera, la fase de entrenamiento contó con un total de 1,024 secuencias de
datos divididos en 820 secuencias de aprendizaje y 204 secuencias de
validación.
Predicción. La última etapa de la red neuronal
recurrente consiste en utilizar la red para predecir parámetros de una
secuencia de datos nueva, así, una vez entrenada la red neuronal recurrente
deberá ser capaz de ajustar correctamente una secuencia datos, lo que impli=
ca
la red aprendió a predecir correctamente los parámetros del modelo de Heligman-Pollard.
Una de las formas más comunes para evaluar la
calidad de la red neuronal recurrente implementada consiste en evaluar el e=
rror
de ajuste de la red respecto de las tasas de mortalidad observadas y las ta=
sas
estimadas utilizando indicadores como la raíz cuadrada del error cuadrático
medio (RMSE). El cálculo del error de predicció=
n RMSE permite comparar la mortalidad estimada por la r=
ed
versus la mortalidad observada, a partir de la siguiente ecuación:
Es importante señalar que la red neuronal
recurrente aprende la relación entre los patrones de mortalidad por edad y =
los
parámetros que mejor ajustan el modelo Heligman-Pollar=
d,
es decir, este enfoque permite automatizar y potencialmente mejora el proce=
so
de estimación tradicional, sobre todo para datos secuenciales extensos o
complejos. El ajuste del modelo =
de Heligman-Pollard mediante redes neuronales recurrentes
presenta ventajas y desafíos frente a los métodos tradicionales. En general=
, el
uso de una red neuronal recurrente permite capturar de dependencias tempora=
les,
así como modelar largas series de datos de mortalidad considerando el
comportamiento de los parámetros del modelo de Heligma=
n-Pollard,
lo que resulta particularmente útil para proyecciones donde los patrones de
mortalidad cambian frecuentemente (Guerrero, 2008).
DESARROLLO
Datos
Las tasas específicas de mortalidad se estiman=
en
términos generales como el cociente de las defunciones por edad y la poblac=
ión
media de ese mismo grupo de edad, multiplicado por mil. Dichas tasas son el
insumo principal para ajustar el modelo de Heligman-Po=
llard.
Las bases de datos utilizadas para contabilizar las defunciones fueron las
Estadísticas de Defunciones Registradas, las que contiene información anual
desagregada por edad, sexo, entidad federativa, causa de muerte y año de
ocurrencia. Estas bases de datos permiten obtener el número de defunciones =
por
grupos quinquenales de edad por año calendario.
La población total clasificada por edad y enti=
dad
federativa fue obtenida de las proyecciones de población realizadas por El
Consejo Nacional de Población (CONAPO). Las series de datos abarcan los años
2015 a 2025. De esta manera, las tasas específicas de mortalidad fueron
estimadas como el cociente de:
Las defunciones (Def) a edad x y la población =
de
edad x a mitad del año.
RESULTADOS
Los principales resultados de estimar la curva=
de Heligman-Pollard a partir de una red neuronal recurre=
nte se
concentran en la capacidad predictiva, la flexibilidad de forma de la curva=
y
la cuantificación de la incertidumbre alrededor de la mortalidad. En términ=
os
generales, al entrenar una red neuronal recurrente directamente sobre un am=
plio
conjunto de tasas específicas de mortalidad (o sobre los parámetros de la c=
urva
de Heligman-Pollard) se obtienen menores errore=
s en
comparación con los modelos paramétricos clásicos, siempre que los parámetr=
os
de los datos de entrenamiento estén bien calibrados.
Gráfico 1
Ajuste del modelo de Heli=
gman-Pollard
a partir de la red neuronal recurrente
Fuente: elaboración propia con base en
estimaciones realizadas en Python/TensorFlow.
La curva clásica de Helig=
man-Pollard
impone una forma funcional fija para tres componentes (mortalidad infantil,
accidentes juveniles y vejez), mientras que una red neuronal recurrente pue=
de
aprender correcciones sistemáticas por edad para estos componentes. El
resultado práctico es una curva que mantiene la interpretabilidad estructur=
al
del modelo de Heligaman-Pollard, pero con un me=
jor
ajuste local, es especial en edades problemáticas como suele ocurrir con la
subestimación en edades muy longevas (Gulli, Kapoor & Pal 2019).
En la gráfica 1 se presentan el ajuste por predicción, de las tasas de mortalidad del estado de Oaxaca al año 2019, al mismo tiempo en la tabla 1 se presenta la secuencia de parámetros del model= o de Heligman-Pollard resultado de la estimación sua= vizada de los ocho parámetros predichos por la red neuronal recurrente entrenada.<= o:p>
Tabla 1
Parámetros del modelo Hel=
igman-Pollard
estimados según modelo
|
Parámetro |
A |
B |
C |
D |
E |
F |
G |
H |
RMSE |
|
Red
Neuronal Recurrente |
0.1471 |
1.9256 |
1.2504 |
0.0032 |
8.5891 |
43.7969 |
0.0001 |
1.0862 |
0.0064 |
|
Mínimos
cuadrados no lineales |
0.1333 |
1.8696 |
1.3309 |
0.0865 |
10.0000 |
99.6896 |
0.0015 |
0.9856 |
0.0190 |
Fuente: elaboración propia con base en
estimaciones realizadas en Python/TensorFlow.
Los parámetros estimados permiten interpretar =
la
evolución de cada componente asociado a la mortalidad infantil, la mortalid=
ad
por accidentes y la asociada a adultos mayores, y en un sentido amplio como
series de tiempo no lineales aprendidas por la red. En contraste con los
resultados presentados en la gráfica 1, en la gráfica 2 se presenta el ajus=
te
para los mismos datos de mortalidad (tasas de mortalidad del estado de Oaxa=
ca
al año 2019) realizados a partir del ajuste por un modelo de mínimos cuadra=
dos
no lineales.
Si bien, diferentes revisiones de métodos de aprendizaje profundo enfocados al ajuste de patrones de mortalidad coincide= n en que, frente a modelos de optimización no lineales clásicos, las redes suelen mejorar el ajuste RMSE especialmente en horizon= tes de pronóstico más largos y en patrones complejos por edad, aunque el margen de mejora puede ser modesto cuando la mortalidad sigue trayectorias relativame= nte suaves, esto ocurre en casos en los que las redes neuronales recurrentes han sido entrenadas con una gran cantidad de datos, lo que evidentemente no es = el caso para este ejercicio dado que los resultados referentes a la calidad de ajuste de la red neuronal son evidentemente inferiores a los alcanzados por= el ajuste de mínimos cuadrados no lineales, lo cual se muestra en la tabla 1.<= o:p>
Gráfico 2
Ajuste del mode=
lo
de Helligman-Pollard a partir de mínimos cuadra=
dos no
lineales
Fuente: elaboración propia con base en
estimaciones realizadas en Python/TensorFlow.
DISCUSIÓN
El estudio evidencia el potencial de las redes
neuronales recurrentes para automatizar la estimación de los parámetros del
modelo de Heligman-Pollard, para capturar
dependencias secuenciales en series de mortalidad más extensas y para escal=
ar
el ajuste simultáneo en múltiples poblaciones, lo que abre una línea de tra=
bajo
prometedora para aplicaciones donde se disponga de grandes series de bases =
de
datos y donde además se requiere modelar cambios estructurales en los patro=
nes
de mortalidad.
Los resultados encontrados, mostraron que las
tasas de mortalidad estimadas tanto por la red neuronal como por el modelo
tradicional se ajustaron adecuadamente a los datos reales para edades
inferiores a 80 años. Los resultados también mostraron que el modelo Heligman-Pollard parece ajustarse mejor a los datos b=
ajo
las estimaciones del modelo de mínimos cuadrados no lineales que el modelo
ajustado por la red neuronal para edades superiores a 80 años, debido a que
este último, mostró resultados donde el modelo ajustado de Heligman-Pollard
parece sobreestimar los datos reales. Sin embargo, se puede concluir que am=
bos
modelos parecen ajustarse adecuadamente a los datos del estado de Oaxaca, p=
ara
edades inferiores a 80 años y que el resultado es aceptable para edades más
avanzadas, donde diferencia relativa entre modelos y entre la mortalidad re=
al
no supera un diez por ciento de error (Cortés-Toto, Guerrero & Reyes,
2017).
El costo de utilizar una =
RNN
para estimar los parámetros del modelo de HP recae en que la red neuronal
funciona como una caja negra, por lo que se pierde la transparencia de los
métodos de optimización no lineal estándar tales como el método de mínimos
cuadrados o de Gauss-Newton y por lo tanto, se h=
ace
más difícil asignar cambios en la curva a parámetros concretos, sin un anál=
isis
de sensibilidad adicional.
En términos generales, la red neuronal recurre=
nte
permitió estimar los parámetros de la curva de Heligma=
n-Pollard
con una coherencia demográfica adecuada, de manera que los parámetros estim=
ados
son interpretables, esto a pesar de que la red neuronal entrenada, no logro
superar en calidad de ajuste al método tradicional de mínimos cuadrados no
lineales, dado que el modelo de Heligman-Pollard
estimado a partir de la red neuronal recurrente produjo un error RMSE de 0.0064 para las tasas de mortalidad de Oaxaca,
mientras que el ajuste por mínimos cuadrados no lineales alcanza un RMSE de 0.019, lo que indica que, el método clásico a=
lcanzó
un mejor ajuste numérico global (Debón, Montes =
&
Sala, 2006).
Si bien, la comparación típica RMSE
sobre las tasas de mortalidad por edad sugiere que, en escenarios con
suficiente información, los modelos de aprendizaje profundo logran errores
ligeramente menores o comparables a los alcanzados por los métodos
tradicionales. En términos estrictos, de RMSE, =
el
método de Heligman-Pollard suele ser competitiv=
o ante
otro tipo de modelos paramétricos, sin embargo, enfoques más flexibles como=
TOPALS o modelos tipo spline
alcanzan frecuentemente menores RMSE en segment=
os
específicos de edad, con una estructura o modelo mucho menos compleja.
CONCLUSIÓN
Los gráficos 1 y 2 muestran que las tasas de mortalidad ajustadas a través de mínimos cuadrados no lineales predicen adecuadamente el comportamiento de los datos reales en todas las edades, mientras que el ajuste a través de la red neuronal recurrente del modelo de= Heligman-Pollard parece sobreestimar los datos reales= en las edades más avanzadas, por arriba de los 80 años. Al comparar el comportamiento general, de ambos modelos, estos parecen ajustarse adecuadam= ente a los datos reales, en general, las tasas previstas evolucionan en consonan= cia con los datos reales (Ovin & Silva, 2016).<= o:p>
Si bien, diversas investigaciones señalan que =
las
redes neuronales, cuando disponen de grandes series históricas de datos,
alcanzan un desempeño superior al que presentan los métodos de ajuste
tradicionales, debe señalarse que este no fue el caso, debido posiblemente =
al
limitado volumen de datos, lo que explica que la red entrenada no alcance el
desempeño esperado. Aunque el RMSE resultó peor=
, la
red neuronal recurrente demuestra la capacidad para aprender automáticamente
relaciones entre patrones de mortalidad por edad y estimar correctamente los
ocho parámetros del modelo de Heligman-Pollard,
automatizando el proceso de estimación y potencialmente haciéndolo escalabl=
e a
series largas de datos.
Es importante señalar que el uso de una red
neuronal recurrente exige grandes cantidades de datos de buena calidad y una
calibración cuidadosa de la arquitectura y del entrenamiento; por lo que en
contextos con información limitada o de mala calidad, los métodos clásicos
siguen siendo más robustos y estables, sin embargo, es posible concluir que=
las
redes neuronales recurrentes son una alternativa prometedora para ajustar y
proyectar la curva de Heligman-Pollard (Hartman=
n,
1987).
Finalmente, el uso de redes neuronales recurre=
ntes
ofrece ventajas en contextos dinámicos y multivariados, permite pronosticar=
el
comportamiento de las tasas específicas de mortalidad a partir de la estima=
ción
de ocho parámetros del modelo Heligman-Pollard.=
La
implementación de la red en un lenguaje de programación tan versátil como P=
ython
ofrece grandes ventajas como la existencia de un ecosistema de librerías co=
mo TensorFlow/Keras y PyTorch entre otras, que incluyen implementaciones
optimizadas de capas recurrentes, lo que permitió construir, entrenar y eva=
luar
la red con un número limitado de líneas de código.
REFERENCIAS
Carriere, J. F. (1992). Parametric models f=
or
life tables. Transactions of Society of Actuaries, 44, 77-99.
Congdon, P. (19=
93).
Statistical graduation in local demographic analysis and projection. Journa=
l of
the Royal Statistical Society. Series A, 156(2), 237-270.
Cortés-Toto, D.,
Guerrero, V. M. y Reyes, H. (2017). Trend smoothness achieved by penalized
least squares with the smoothing parameter chosen by optimality criteria.
Communications in Statistics-Simulation and Computation, 46(2), 1492-1507. =
Debón, A., Montes, F. y Sala, R. (2006). A comparison of
nonparametric methods in the graduation of mortality: Application to data f=
rom
the Valencia region (Spain). International Statistical Review, 74(2), 215-2=
33.
Dellaportas, P., Smith, A. y Stavropoulos, P. (2001). Bayesian
analysis of mortality data. Journal of the Royal Statistical Society A, 164,
275-291.
Gulli, A., Kapoor, A=
.,
& Pal, S. (2019). Deep learning with TensorFlow 2 and Keras: regression, ConvNets, GANs, RNNs, NLP, and more=
with
TensorFlow 2 and the Keras API. Packt
Publishing Ltd.
Guerrero, V. M. (2008). Estimating trends w=
ith
percentage of smoothness chosen by the user. International Statistical Revi=
ew,
76(2), 187-202.
Hartmann, M. (1987). Past and recent attemp=
ts
to model mortality at all ages. Journal of Official Statistics, 3(1), 19-36=
.
Heligman, L. y Pollard, J. (1980). The age pattern of
mortality. Journal of the Institute of Actuaries, 107(1), 49-80.
Irnawaty, R. (2008). Expanding an abridged life table using
the Heligman-Pollard model. Matematika,
24(1), 1-10.
Kostaki<=
span
style=3D'font-size:10.0pt;line-height:115%;font-family:Roboto;mso-fareast-f=
ont-family:
Roboto;mso-bidi-font-family:Roboto;mso-ansi-language:EN-US'>, A. (1991). Th=
e Heligman-Pollard formula as a tool for expanding an
abridged life table. Journal of Official Statistics, 7(3), 311-323.
Lee, T., Singh, V. P., & Cho, K. H. (20=
21).
Tensorflow and keras
programming for deep learning. In Deep learning for hydrometeorology a=
nd
environmental science (pp. 151-162). Cham: Springer International
Publishing.
Makeham<=
/span>, W. (1889). On=
the
further development of Gompertz’s law. Journal =
of the
Institute of Actuaries, 28(2), 152-159.
Ovin, A. y Silva, E.
(2016). Aproximación
del modelo de Heligman y P=
ollard
a través de una propuesta no paramétrica. Ponencia presentada en la XIII
Reunión Nacional de Investigación Demográfica en México, “Dinámicas de
población y desigualdad”, Universidad Nacional Autónoma de México. <=
span
style=3D'font-size:10.0pt;line-height:115%;font-family:Roboto;mso-fareast-f=
ont-family:
Roboto;mso-bidi-font-family:Roboto;mso-ansi-language:EN-US'>México.
Sarkar, D., Bali, R., & Ghosh, T.
(2018). Hands-On Transfer Learning with Python: Implement advanced deep
learning and neural network models using TensorFlow and Keras.
Packt Publishing Ltd.
Thiele, T. (1871). On a mathematical formul=
a to
express the rate of mortality throughout the whole of life, tested by a ser=
ies
of observations made use of by the Danish life insurance company of 1871. <=
/span>Journal of the Institute
of Actuaries and Assure
Magazine, 16(5), 313-329.
Todo el contenido de LATAM Revista Latinoamericana de Cien=
cias
Sociales y Humanidades, publicados en este sitio está disponibles
bajo Licencia Creative Commons
=
LATAM
Revista Latinoamericana de Ciencias Sociales y Humanidades, Asunción,
Paraguay. ISSN
en línea: 2789-3855, agosto, 2022, Volumen 3, Número 2, p. 1
ISSN en línea: 2789-3855, diciembre, 2025, Volumen= VI, Número 6 p 2018