Calculo-de-la-reserva-de-siniestros-ocurridos-no-reportados-IBNR-utilizando-remuestreo-por-Boostrap

•
Humanas / Sociais

Intercambio de Conocimiento
22/7/2022
¡Este material tiene más páginas!
Entonces, ¿te gustó este material?
Ayude a animar a otros estudiantes a mejorar el contenido
¿Te gustó este material? ¡Compartir! 🧡
Matemáticas

630.437 Materiales compartidos
Descarga la aplicación para disfrutar aún más
Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!
Vista previa del material en texto
Universidad Nacional Autónoma de México
FACULTAD DE CIENCIAS
Cálculo de la Reserva de Siniestros Ocurridos
No Reportados (IBNR) utilizando remuestreo
por Boostrap
T E S I S
QUE PARA OBTENER EL TITULO DE:
Actuario
PRESENTA:
Jorge Hilario Guzmán Ruiz
DIRECTOR DE TESIS:
M.C. Irma Roćıo Zavala Sierra
Ciudad Universitaria, CDMX Noviembre, 2017
´
 
UNAM – Dirección General de Bibliotecas 
Tesis Digitales 
Restricciones de uso 
 
DERECHOS RESERVADOS © 
PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL 
 
Todo el material contenido en esta tesis esta protegido por la Ley Federal 
del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). 
El uso de imágenes, fragmentos de videos, y demás material que sea 
objeto de protección de los derechos de autor, será exclusivamente para 
fines educativos e informativos y deberá citar la fuente donde la obtuvo 
mencionando el autor o autores. Cualquier uso distinto como el lucro, 
reproducción, edición o modificación, será perseguido y sancionado por el 
respectivo titular de los Derechos de Autor. 
 
 
 
Cálculo de la Reserva de Siniestros Ocurridos No Reportados
(IBNR) utilizando remuestreo por Boostrap
por
Jorge Hilario Guzmán Ruiz
Tesis presentada para obtener el titulo de
Actuario
en la
FACULTAD DE CIENCIAS
Universidad Nacional Autónoma de México
Ciudad Universitaria, CDMX. Noviembre, 2017
´
Datos del Jurado
Datos del Alumno:
Nombre: Guzmán Ruiz Jorge Hilario.
Universidad Nacional Autónoma de México.
Facultad de Ciencias.
Carrera: Actuaŕıa.
Número de Cuenta: 30608500-6.
Datos del tutor:
M. en C. Irma Roćıo Zavala Sierra.
Datos de los sinodales:
Act. Maŕıa Patricia Luna Dı́az. Act. Viviana Dı́az Magallanes.
Act. Alfonso Parrao Guzmán. Act. Silvia Leticia Malpica Flores.
Datos del trabajo escrito:
T́ıtulo: Cálculo de la Reserva de Siniestros Ocurridos No Reportados (IBNR) utilizando remuestreo
por Boostrap.
Número de páginas: 104 p.
Año: 2017.
A pesar del tiempo perdido ...,
sólo puedo pedir: una disculpa.
Jorge Hilario Guzmán Rúız
Agradecimientos
Agradezco a Dios por permitirme llegar hasta donde estoy, terminando una etapa más
de mi vida. Porque me ha cuidado durante el camino que he seguido, me ha permitido tener
a mi familia conmigo, me ha dado buenos amigos y principalmente buena salud. A mi familia,
porque me acompañan en cada momento, porque cuando tropiezo no me dejan caer. A mis
padres, porque no tengo manera de agradecerles lo que me han brindado: A ti mamá por todos
tus sacrificios y cariño. A ti papá por tu gran apoyo. A mi hermana que a pesar de la gran
diferencia en personalidades siempre contaras conmigo.
A mis abuelitos, que representan las personas más bondadosas, son mi ejemplo que aún en
la vida se puede conjugar la humildad y la lealtad.
A mis t́ıos por el aprendizaje a cada momento.
A mis primos, por los buenos momentos y por la infancia.
A mis amigos por las risas y alegŕıas.
Le agradezco profundamente a la M.C. Irma Rocio Zavala Sierra porque sin ella y todo su
apoyo y paciencia esta tesis no se hubiera podido realizar, pero sobre todo porque me enseño
que la experiencia no depende de la edad. Gracias por tu amistad.
Gracias M.F. Luis Enrique Nava Rugerio por el apoyo en la realización de esta tesis y por
demostrarme que de las cáıdas de la vida se toma lo mejor, y que en el ámbito laboral aún se
puede encontrar amistades para toda la vida.
A mis sinodales, les agradezco su gúıa, expertise y el tiempo que invirtieron en la revisión
del presente trabajo.
Por último, agradecerle a la Universidad Nacional Autónoma de México, por la formación
concedida y por permitirme ser un integrante más de todos los que estamos eternamente orgu-
llosos de poder expresar: mi casa de estudios es la UNAM. A la Facultad de Ciencias, porque
dentro de ella experimente toda clase de vivencias que jamás olvidare pues marcaron mi vida.
”Por mi raza, hablará mi esṕıritu”
v
vi
Índice general
1. Introducción 2
1.1. Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2. Metodoloǵıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2. Reserva de siniestros ocurridos no reportados (IBNR) 6
2.1. Reserva Técnica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2. Definición de IBNR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.3. Caracteŕısticas Generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.4. Triángulo de Siniestros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.5. Métodos Clásicos de estimación de la IBNR . . . . . . . . . . . . . . . . . . . . . 12
2.5.1. Grossing-up . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.5.2. Link ratio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.5.3. Mı́nimos cuadrados de De Vylder . . . . . . . . . . . . . . . . . . . . . . . 14
2.6. Métodos Estocásticos de estimación de la IBNR . . . . . . . . . . . . . . . . . . . 15
2.6.1. Bornhuetter-Ferguson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3. Técnica Bootstrap 17
3.1. Introducción al Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.2. Bootstrap no paramétrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2.1. Teorema de Glivenko-Cantelli . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.3. Técnicas de simulación en el cálculo de probabilidades . . . . . . . . . . . . . . . 23
3.4. Métodos de remuestreo Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.4.1. Remuestreo por partes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
vii
ÍNDICE GENERAL
3.4.2. Remuestreo por partes: Parámetros β′s . . . . . . . . . . . . . . . . . . . 27
3.4.3. Remuestreo residual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.4.4. Remuestreo residual: Chain-Ladder Estocástico con Boostrap . . . . . . . 29
3.4.5. Diferencia entre métodos . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4. Cálculo de la Reserva de IBNR usando Boostrap 32
4.1. Chain-Ladder clásico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.1.1. Variantes de Chain-Ladder . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.1.2. Algoritmo para estimación: Chain-Ladder Clásico . . . . . . . . . . . . . . 36
4.1.3. Desarrollo de una Aplicación (interacción entre R y Excel) . . . . . . . . 37
4.2. El método Chain-Ladder estocástico de Mack . . . . . . . . . . . . . . . . . . . . 38
4.2.1. Factores de desarrollo para el estimador Chain-Ladder . . . . . . . . . . . 39
4.2.2. Predicciones en el Modelo de Mack . . . . . . . . . . . . . . . . . . . . . . 40
4.2.3. Error Cuadrático Medio de Mack . . . . . . . . . . . . . . . . . . . . . . . 41
4.2.4. Algoritmo para estimación: Chain-Ladder Estocástico . . . . . . . . . . . 42
4.2.5. Desarrollo de una Aplicación (interacción entre R y Excel) . . . . . . . . 43
4.3. Chain-Ladder con Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.3.1. Algoritmo para estimación: Chain-Ladder Estocástico con Bootstrap . . . 45
4.3.2. Desarrollo de una Aplicación (interacción entre R y Excel) . . . . . . . . 46
4.4. Regresión Lineal Múltiple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.4.1. Algoritmo para estimación: Regresión Múltiple con Bootstrap . . . . . . . 47
4.4.2. Desarrollo de una Aplicación (interacción entre R y Excel) . . . . . . . . 49
5. Resultados del Cálculo de la Reserva de IBNR usando Boostrap 51
5.1. Chain-Ladder con Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
5.1.1. Chain-Ladder Clásico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
5.1.2. Chain-Ladder Estocástico . . . . . . . . . . . . . . . . . . .. . . . . . . . 54
5.1.3. Chain-Ladder Estocástico con Bootstrap . . . . . . . . . . . . . . . . . . . 56
5.2. Regresión Múltiple con Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
5.3. Cuadro comparativo de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . 60
viii
ÍNDICE GENERAL
6. Conclusiones 61
A. Códigos en R 65
B. Modelo de Regresión 76
B.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
B.2. Regresión Múltiple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
B.3. Estimación de los parámetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
B.4. Regresión Múltiple con Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
C. Gráficos 82
D. Enlaces de Descarga 85
E. Ejemplos 86
Bibliograf́ıa 93
ix
Nomenclatura
IBNR Incurred But Not Reported (Incurrido Pero No Reportado).
SONOR Siniestros Ocurridos No Reportados.
IBNR Real Siniestros Ocurridos No Reportados Reales de la Compañ́ıa de Seguros.
ci,j Monto pagado en el año de ocurrencia j, respecto al año de vigencia i.
Ci,j Monto acumulado en el año de ocurrencia j, respecto al año de vigencia i.
i Años de vigencia o de origen.
j Años de ocurrencia o de pago.
j∗ Último año de ocurrencia sobre el cual se tiene información para todos los años -
de vigencia, es decir los siniestros que se encuentran en la diagonal del triángulo.
I Año máximo de vigencia o de origen.
J Año máximo de ocurrencia o de pago.
Bootstrap To Pull Oneself Up By One’s Bootstraps (Levantarse mediante el propio esfuerzo).
BEL Best Estimate Liabilities (Mejor Estimación de Pasivos).
1
Caṕıtulo 1
Introducción
Hoy en d́ıa la estimación de las provisiones técnicas se llevan a cabo de forma muy mecánica,
con el objetivo de obtener el nivel esperado de reservas para hacer frente a los pagos futuros,
asociados a siniestros que se hubieran producido durante el ejercicio de cálculo y en los anterio-
res. Por lo tanto, en este nuevo contexto denominado Solvencia II, es importante la proyección
de siniestros que puedan acontecer y relacionarlo con el nivel de reservas estimado previamente.
Durante los últimos años, han sido muchos los autores que han tratado los métodos de
cálculo de las provisiones técnicas o también conocidas como reservas técnicas. La abundante
bibliograf́ıa generada, junto a la importancia suscitada en la actualidad dentro del marco nor-
mativo de Solvencia II, ha provocado que esta metodoloǵıa sea uno de los temas de investigación
más importantes en el sector asegurador.
Aśı pues, la necesidad de lograr que las instituciones cumplan con las obligaciones que han
contráıdo con sus asegurados, ha provocado que se plantee la incorporación de elementos es-
tocásticos en los cálculos de las reservas que, por un lado, justifiquen la metodoloǵıa de cálculo
del nivel de reservas y, por el otro, permitan valorar cuantitativamente la incertidumbre aso-
ciada a estos mecanismos.
El nuevo contexto normativo sobre el cálculo de las reservas técnicas invita a la aplicación
de métodos estocásticos para su estimación. Actualmente, se dispone de múltiples posibilidades
2
1.1. OBJETIVO
todas ellas igualmente válidas siempre que se lleven a cabo de forma correcta. Debido a que,
la metodoloǵıa más popular en el sector asegurador seguramente sea la de Chain-Ladder, esto
debido a su fácil aplicación; en el presente trabajo se explicará y se implementará en conjunto
con la metodoloǵıa del bootstrap.
Todo lo antes mencionado motiva la elaboración de este trabajo, el cual tiene como base
en estudiar la metodoloǵıa bootstrap, bajo una perspectiva estocástica y centrado en el cálculo
de las provisiones técnicas (IBNR), cabe mencionar que esta metodoloǵıa puede ser aplicada
a todos los ramos de corto plazo, para llevar a cabo la ejemplificación se eligió el ramo de
Gastos Médicos Mayores debido a las facilidades de proveer la información real por parte de la
compañ́ıa aseguradora.
1.1. Objetivo
En la tesis presente se plantea un problema real al que tienen que hacer frente las compañ́ıas
de seguros el cual es realizar el cálculo de la reserva siniestros ocurridos no reportados, se
propone resolver este problema mediante la generación de una aplicación que conjugue por una
parte las ventajas del lenguaje estad́ıstico R y por otra la facilidad de la interfaz gráfica del
programa Excel. Un objetivo del presente trabajo es aplicar los métodos Clásicos y Estocásticos
para la estimación requerida de la reserva por las compañ́ıas aseguradoras, haciendo notar la
ventaja que tienen los métodos con una base estad́ıstica sobre los métodos clásicos. Desde un
punto de vista pedagógico, esta aplicación buscará ser de gran utilidad puesto que:
Facilitará a los estudiantes de Actuaŕıa la compresión por una parte de los métodos para
la obtención de la reserva, y por otra el poder de la simulación Bootstrap, un método
muy utilizado en el cálculo de la reserva de IBNR.
Facilitará también el seguimiento, paso a paso, de todo el proceso que es necesario realizar
para dar respuesta al problema planteado.
El cálculo de la reserva de siniestros ocurridos no reportados (IBNR), se realizará la esti-
mación de la reserva v́ıa el método Chain-Ladder extendido con la metodoloǵıa Bootstrap, la
3
1.2. METODOLOGÍA
cual será aplicada a un triángulo de siniestralidad del ramo de Gastos Médicos Mayores, pro-
porcionado por una compañ́ıa de seguros (los datos reales fueron multiplicados por un factor
debido al acuerdo de confidencialidad de la información de la aseguradora). Los resultados de
este estudio serán comparados con los siniestros ocurridos no reportados reales de la compañ́ıa
de seguros, estos siniestros serán definidos en el presente trabajo como IBNR Real, los cuales
también fueron proporcionados por la compañ́ıa aseguradora.
1.2. Metodoloǵıa
Para lograr el objetivo expuesto, se llevó a cabo la siguiente metodoloǵıa:
Búsqueda bibliográfica en el marco teórico y normativo para sustentar los modelos pro-
puestos.
Determinación de criterios matemáticos y formulación a seguir.
Uso de los programas: R y Excel para ejemplificar los resultados obtenidos.
Con la información recabada en los puntos anteriores, se han desarrollado los caṕıtulos que
conforman el presente trabajo:
1. Introducción: Breve exposición del trabajo, motivación, objetivos y metodoloǵıa.
2. Reserva de siniestros ocurridos no reportados (IBNR): Explicación de los fundamentos
esenciales para el entendimiento de las reservas técnicas, definición de IBNR e introducción
a los métodos clásicos y estocásticos.
3. Técnica Bootstrap: Introducción al método de remuestreo y teorización sobre el método
Bootstrapping.
4. Cálculo del IBNR usando Boostrap: Análisis y determinación de los factores de Chain-
Ladder y Regresión Múltiple para la estimación de la reserva de IBNR, aśı como la
metodoloǵıa de remuestreo: por residuales y por partes. Simplificación de los métodos e
instrucciones para el cálculo de la reserva de IBNR.
4
1.2. METODOLOGÍA
5. Aplicación del cálculo de la Reserva de IBNR: Ilustración de los cálculos y resultados
obtenidos mediante la aplicación del programa R y la interfaz gráfica de Excel.
6. Conclusiones: Recapitulación de los resultados obtenidos en el presente trabajo.
Finalmente se incluye un Apéndice con los códigos de R utilizados para cada uno de los
ejemplos presentados en este trabajo, al igual que los gráficos generados de los presentes códigos
de R, aśı como los enlaces de descarga donde el usuario podrá hacerse con el archivo adjunto
del programa Excel y los códigos antes mencionados; de igual manera se anexa el Apéndice
B donde se puede encontrar el Modelo de Regresión Múltiple donde se analiza y determinanlas B′s representan los parámetros de cambio de la variable respuesta y, para la estimación de
la reserva de IBNR, aśı como la metodoloǵıa remuestreo por partes. Toda la información del
documento está debidamente referenciada.
5
Caṕıtulo 2
Reserva de siniestros ocurridos no
reportados (IBNR)
Antes de iniciar con la definición de la reserva técnica de siniestros ocurridos no reportados
(IBNR), es conveniente conceptualizar el sector asegurador.
Las compañ́ıas de seguros son instituciones financieras que asumen riesgos a los que se ven
expuestos sus asegurados, a cambio de un pago que se denomina prima, se pagará la indemniza-
ción al asegurado en caso de ocurrir un determinado evento (siniestro) cuyo riesgo está cubierto
por la cobertura de la póliza de seguro en los diferentes ramos y coberturas que maneje la
compañ́ıa.
Un aspecto básico de la regulación y supervisión de las operaciones de seguros es que las
compañ́ıas cumplan con las obligaciones que han contráıdo con sus asegurados. El cumplimiento
de tales obligaciones consiste fundamentalmente en hacer frente a las reclamaciones futuras que
hagan los asegurados, para lo cual las aseguradoras deben contar con los recursos financieros
suficientes. Es obligatorio contar con una provisión o fondo de reserva denominado reserva
técnica para cubrir uno de los objetivos que es garantizar una parte de la solvencia de la
compañ́ıa al afrontar el pago de reclamaciones futuras por parte de sus asegurados. La finalidad
de las reservas técnicas es cubrir los siniestros esperados de la distribución siniestral, por seguro
6
2.1. RESERVA TÉCNICA
o ramo, de igual manera mantener una parte de la solvencia requerida por la compañ́ıa de
seguros para afrontar el pago de siniestros reclamados por sus asegurados.
2.1. Reserva Técnica
Como se mencionó anteriormente la Reserva Técnica es un recurso financiero que la asegu-
radora provisiona, con el propósito de cubrir una parte de las indemnizaciones futuras producto
de obligaciones existentes.
Una de las provisiones de mayor importancia para la estabilidad de las compañ́ıas de se-
guros es la reserva de siniestros ocurridos no reportados (IBNR siglas que corresponden a la
expresión inglesa ”incurred but not reported”), sobre todo en ramos con un notable diferimiento
en las reclamaciones (Daños, Gastos Médicos Mayores y Vida). Es necesario entender algunos
conceptos para definir la reserva de IBNR:
Colas de siniestros: Periodo que abarca desde el final de la vigencia de la póliza hasta el
término de los reportes o pagos de los siniestros.
Expuestos: Total de asegurados cubiertos al riesgo durante el periodo de vigencia de la
póliza.
Frecuencia: El número de siniestros por unidad expuesta.
Reclamación: Reporte del asegurado, haciendo del conocimiento de algún siniestro a la
aseguradora.
Reserva Técnica: Recursos que destina una compañ́ıa de seguros para respaldar las obli-
gaciones que ha contráıdo con sus asegurados.
Siniestro: Monto asignado que será pagado al asegurado o beneficiario para indemnizar el
7
2.2. DEFINICIÓN DE IBNR
daño.
2.2. Definición de IBNR
Una de las primeras definiciones formales de la reserva de siniestros ocurridos no reportados
(IBNR) en México se puede encontrar en la Ley General de Instituciones y Sociedades Mutua-
listas de Seguros de 1981 en la fracción II del Art́ıculo 50, está definición a lo largo del tiempo
ha sufrido variaciones y modificaciones.
Hoy en d́ıa se pueden encontrar muchas definiciones respecto a la reserva de IBNR como
se mencionan en Villanueva Basto [2015] y Salgado [2012], en el presente trabajo se utiliza la
siguiente definición a dicha reserva, la cual se eligió por ser concisa y de fácil compresión para
el lector:
“La reserva técnica de IBNR considera siniestros ocurridos no reportados, estos son
aquellos siniestros que se producen en un intervalo de tiempo, durante la vigencia de la póliza,
pero que la reclamación se realiza con posterioridad a la fecha de fin de vigencia o valuación
de un periodo contable.
La falta de constitución de la reserva por siniestros ocurridos y no reportados ocasionaŕıa
efectos perjudiciales a los resultados técnicos presupuestados por las compañ́ıas de seguros.
Ya que al no considerar las colas de siniestros dentro de estos resultados se subestima la
frecuencia de la siniestralidad, lo que puede conducir a primas insuficientes cobradas a los
expuestos. Cada empresa de seguros deberá constituir y valuar dicha reserva tomando como
base el método actuarial de cálculo que en su opinión sea acorde con las caracteŕısticas de su
cartera y experiencia siniestral.”
En otras palabras, la reserva de IBNR son los siniestros que la aseguradora ignora su ocu-
rrencia, por un atraso en el aviso. Según Ordoñez [2010] una de las cuestiones fundamentales en
la demora del reclamo es debido a que éstos normalmente se reportan a terceros que facilitan o
contactan con la compañ́ıa aseguradora, por lo cual hay que esperar un periodo de tiempo hasta
8
2.3. CARACTERÍSTICAS GENERALES
que el reclamo llegue a la misma aseguradora y a su base de datos. En la definición propuesta
a dicha reserva, se espećıfica la obligación de elegir un método actuarial para el cálculo de la
reserva de IBNR, en este caso existen dos tipos de enfoques básicos, cada uno de los cuales
agrupa numerosas metodoloǵıas. El primero se denomina método actuarial “clásico” el cual es
una perspectiva determińıstica. El segundo es comúnmente calificado de método actuarial “es-
tocástico” y arroja predicciones de la IBNR más certeras que los métodos clásicos. En Taylor
[1986] o Gil [1995] se puede encontrar una extensa recopilación de estos métodos.
2.3. Caracteŕısticas Generales
Si bien es cierto que en cada metodoloǵıa para el cálculo de las provisiones técnicas para
siniestros pendientes 1 utilizan reglas y conceptos de partida distintos, se pueden definir algunos
datos básicos necesarios en todas ellas. Por lo general, éstos son:
cij : Monto pagado en el año de ocurrencia j, respecto al año de origen o vigencia i.
Cij : Monto acumulado pagado e incluido el año de ocurrencia j, respecto al año de origen
o vigencia i.
Para el análisis de la reserva de siniestros ocurridos no reportados (IBNR), la información
disponible se presenta en el denominado formato triángulo de siniestros (run-off triangle), el
cual contiene los montos reales de siniestros pagados históricamente por la compañ́ıa de seguros,
debido a su construcción toma la forma de un triángulo. Los montos que se buscan estimar son
los datos que completen el triángulo inferior totalmente aśı como las colas de cada año de vigen-
cia, es decir los siniestros que se encuentran debajo de la diagonal del triángulo. En la sección
2.4 de este caṕıtulo se menciona la importancia del triángulo, el cual puede ser representado de
la siguiente forma:
1Consecuencias económicas que no han sido totalmente indemnizadas por la Aseguradora.
9
2.4. TRIÁNGULO DE SINIESTROS
Año de Ocurrencia
1 2 3 · · · J − 1 J
1 c1,1 c1,2 c1,3 · · · c1,J−1 c1,J
Año 2 c2,1 c2,2 c2,3 · · · c1,J−1
de 3 c3,1 c3,2 c3,3 · · ·
V igencia · · · · · · · · · · · ·
I − 1 cI−1,1 cI−1,2
I cI,1
Donde las filas hacen referencia al año de origen o vigencia del siniestro (i = 1, 2, 3, · · · , I) y
las columnas, al año de ocurrencia o de pago (j = 1, 2, 3, · · · , J). Definiremos a I y J para refe-
rirse al número máximo de años de vigencia y ocurrencia, respectivamente. El número máximo
de años de los cuales se tiene información es max{I, J} y, debido a que filas y columnas inician
con el numeral 1 se debe verificar que todos los datos cumplan: i+ j ≤ max{I, J}+ 1, lo que
indica que se trata de un elemento del triángulo superior.
Cabe mencionar que en la literatura sobre la construcción del triángulo suelen tomarse
periodos anuales, pero noexiste ninguna diferencia esencial en si éstos son meses, trimestres,
semestres, etc.
2.4. Triángulo de Siniestros
El primer paso para obtener una buena estimación de la reserva de IBNR es la construc-
ción del triángulo de siniestros, también conocido como triángulo de IBNR el cual contiene la
información histórica de siniestralidad de la compañ́ıa de seguros, las dimensiones son el año o
periodo de vigencia (eje vertical) y el año o periodo de ocurrencia (eje horizontal).
A medida que el año de vigencia de los siniestros es más reciente se reduce la información, de
ah́ı que la matriz resultante tenga la forma triangular. La siguiente figura ejemplifica la forma
del triángulo:
10
2.4. TRIÁNGULO DE SINIESTROS
Año de Ocurrencia
1 2 3 · · · J − 1 J
1 C1,1 C1,2 C1,3 · · · C0,J−1 C0,J
Año 2 C2,1 C2,2 C2,3 · · · C1,J−1
de 3 C3,1 C3,2 C3,3 · · ·
V igencia · · · · · · · · · · · ·
I − 1 CI−1,0 CI−1,1
I CI,1
La gran relevancia e importancia que tienen los triángulos de siniestralidad radica en que
a partir de ellos se analiza y se determina el mejor método actuarial de cálculo para obtener
la reserva de IBNR. La finalidad del método actuarial elegido por las compañ́ıas de seguros es
completar el triángulo en su totalidad de la manera más precisa a las reclamaciones reales, es
decir, estimar los siniestros de la parte inferior de la diagonal más las colas de siniestralidad de
cada vigencia, también conocido como triángulo inferior.
Una vez que se recaba la información histórica de las reclamaciones pagadas por las com-
pañ́ıas de seguros, se construye el triángulo de siniestralidad, a partir de éste se aplicará el
método actuarial 2 elegido para lograr la estimación de la reserva técnica.
Todas las metodoloǵıas inician su construcción a partir del triángulo de siniestralidad, y no
es la excepción en los Métodos Clásicos y Estocásticos, a continuación, se presentan brevemen-
te algunas metodoloǵıas pertenecientes a estos dos métodos (como ya se mencionó si el lector
está interesado puede encontrar mayor detalle de estas metodoloǵıas en Taylor [1986] o Gil
[1995]). En el caṕıtulo 4 se describirá tanto el método Chain-Ladder Clásico como el método
Chain-Ladder Estocástico.
2Modelo estad́ıstico y matemático para la evaluación de riesgos financieros en la industria aseguradora.
11
2.5. MÉTODOS CLÁSICOS DE ESTIMACIÓN DE LA IBNR
2.5. Métodos Clásicos de estimación de la IBNR
Los métodos clásicos o determińısticos se basan en el supuesto de mantener constante la
proporción de siniestros que se reportan de un peŕıodo a otro, independientemente del peŕıodo
de origen del siniestro; no utilizan expĺıcitamente supuestos probabiĺısticos para la obtención
de la reserva, es decir, no presentan variabilidad. Su aplicación es sencilla, pero no es posible
obtener intervalos de confianza para la estimación de la reserva. A pesar de eso, son bastante
utilizados por las compañ́ıas de seguros.
A continuación, se describen algunas metodoloǵıas pertenecientes a estos métodos (su ejem-
plificación se presentará en el Apéndice E del presente trabajo):
Grossing-up
Link ratio
Mı́nimos cuadrados de De Vylder
2.5.1. Grossing-up
También conocido como método de crecimiento o extrapolación, se basa en el cálculo de
la proporción acumulada de siniestros para cada periodo de ocurrencia con respecto al total
reportado, para cada año de vigencia. Un dato fundamental para aplicar esta metodoloǵıa es
la estimación de la siniestralidad total del primer año, considerando que es el más antiguo,
es decir, el monto total que la compañ́ıa deberá pagar, correspondiente al primer año. Dicho
importe se divide en dos partes:
Monto conocido por el paso del tiempo: C1,j o bien c1,j , ∀j = 1, 2, · · · , J .
Estimación del monto total de siniestros de ese año, que debe cumplir: C1,∞ ≥ C1,j .
Tomando como referencia el primer año se obtienen los cocientes pj , definidos de la siguiente
manera:
pj =
C1,j
C1,∞
12
2.5. MÉTODOS CLÁSICOS DE ESTIMACIÓN DE LA IBNR
Se toma el supuesto de que estas proporciones se mantienen constantes, sea cual sea el año de
ocurrencia, aplicándose aśı al resto de los años de vigencia a fin de obtener las correspondientes
Ĉi,j . Estos montos se obtienen:
Ĉi,∞ =
Cij final
pi
Las reservas estimadas se obtendrán como la suma de las diferencias entre ese nivel Ĉ1,j y
la última cifra conocida de provisión, Ci,I−i, tal y como sigue:
IBNR =
∑I
i=0(Ĉi,∞ − Ci,I−i)
2.5.2. Link ratio
Este método parte del triángulo de siniestros acumulados y obtiene las tasas de variación
en un año de vigencia a otro (también denominados porcentajes de crecimiento o link ratios)
entre un periodo de ocurrencia y el siguiente. El cálculo de dichos ratios se obtiene según la
expresión:
fj =
Ci,j+1
Cij
i = 1, 2, · · · , I y j = 1, 2, · · · , J
Una vez obtenidas cada una de las tasas, deben determinarse los factores de proyección que
constituyen, el elemento básico de cálculo para esta metodoloǵıa. Dichos factores no son más
que los productos de los ratios previamente calculados, estimando cuál será la siniestralidad de
un ejercicio suponiendo que en el paso de un año a otro, dicha variable crecerá al ritmo fijado
por la link ratio. La manera anaĺıtica de expresarlo seŕıa:
Fk =
∏h
j=k fj h variando de 1 a J
siendo k el ejercicio considerado y fj la link ratio aplicada en el cálculo.
Finalmente para calcular la reserva técnica, dichos factores son aplicados a las columnas
del triángulo de ocurrencia, con diversas metodoloǵıas, las más conocidas son: El método
del máximo, El método del mı́nimo y El método media aritmética, que sencillamente
se escoge la fj máxima, mı́nima o media aritmética respectivamente y se le aplica el factor
calculado a cada columna de año de ocurrencia.
13
2.5. MÉTODOS CLÁSICOS DE ESTIMACIÓN DE LA IBNR
2.5.3. Mı́nimos cuadrados de De Vylder
Esta metodoloǵıa supone que la fracción de siniestros reportados hasta el periodo j resulta
independiente del año de vigencia i. De este modo, puede usarse un modelo multiplicativo para
la representación de las reclamaciones. Los datos de partida del triángulo deben ser montos no
acumulados cij .
La hipótesis principal del modelo es:
cij = xi · pj cumpliéndose
∑J
j=1 pj = 1
donde:
xi: monto total a pagar de los siniestros en el año de origen i.
pj : proporción de xi que se paga en el año de ocurrencia j.
Luego, los estimadores anteriores se obtienen por mı́nimos cuadrados; es decir, se trata de
determinar los valores de xi y pj tales que
∑
(cij−xi ·pj)2 sea mı́nima, donde la suma se realiza
sobre el conjunto de sub́ındice del que se tenga información. El sistema de ecuaciones resultante
es:
xi =
∑
∀j∈J cij · pj∑
∀j∈J p
2
j
y pj =
∑
∀i∈I cij · xi∑
∀i∈I x
2
i
Cabe resaltar que las columnas del triángulo de siniestralidad con los montos acumulados o
no, resultan proporcionales.
La similitud entre todos los métodos clásicos a los cuales se ha hecho referencia,
únicamente ofrecen predicciones puntuales de la IBNR mediante un modelo deter-
mińıstico, en otras palabras los modelo proporcionan una reserva técnica única sin tomar en
cuenta las condiciones de variabilidad, siendo una limitante de estos métodos.
14
2.6. MÉTODOS ESTOCÁSTICOS DE ESTIMACIÓN DE LA IBNR
2.6. Métodos Estocásticos de estimación de la IBNR
Los métodos estocásticos son más sofisticados, y su origen proviene, según Taylor [2003], a
mediados de los años 70. Este método supone aleatoriedad, es decir, aceptar la variación de si-
niestralidad a lo largo del tiempo para cualquier año de ocurrencia. Estos métodos, como afirma
England [2002], buscan obtener estimaciones tanto del valor como de la variabilidad de la IBNR,
a través de funciones de distribución de probabilidad. Muchos de los métodos estocásticos que
se han propuesto enla literatura, parten de la formulación pura del método Chain Ladder o de
ligeras modificaciones (la cual se analizará en el Caṕıtulo 4 del presente trabajo).
A continuación, se presenta brevemente una metodoloǵıa perteneciente a los métodos es-
tocásticos:
2.6.1. Bornhuetter-Ferguson
Este modelo propuesto por Bornhuetter y Ferguson en 1972, combina dos metodoloǵıas:
la Loss Ratio con otra basada en la experiencia de la compañ́ıa. Mientras el primer método
proporciona una siniestralidad a priori, el segundo se basa en la liquidación de siniestros que se
encuentra en la diagonal del triángulo (estos siniestros son representados de la siguiente manera:
Ci,J−i+1 para i = 1, · · · , I).
La expresión matemática que resulta para la estimación de los montos futuros acumulados
pueden formularse como:
Ĉij = Ĉi,k−i + (γ̂ − γ̂k−i) · α̂i i+ j > k
siendo:
γ̂: vector de los estimadores a priori de los montos acumulados.
α̂: vector de los estimadores a priori de las pérdidas finales esperadas.
Si el lector requiere entender mejor la expresión del método Bornhuetter-Ferguson y las
hipótesis requeridas, puede remitirse a [Schmidt, 2007] donde se explica con mayor detalle di-
15
2.6. MÉTODOS ESTOCÁSTICOS DE ESTIMACIÓN DE LA IBNR
cho método.
Una vez analizadas brevemente, algunas metodoloǵıas pertenecientes a los Métodos clásicos
y estocásticos, es razonable pensar que la elección del método actuarial para el cálculo
de la IBNR, puede estar condicionado, debido a que los métodos clásicos no cum-
plen con estar fundamentados en una base matemática, aśı como con la variabilidad
que la IBNR puede presentar, a diferencia de los métodos estocásticos que responden
de forma adecuada a estas necesidades. En el caṕıtulo siguiente se explicará la técnica
Bootstrap que será parte fundamental en los modelos propuestos para el cálculo de la reserva
de siniestros ocurridos no reportados en los Caṕıtulos 4 y 5.
16
Caṕıtulo 3
Técnica Bootstrap
Antes de iniciar la introducción al Bootstrap, es conveniente que se entienda el concepto
de remuestreo. Desde finales de la década de los 60’s comenzó a desarrollarse un revolucionario
método conocido con el nombre de “resampling” (remuestreo), para solucionar, por una parte,
problemas en el marco de la teoŕıa de probabilidad y la inferencia estad́ıstica y, por otra, la des-
motivación de los estudiantes durante los cursos de estad́ıstica en los años 60’s. Dicho método
se basa en el empleo de la simulación, utilizando los recursos computacionales. Los resultados
que se pueden alcanzar con las técnicas del remuestreo, logran dar solución a problemas clásicos
(intervalos de confianza, prueba de hipótesis, tamaño muestral), tareas cuya solución anaĺıtica
es dif́ıcil o imposible de obtener con las herramientas tradicionales; pero no se debe pensar que
la conclusión es que el método de remuestreo es un método capaz de sustituir la inferencia clási-
ca, más bien debe ser visto como una herramienta útil en situaciones donde ésta es inoperante
o sumamente engorrosa.
En la primavera de 1967, el profesor Julian L. Simon de la Universidad de Ilinois, comienza a
desarrollar un método revolucionario para enseñar y aplicar la estad́ıstica, actualmente conoci-
do como “resampling” (remuestreo), su esencia consiste en usar el conjunto de datos observados
o generados, para que a partir de éstos se generen nuevas muestras hipotéticas.
En 1979, Bradley Efron desarrolla y publica el análisis formal del Bootstrap, término que
proviene de la expresión inglesa: to pull oneself up by one’s bootstraps (que podŕıa traducirse
17
3.1. INTRODUCCIÓN AL BOOTSTRAP
como: levantarse mediante el propio esfuerzo). Es entonces cuando realmente el enfoque de
Simon cobra una importante fuerza teórica y capta el interés de toda la comunidad estad́ıstica,
quienes comienzan a explorarlo y utilizarlo para solucionar una amplia gama de problemas
en probabilidad e inferencia. Este proceder ha sido considerado por la American Statistical
Association como: el único gran descubrimiento en estad́ıstica desde 1970 [Miranda, 2003].
3.1. Introducción al Bootstrap
El método Bootstrap o Bootstrapping es un procedimiento de “resampling” (remuestreo),
basado en generar un gran número de muestras para estudiar el comportamiento de determi-
nados estad́ısticos, la idea de fondo es construir un modelo de distribución a partir de la infor-
mación proporcionada por la muestra, este procedimiento es diferente a los métodos clásicos
donde la base para hacer inferencias sobre la muestra se encuentra en suponer una distribución
muestral teórica, cuyos parámetros pueden ser estimados a partir de estad́ısticos observados en
la muestra, el Bootstrap implica obviar los supuestos sobre la distribución teórica que siguen
los estad́ısticos. En su lugar, la distribución del estad́ıstico se determina simulando un número
elevado de muestras aleatorias generadas directamente a partir de los datos observados en la
muestra.
Definición 1 Un estad́ıstico (muestral) es una función F que, dada una muestra estad́ıstica
de valores (X1, X2, ..., Xn), asigna un número, F (X1, X2, ..., Xn), que sirve para estimar deter-
minados parámetros de la distribución de la que procede la muestra.
En otras palabras, un estad́ıstico es una medida cuantitativa derivada de un conjunto de
datos de una muestra, con el objetivo de estimar o inferir caracteŕısticas de una población o
modelo estad́ıstico.
Existen diversos procedimientos para llevar a cabo una simulación Bootstrap, los cuales se
clasifican en dos grandes rubros, los procedimientos paramétricos y los no paramétricos:
Bootstrap paramétrico: Se conoce que F pertenece a una familia paramétrica de distribu-
ción y sólo se estiman sus parámetros.
18
3.2. BOOTSTRAP NO PARAMÉTRICO
Bootstrap no paramétrico: Se desconoce la fórmula de F y se estima con F̂ obtenida a
partir de la muestra.
Definición 2 Modelos paramétricos y no paramétricos: Sea X una variable aleatoria (v.a.) con
distribución de probabilidad dada por la función de distribución F.
La v.a. X sigue un modelo paramétrico, si su distribución de probabilidad F pertenece a
una familia de distribución con parámetros de dimensión finita.
La v.a. X sigue un modelo no paramétrico si sobre su distribución F únicamente se supo-
nen algunas condiciones de regularidad. Ejemplos de estas condiciones son: Continuidad
y Simetŕıa.
A pesar de la importancia de la metodoloǵıa Bootstrap paramétrico, el presente estudio
se enfocará en la metodoloǵıa del Bootstrap no paramétrico, la principal razón se debe a que
en la metodoloǵıa Bootstrap paramétrico se conoce la función de distribución de las variables
aleatorias caso contrario que en la metodoloǵıa Bootstrap no paramétrico, lo mismo ocurre
al tratar de inferir la reserva de IBNR, es decir no se conoce la función de distribución que
generan los siniestros que conforman el triángulo de siniestralidad, los cuales seŕıan las variables
aleatorias. Por lo que en futuras ocasiones que se mencione la metodoloǵıa Bootstrap únicamente
se hará referencia al Bootstrap no paramétrico.
3.2. Bootstrap no paramétrico
Es un método de inferencia estad́ıstica válido cuando no se hacen hipótesis paramétricas
sobre la distribución de los datos.
La estimación de parámetros con la técnica Bootstrap implica básicamente desarrollar un
proceso en el que se distinguen diferentes pasos, los cuales consisten:
19
3.2. BOOTSTRAP NO PARAMÉTRICO
1. A partir de la muestra original (X1, X2, ..., Xn), se hace un muestreo con reposición, es
decir, la extracción de un primer elemento se repone en la muestra original de tal forma
que podŕıa ser elegido de nuevo como segundo elemento de la muestra. Cada observación
individual tiene una probabilidad 1n de ser elegida cada vez.
2. Para la muestra obtenidase calcula el valor de un determinado estad́ıstico T que se utiliza
como estimador del parámetro poblacional, en cuyo estudio se tiene interés.
3. Se repiten los dos pasos anteriores, hasta obtener un elevado número de estimaciones. En
este punto, las herramientas tecnológicas son de suma importancia, para desarrollar las
tareas de selección de muestra y determinación de las estimaciones.
4. Se construye una distribución emṕırica del estad́ıstico, que representa una buena aproxi-
mación a la verdadera distribución. Es decir, se determina de este modo la distribución
muestral de un estad́ıstico sin haber hecho suposiciones sobre la distribución teórica a
la que se ajusta y sin manejar fórmulas anaĺıticas para determinar los correspondientes
parámetros de esa distribución.
Suponga una muestra (X1, X2, ..., Xn) con una función de distribución desconocida, tales
que:
(X1, X2, ..., Xn) ∼i.i.d F
Son variables aleatorias independientes e idénticamente distribuidas (i.i.d.). La metodoloǵıa
Bootstrap permitirá obtener la distribución emṕırica F̂n, que constituye la estimación no pa-
ramétrica de la distribución F. Esta estimación se apoya en el Teorema de Glivenko-Cantalli,
que establece una convergencia casi segura (c.s.), cuando n → ∞, entre las distribuciones F y
F̂n, denotando que se trata de una convergencia asintótica.
supx| ˆF (x)n − F (x)| →c.s. 0
Por lo tanto, es factible establecer F (x) = ˆF (x)n, lo que significa que la función de distri-
bución original es igual a la función de distribución estimada.
20
3.2. BOOTSTRAP NO PARAMÉTRICO
3.2.1. Teorema de Glivenko-Cantelli
El Teorema de Glivenko-Cantelli, determina el comportamiento asintótico de la función de
distribución emṕırica conforme el número de observaciones crece.
Teorema 1 Sea {Xn}n≥1 una sucesión de variables aleatorias independientes e idénticamente
distribuidas (i.i.d) definidas en el espacio de probabilidad (Ω,Λ, P ) con función de distribución
común F . Se denota por F̂n la función de distribución emṕırica resultante de las n primeras
variables aleatorias X1, ..., Xn. Entonces,
supx∈<| ˆF (x)n − F (x)| →c.s. 0
Demostración. Se presentará la demostración que hace Vélez [1993], p.36. Por la ley fuer-
te de los grandes números, F̂ (x)n → F (x) casi seguro (c.s.), es decir, para cada x ∈ < existe
Ax ∈ Λ tal que P (Ax) = 1 y limnFn(x)(w) = F (x) si w ∈ Ax. Se ha denotado por Fn(x)(w) a la
función de distribución emṕırica obtenida al observar X1(w), ..., Xn(w), siendo w un elemento
del espacio Ω. De la ley fuerte de los grandes números tomamos I(−∞,x) para cada x ∈ <, existe
Bx ∈ Λ tal que P (Bx) = 1 y limnFn(x−)(w) = F (x−) si w ∈ Bx, donde g(x−) denota el ĺımite
por la izquierda de una función g en x.
Para cada número natural k, y cada j = 1, ..., k, se consideran los puntos
xjk = {x ∈ < : F (x−) ≤ jk ≤ F (x)}
y los sucesos de A siguientes:
Ajk = Axjk = {w ∈ Ω : Fn(xjk)→ F (xjk)}
Bjk = Bxjk = {w ∈ Ω : Fn(x
−
jk)→ F (x
−
jk)}
Dk = ∩kj=1(Ajk ∩Bjk), D = ∩∞k=1Dk.
21
3.2. BOOTSTRAP NO PARAMÉTRICO
Dk es el suceso definido por la condición de que la función de distribución emṕırica converja
a la teórica para todos los puntos xjk (de igual manera para los ĺımites por la izquierda), para
un k fijo. D es el suceso en que esto ocurre simultáneamente para todo k. Por la ley de los
grandes números, P (Ajk) = P (Bjk) = 1 para todo j y todo k, luego P (Dk) = 1 para todo k y,
por tanto, P (D) = 1.
Obsérvese que, si x ∈ [xjk, x(j+1)k], por ser F y Fn funciones de distribución se tiene que
F (xjk) ≤ F (x) ≤ F (x−(j+1)k), y Fn(xjk) ≤ Fn(x) ≤ Fn(x
−
(j+1)k)
Como además F (x−(j+1)k)− F (xjk) ≤
1
k
F (x)n − F (x) ≤ Fn(x−(j+1)k)− F (xjk) ≤ Fn(x
−
(j+1)k)− F (x
−
(j+1)k) +
1
k
y
Fn(x)− F (x) ≥ Fn(xjk)− F (x−(j+1)k) ≥ Fn(xjk) + F (xjk)−
1
k
con lo cual, si δ
(k)
n es la mayor entre todas las diferencias
|Fn(xjk)− F (xjk)| y |Fn(x−jk)− F (x
−
jk)| (para n y k fijos)
se tiene que
Fn(x)− F (x) ≤ δ(k)n + 1k y Fn(x)− F (x) ≥ δ
(k)
n − 1k
Aśı, para cualquier k ∈ N ,
supx∈<|Fn(x)− F (x)| ≤ δ
(k)
n +
1
k
Obsérvese que, si se verifica el suceso D, para cualquier k ∈ N y cualquier ε > 0, se tiene
que δ
(k)
n < ε a partir de un cierto n, de forma que
supx∈<|Fn(x)− F (x)| ≤ ε+ 1k
a partir de cierto n. Por lo tanto,
22
3.3. TÉCNICAS DE SIMULACIÓN EN EL CÁLCULO DE PROBABILIDADES
supx∈<|Fn(x)− F (x)| →n 0
siempre que se verifique D. Como P (D) = 1, se sigue que
supx∈<|Fn(x)− F (x)| →n 0 casi seguro
La importancia del teorema anterior radica en que a mayor número de muestras mejor
será la estimación a la que se llegará.
En resumen, el método Bootstrap, supone utilizar la muestra considerando que en si misma
contiene la información necesaria sobre la distribución muestral. Cuanto más grande sea el
tamaño de la muestra, mejor será la estimación que se haga sobre la distribución muestral. Sin
embargo, esto no significa que, con muestras pequeñas, entre 10 y 20 casos, el método Bootstrap
no pueda ofrecer resultados correctos.
3.3. Técnicas de simulación en el cálculo de probabilidades
En la vida cotidiana todos los seres humanos han realizado algún cálculo de probabilidad,
aunque no lo noten, estos cálculos de probabilidad se llevan a cabo de forma inconsciente e
inconsistentemente. Por ejemplo, al estimar la probabilidad de éxito sobre su elección de ruta
para llegar al trabajo, es decir, encontrar poco tráfico, o cuando se mira al cielo para estimar
la probabilidad de lluvia y decidir si llevar o no el paraguas, etc.
Para realizar un cálculo de probabilidades de forma consistente se puede utilizar alguna de
las tres estrategias básicas:
1. Teoŕıa formal de las probabilidades.
2. Experiencia f́ısica (observar un gran número de veces y calcular la frecuencia relativa con
que ocurre el evento de interés).
3. Simular la experiencia f́ısica (el experimento en el cual se está interesado).
23
3.3. TÉCNICAS DE SIMULACIÓN EN EL CÁLCULO DE PROBABILIDADES
La primera de ellas implica un conocimiento teórico de las reglas de probabilidades y su
mayor dificultad radica en que, en determinadas situaciones resulta verdaderamente complejo
hallar la solución anaĺıtica del problema.
La segunda, no requiere de tal conocimiento teórico, sin embargo, realizar cierto experimen-
to un gran número de veces puede resultar una tarea engorrosa y tediosa. Aunque, en ocasiones,
es la única manera de estimar una probabilidad.
La última posibilidad, aplicando técnicas de simulación, se ha convertido en una estrategia
sumamente atractiva e intuitiva, ya que no se requiere del conocimiento teórico de la teoŕıa de
probabilidades y agiliza el proceso de realizar el experimento. Su principal dificultad radica en
que simular un experimento exige conocer las leyes f́ısicas que lo rigen.
Los siguientes ejemplos ilustran el poder de la simulación como herramienta utilizada para
resolver problemas en el marco de las probabilidades.
Ejemplo 1 ¿Cuál es la probabilidad de que 2 o más personas, entre un total de 25 alumnos
de un curso de la Facultad de Ciencias, cumplan años el mismo d́ıa?
La solución anaĺıtica para este problema seŕıa la siguiente, se denomina al suceso A como
”hay al menos dos personas que celebran sus cumpleaños a la vez” y Ac al evento complemen-
tario ”no hay dos personas para las que coincida la fecha de nacimiento”.
Suponga un año de 365 d́ıas, el número de casos posibles de celebración es 36525 un número
enorme. El número de casos favorables a que no existan dos personas que hayan nacido el
mismo d́ıa se puede obtener de la siguiente manera: 365 ∗ 364 ∗ 363 ∗ ... ∗ 341, esto se explica
de la siguiente forma: la primera persona puede haber nacido uno de los 365 d́ıas del año, la
siguiente uno de los 364 d́ıas restantes y aśı sucesivamente, para que la probabilidad de que no
haya dos personas que cumplan años el mismo d́ıa este dada por:
p(Ac)= 365∗364∗363∗...∗341
36525
= 0.4313
24
3.3. TÉCNICAS DE SIMULACIÓN EN EL CÁLCULO DE PROBABILIDADES
aśı la probabilidad que se buscaba es:
p(A) = 1− p(Ac) = 1− 0.4313 = 0.5687
Mediante simulación, la solución es extremadamente sencilla si se compara con el procedi-
miento desarrollado anteriormente. Los pasos para dar solución con técnicas de simulación son
los siguientes:
1. Se crean 25 números aleatorios que se encuentren en el rango de 1 hasta 365 (los d́ıas del
año).
2. Si los 25 números son diferentes, se registra 0; en caso contrario 1.
3. Se repiten los pasos anteriores digamos 1,000 veces.
4. La solución es la proporción de unos entre el número de veces que repetimos el experi-
mento.
Para explotar las herramientas computacionales para realizar las simulaciones, en este es-
tudio se utilizó el programa R (lenguaje de programación estad́ıstico) R Core Team [2013], (El
código de los programas a los cuales se hará referencia se encontrarán en el apartado apéndice
A). Con dicho programa, proporcionar solución al problema anterior es muy sencillo. En la
siguiente tabla se observan las probabilidades obtenidas mediante el programa:
No. Simulaciones Probabilidad
ID. 1 100 0.56
ID. 2 1,000 0.552
ID. 3 5,000 0.579
ID. 4 10,000 0.5659
En la tabla anterior se observa que las probabilidades al ir incrementando el número de
simulaciones son muy aproximadas al resultado teórico. Lo que ejemplifica el principio del
Teorema de Glivenko-Cantalli, que refiere que a mayor número de simulaciones se obtiene una
estimación casi segura a la probabilidad resultante con las técnicas de la teoŕıa de probabilidad.
25
3.3. TÉCNICAS DE SIMULACIÓN EN EL CÁLCULO DE PROBABILIDADES
Ejemplo 2 Si se lanzan 23 dados. ¿Cuál es la probabilidad de que la suma sea un múltiplo
de 7?
Resulta complicado resolver este problema con la teoŕıa de probabilidad, ya que implicaŕıa
determinar de cuántas maneras distintas se puede obtener un múltiplo de 7 y después dividirlo
por el número 623, mediante las técnicas de simulación, la resolución es muy sencilla. Los pasos
que sigue el programa son los siguientes:
1. Se crea un vector con los múltiplos del número 7 dentro del intervalo [23, 138].
2. Se crean 23 números aleatorios que se encuentren en el intervalo de [1, 6] (los números del
dado).
3. Si la suma de los 23 números coincide con algún elemento del vector del paso 1, se registra
1; en caso contrario 0.
4. Se repiten los pasos anteriores digamos 1,000 veces.
5. La solución es la proporción de unos entre el número de veces que repetimos el experi-
mento.
A continuación se muestran las probabilidades que se obtuvieron con el programa:
No. Simulaciones Probabilidad
ID. 1 100 0.11
ID. 2 1,000 0.151
ID. 3 5,000 0.1352
ID. 4 10,000 0.1418
Lo que se intenta ilustrar con estos ejemplos, es que resolver casi cualquier problema en el
marco de la teoŕıa de probabilidad usando el poder de las simulaciones, es una tarea simple,
resulte o no sencilla la solución con los métodos formales basados en fórmulas de la teoŕıa clásica.
Por lo tanto, se analizará el poder de la simulación por medio de la técnica bootstrap mediante
los métodos de remuestreo como herramientas para llevar acabo el cálculo de la estimación de
la reserva de IBNR.
26
3.4. MÉTODOS DE REMUESTREO BOOTSTRAP
3.4. Métodos de remuestreo Bootstrap
Existen dos métodos de remuestreo bootstrap clásicos. El primero de ellos recibe el nombre
de Remuestreo por partes y el segundo Remuestreo a partir de los residuos o residuales. El
uso de uno por sobre el otro dependerá de la naturaleza del modelo y de la interpretación de
éste. En la Sección 3.4.5 se pueden encontrar algunas razones que justifiquen el uso de uno
u otro método. Por ejemplo, en un análisis respecto a los estimadores de los coeficientes de
regresión lineal múltiple cuando la teoŕıa normal no se justifica, es de gran utilidad el proceso
de remuestreo por partes, ya que la hipótesis de normalidad en un modelo de regresión afirma
que los residuos del modelo ε siguen una distribución normal no aśı las variables aleatorias del
modelo (para mayor detalle véase Apéndice B).
A continuación, se presenta las metodoloǵıas de los remuestreos.
3.4.1. Remuestreo por partes
Este método consiste en realizar el remuestreo a partir de los datos originales, es decir
imaginemos a los datos como muestras aleatorias e independientes de una distribución F, es
decir, (xi, yi) ∼ F . En el caso no paramétrico, el estimador F̂ de F debe ser la distribución
emṕırica de los datos. Esta metodoloǵıa se realizará para el cálculo de la reserva de IBNR
mediante el Modelo de Regresión (véase Apéndice B), los resultados se presentan en el Caṕıtulo
5.
3.4.2. Remuestreo por partes: Parámetros β′s
Como ya se ha mencionado este método consiste en realizar el remuestreo a partir de los
datos originales. En este caso no paramétrico, se obtendrán los estimadores β′s de un modelo
de regresión lineal múltiple (véase Apéndice B), el algoritmo para realizar el remuestreo por
bootstrap es el siguiente:
Para i = 1, · · · , I donde en nuestro ejemplo práctico i son los años de vigencia en el triángulo
de siniestralidad.
27
3.4. MÉTODOS DE REMUESTREO BOOTSTRAP
1. Se selecciona 1∗, · · · , I∗ de forma aleatoria y con reemplazo a partir de {1, · · · , I}.
2. Para j = 1, · · · , J , tome x∗i,j = xi∗,j , y∗i = yi∗ , en este ejemplo práctico xi∗,j son los montos
ci,j del triángulo de siniestralidad y yi∗ es la suma de dichos montos.
3. Por último, obtener β̂, por mı́nimos cuadrados a partir de (x∗1, y
∗
1), · · · , (x∗n, y∗n).
En el caso de tener pocas observaciones es probable que la matriz (XtX) resulte singular 1.
En ese caso no se podrán calcular los estimadores de los coeficientes de regresión con el método
de mı́nimos cuadrados por lo que se deberá generar una nueva muestra bootstrap.
3.4.3. Remuestreo residual
Este método supone realizar el remuestreo a partir de los residuos (se llama residuo a la
diferencia entre los valores de la variable original y los valores que predecimos a partir de
nuestra muestra) cuando se supone que éstos son quienes dan estructura al modelo y cuando
la varianza de los residuos es una constante desconocida σ2. Para entender estos conceptos
se ejemplifican con la obtención de los residuos, mediante el modelo estad́ıstico basado en la
distribución Gamma propuesto por Mack [1993], se utiliza este modelo para la estimación de
siniestros del triángulo superior, con lo cual se podrán generar los residuos antes mencionados.
Por lo tanto, la obtención de la estimación de los siniestros esta dado por:
Ĉi,j = E[Ci,j ] = mi,j
donde:
i = 1, 2, · · · , I y j = 1, 2, · · · , J
mi,j = Representan la estimación de los datos originales es decir una estimación del triángu-
lo superior.
Aśı los residuos ri se denotan con la siguiente formula: ri = Ci,j−mi,j , por lo que la varianza
de los residuos viene dada por: V AR[
∑I
i=1 ri] = σ
2.
1Una matriz singular o no invertible, es aquella que no cuenta con otra matriz que al ser multiplicadas generen
la matriz identidad. Una matriz es singular si y solo si su determinante es nulo.
28
3.4. MÉTODOS DE REMUESTREO BOOTSTRAP
La distribución Gamma es una de las más importantes, desde el punto de vista actuarial,
por ser una de las que mejor se ajusta a la distribución emṕırica de las cuant́ıa o montos de los
siniestros [Cid, 2000].
Se consideran fijas las observaciones Ci,j , y se remuestrea a partir de los residuos; aunque
no es exactamente esto lo que se llevará acabo, ya que se aplica el ajuste de Pearson 2 a los
residuos, dicha metodoloǵıa se utilizará como solución para hallar un modelo que reproduzca
los resultados de Chain-Ladder Estocástico.
3.4.4. Remuestreo residual: Chain-Ladder Estocástico con Boostrap
Se presenta el algoritmo a seguir para realizarel remuestreo residual aplicado al Chain-
Ladder estocástico:
1. Se calculan los factores de proyección aplicando el método Chain-Ladder estocástico (véase
sección 4.2.1) al triángulo run-off de los datos originales de cuant́ıas acumuladas.
2. Se obtienen los valores acumulados estimados para los años anteriores de forma recurrente,
dividiendo el valor del año j entre el factor de proyección del año j-1, donde j es el año
de ocurrencia en triángulo de siniestralidad, es decir se realizan un número elevado de
Triángulos de Siniestros.
3. Se calculan los incrementos anuales para cada Triángulo de Siniestralidad partir de los
valores estimados en el paso 2. Las variaciones en las cantidades estimadas se calculan
por fila.
mi,j =
 Ĉi,j j = 1Ĉi,j − Ĉi,j−1 1 < j; j = J − i
donde mi,j son los incrementos estimados.
4. Elaboración de los residuos de Pearson. Para su cálculo se aplica la siguiente expresión:
2El ajuste de Pearson provee una medida de qué tan bien las observaciones son pronosticadas por el modelo.
29
3.4. MÉTODOS DE REMUESTREO BOOTSTRAP
r̂i,j =
Ci,j −mi,j√
mi,j
(3-1)
5. Se remuestrean los residuos utilizando la técnica bootstrap imponiendo la condición de
que todos los residuos tengan la misma probabilidad de ser remuestreados.
6. Se calculan los incrementos a partir de la muestra por el método bootstrap. Se tendrán
que despejar la ecuación del paso 4, partiendo de la ecuación (3-1) de los residuos de
Pearson, es decir:
Ĉi,j = r̂i,j ·
√
mi,j +mij
7. Se vuelven a calcular los factores de proyección del método Chain-Ladder de las mues-
tras regeneradas. A partir de los datos acumulados se obtiene los factores de la muestra
bootstrap.
8. Para finalizar, se calcula la estimación de la reserva de IBNR a partir de la muestra
bootstrap y sus factores de proyección. Al conocer la distribución, pueden calcularse
estad́ısticos de información tales como, la desviación estándar o cuantiles de la reserva.
El proceso de estos ocho pasos descritos se repite un número elevado de veces, Irene Lo-
zano Albarrán [2010] sugiere que el número de repeticiones sea de 5,000 o incluso superior. En
los ejemplos presentados en su publicación realizan un total de 10,000 repeticiones. En cada
una de las repeticiones se obtiene una nueva muestra y un nuevo valor de los estad́ısticos.
3.4.5. Diferencia entre métodos
La gran diferencia entre los métodos de remuestreo, se identifica en la forma de calcular las
réplicas o nuevas muestras bootstrap, el primero lo realiza a partir de los datos originales y el
segundo lo hace con los residuos.
En las dos formas de obtener replicaciones bootstrap se pueden mencionar dos puntos que
se deben tener en cuenta para de escoger uno de los métodos:
30
3.4. MÉTODOS DE REMUESTREO BOOTSTRAP
El método por partes permite aplicarse aún en casos de heterocedasticidad es decir que
las observaciones provienen de distribuciones de probabilidad con distinta varianza.
El método de remuestreo por pares es frágil cuando se tiene pocas observaciones.
En este sentido, un método no es mejor que el otro, la elección dependerá de cada caso y
de la interpretación de las variables, aśı como el objetivo del estudio en cuestión.
31
Caṕıtulo 4
Cálculo de la Reserva de IBNR
usando Boostrap
El bootstrapping es un método estocástico, el cual genera una distribución estad́ıstica de los
siniestros finales. La teoŕıa también conocida como Bootstrap proviene de la estad́ıstica general
y fue desarrollada alrededor de 1980 por Bradley Efron. Puede ofrecer soluciones numéricas a
una amplia gama de problemas estad́ısticos, esta técnica fue desarrollada para llevar a cabo
ciertas inferencias.
En esencia, se trata de sustituir el tradicional sistema de cálculo y sus complejas expresiones
anaĺıticas por un mecanismo basado en la aplicación de un algoritmo numérico de simulación.
La simulación consiste en repetir un proceso de generación de muestras en un número sufi-
cientemente elevado de veces, para realizar inferencias. Por lo cual es necesario el uso de las
herramientas computacionales. Algunas ventajas de la técnica de Bootstrap son:
Es útil cuando la precisión en el cálculo de los estimadores, suele ser algebraicamente
complicada, o bien no se conoce la distribución de los datos.
Permite obtener una buena aproximación de los principales estimadores a partir de la
muestra, aún sin conocer la distribución de donde provienen los datos.
Es importante distinguir entre el bootstrap paramétrico del que no lo es, en el Caṕıtulo 3 del
32
presente trabajo se profundizó con mayor detalle. Pero, la diferencia fundamental entre ambos
es el conocimiento o no de la función de distribución responsable de la generación de los valores
que se desea analizar. Si se conoce la función de distribución, entonces se estaŕıa en el caso
paramétrico, en el caso contrario seŕıa el no paramétrico, situación en la que las probabilidades
de ocurrencia vendŕıan dadas por la función emṕırica de distribución.
Como se ha mencionado en caṕıtulos anteriores, uno de los objetivos principales de las
compañ́ıas de seguros recae en la estimación correcta de sus obligaciones futuras. Para cada
aseguradora es fundamental conocer sus pasivos y cómo pueden cubrirlos para evitar la insol-
vencia. Con el fin de lograr este propósito, se han desarrollado diversos métodos de estimación,
en gran parte determińısticos, que permiten prever las obligaciones futuras. Uno de estos méto-
dos es el llamado ”Método Chain-Ladder Clásico” el cual será explicado en la sección 4.1 del
presente trabajo.
El Método Chain-Ladder es probablemente la metodoloǵıa más utilizada por las compañ́ıas
para la estimación de obligaciones futuras. Las razones de su popularidad recaen principalmente
en que es fácil de usar, no requiere de un software especializado para implementarlo y carece de
supuestos probabiĺısticos, con la excepción que la proporción de siniestros o reclamos que son
reportados a la compañ́ıa de un periodo a otro se mantienen constantes. Dado que en la prácti-
ca esta última suposición es bastante cuestionable por la existencia de factores que afectan tal
comportamiento, se hace necesario el estudiar e introducir métodos con una base probabiĺıstica
más formal que no sólo nos permitan una estimación puntual de reservas más realistas, sino
también de su variabilidad e intervalos de confianza.
A partir del Método Chain-Ladder Clásico, Mack [1993] introdujo una versión estocástica del
mismo que permitió la estimación de la variabilidad de las reservas mediante el error cuadrático
medio como una medida de incertidumbre contenida en los reclamos o siniestros.
33
4.1. CHAIN-LADDER CLÁSICO
4.1. Chain-Ladder clásico
En general el método Chain-Ladder utiliza un factor para ”suavizar”los datos y, con base
en éstos, realizar interpolaciones con el objetivo de estimar los siniestros agregados para cada
año de ocurrencia y, posteriormente, la reserva correspondiente.
El supuesto de esta metodoloǵıa es que las columnas del triángulo de ocurrencia son pro-
porcionales. La sustentación del supuesto depende en buena medida, tanto del tipo de negocio,
como de la homogeneidad y tamaño de la cartera.
Para estimar la proporción de cambio de un ejercicio a otro se calculan los factores fj
para cada año j de ocurrencia en el triángulo de siniestralidad. Donde fj es la tasa de modi-
ficación de liquidación de siniestro también llamado factor de Chain-Ladder, el cual trata de
estimar la proporción de cambio de un ejercicio a otro, fj está dada por la siguiente formulación:
fj =
∑I−j+1
i=1 Ci,j∑I−j+1
i=1 Ci,j−1
j = 2, 3, · · · , J
La fórmula anterior se puede interpretar como la suma de los siniestros del triángulo de si-
niestralidad de la columna j que representa el año de ocurrencia hasta el año de vigencia I−j+1
(enotras palabras, se suman los siniestros de la columna j hasta el último valor conocido de
vigencia) esto se divide entre la suma de los siniestros de la columna j − 1 hasta el mismo año
de vigencia antes descrito. Es decir, se obtiene un factor de proyección o de crecimiento de un
año al otro, es por eso que la fórmula se inicia en el año de ocurrencia j = 2, debido a que
para el año j = 1 el triángulo de siniestralidad se encuentra completo y no es necesario estimar
ninguna reserva.
A partir de las proporciones obtenidas, se calculan las proyecciones Ĉi,j es decir los valores
que faltan en el triángulo de IBNR hasta completarlo. Se definen los valores de la diagonal del
triángulo de la siguiente manera Ci,I−i+1 para cada año de vigencia i = 1, · · · , I es decir la
última siniestralidad que se conoce, a partir de ellos se estiman los siniestros futuros Ĉi,j∗+k
donde j∗ = I − i + 1 y k = 1, · · · , J − 1. Es decir, se completa la siniestralidad de los años
34
4.1. CHAIN-LADDER CLÁSICO
después del último valor conocido. Dichos valores se obtienen de la siguiente expresión:
Ĉi,j∗+k = Ci,j∗+k−1 · fj∗+k cumpliendo que j∗ + k ≥ J
La provisión técnica total de IBNR vendrá dada por la suma de la diferencia entre el monto
de siniestralidad estimada y el monto de siniestralidad del año anterior. Algunos aspectos im-
portantes a considerar en esta metodoloǵıa, tal y como se destaca en Claramunt [2003]:
Los datos del triángulo de siniestralidad deben ser positivos en su mayoŕıa.
Válido en situaciones con tasa de inflación constantes.
Aunque no se trata de un método estocástico, surge como un caso particular de diferentes
modelos estocásticos.
4.1.1. Variantes de Chain-Ladder
Varios han sido los intentos de depurar la metodoloǵıa clásica de Chain-Ladder, dando lugar
a variantes del modelo. No obstante, la técnica permanece esencialmente igual, manteniendo el
supuesto principal idéntico. La diferencia radica en la ponderación de los factores de desarrollo.
En este sentido, Van Eeghen [1981] describe variantes del método Chain-Ladder. En todas
ellas, parte del triángulo run-off formado por los factores de desarrollo di,j , obtenidos de la
siguiente manera:
di,j =
Ci,j
Ci,j−1
j = 2, 3, · · · , J
Además, cada variante utiliza una hipótesis alternativa. De entre todas ellas, se destacan
dos por su simplicidad matemática y por ser las más habituales en la literatura relacionada con
ello:
1. Ajuste de tendencias lineales (por mı́nimos cuadrados) a cada columna de di,j
35
4.1. CHAIN-LADDER CLÁSICO
2. Supuesto de que el factor de desarrollo es constante en cada columna, estimándose me-
diante una media aritmética ponderada de los factores de desarrollo emṕırico; esto es:
d̂i,j =
∑k−j−1
i=0 wi,j · di,j∑k−j−1
i=0 wi,j−1
con peso wi,j :
wi,j = 1 (Se supone que existe una tendencia lineal dentro del triangulo).
wi,j = Ci,j (Chain-Ladder clásico).
wi,j = i + j + 1 (Ponderación que sirve para dar peso a algunos años de ocurrencia
y años de vigencia).
wi,j = (i + j + 1)
2 (Ponderación que sirven para dar mayor peso a algunos años de
ocurrencia y años de vigencia).
4.1.2. Algoritmo para estimación: Chain-Ladder Clásico
1. Se calculan los factores de Chain-Ladder respecto al triángulo de siniestralidad acumulada:
fj =
∑I−j+1
i=1 Ci,j∑I−j+1
i=1 Ci,j−1
j = 2, 3, · · · , J
2. Con estos factores se estimarán los valores que faltan en el triángulo de siniestralidad para
cada año de vigencia i = 1, · · · , I hasta completarlo. Dichos valores se hallan mediante la
siguiente expresión:
Ĉi,j∗+k = Ci,j∗+k−1 · fj∗+k cumpliendo que j∗ + k ≥ J
donde:
j∗ = I − i+ 1
k = 1, · · · , J − 1
3. La provisión técnica total de IBNR vendrá dada por la suma de la diferencia entre el
monto de siniestralidad estimada y el monto de siniestralidad real.
36
4.1. CHAIN-LADDER CLÁSICO
4.1.3. Desarrollo de una Aplicación (interacción entre R y Excel)
Sin querer entrar en detalles de la programación, en este apartado del trabajo se explica el
objetivo perseguido por la aplicación, su estructura y la utilidad para el usuario. Aśı el objetivo
principal que se busca con la creación de dicha aplicación es el de permitir al usuario calcular la
estimación de reserva de IBNR partiendo de un triángulo de siniestralidad completo, formado
por cuant́ıas no acumuladas (ci,j) y con igual número de años de vigencia i que de ocurrencia
j.
El lector podrá comprender el desarrollo de la herramienta informática para el cálculo de
la provisión técnica IBNR utilizando las metodoloǵıas descritas en el presente trabajo, es decir
se explicará el algoritmo por medio de la herramienta informática, en este caso se explica el
algoritmo de la metodoloǵıa Chain-Ladder Clásico.
Dicha aplicación se realiza gracias a los códigos generados en el programa R y a un ar-
chivo para presentar los resultados mediante la interfaz gráfica del programa Excel, el lector
podrá obtener los códigos mencionados en el Apéndice A y el archivo de Excel antes descrito
en los enlaces de descarga en el Apéndice D.
Dicho lo anterior el algoritmo Chain-Ladder Clásico describe:
1. Los factores de Chain-Ladder se calculan por medio de las ĺıneas del código enumerado
del 1 al 7 del apartado Chain-Ladder Clásico.
2. Se completa el triángulo de siniestralidad con los factores anteriores con el código enume-
rado del 8 al 12 del apartado antes mencionado.
3. Se transforma el triángulo acumulado a cuant́ıas sin acumular para obtener la reserva
técnica de IBNR con el código enumerado del 13 a 14 del apartado ya descrito.
4. Gracias a la libreŕıa XLConnet de R se logra realizar la interacción entre R y Excel, se
genera dicha conjunción al correr el código enumerado del 15 a 25 del apartado antes
mencionado. En resumen, estas ĺıneas recaban los valores de los factores Chain-Ladder y
37
4.2. EL MÉTODO CHAIN-LADDER ESTOCÁSTICO DE MACK
el triángulo de cuant́ıas sin acumular para luego ser agregados en el archivo de Excel de
nombre Triángulo.xlsm en la hoja de cálculo CLClas en la celda A1 y A10 respectivamente.
5. Una vez los valores en el archivo Triángulo en la hoja de cálculo CLClas, se utiliza la
interfaz gráfica de Excel para llevar a cabo una tabla comparativa entre la estimación del
IBNR realizada y el IBNR Real facilitado por la compañ́ıa de seguros.
Figura 4-1: Vista al archivo ”Triángulo.xlsm”hoja de cálculo CLClas
La finalidad de utilizar la interfaz gráfica de Excel es presentar de forma amigable los re-
sultados y facilitar la manipulación de los mismos, esto debido a que hoy en d́ıa la mayoŕıa
de los resultados de las compañ́ıas aseguradoras son presentados en dicho programa.
4.2. El método Chain-Ladder estocástico de Mack
Mack [1993] planteó la siguiente cuestión: ¿Cómo se puede utilizar la información represen-
tada por observaciones pasadas y presentes, para predecir las severidades acumuladas futuras
totales de los siniestros?
Con esta pregunta Mack introdujo algunas condiciones en el modelo Chain-Ladder que se
detallan a continuación:
38
4.2. EL MÉTODO CHAIN-LADDER ESTOCÁSTICO DE MACK
1. Los montos pagados por siniestros con diferentes periodos de vigencia son independientes
e idénticamente distribuidos; es decir, ∀i 6= l, Ci,j y Cl,k son variables aleatorias indepen-
dientes e idénticamente distribuidas para cualquier valor de j y k.
2. Las variables aleatorias Ci,j son positivas casi en la mayoŕıa de los registros y tiene espe-
ranza finita.
3. Existen números reales no negativos fi, los cuales son denominados factores de desarrollo,
para i y j = 1, 2, · · · , n.
E[Ci,j+1|Ci,1, · · · , Ci,j ] = fj · Ci,j = Ĉi,j (4-1)
La principal motivación de Mack para introducir la ecuación (4-1) fue explicar la forma
de los llamados estimadores Chain-Ladder los cuales son comúnmente usados en la práctica
para la estimación de reservas futuras. En estesentido, el modelo de Mack es dictado por un
procedimiento estad́ıstico amplio.
4.2.1. Factores de desarrollo para el estimador Chain-Ladder
Los factores de desarrollo se generan a partir de de la ecuación (4-1), donde se observa:
E[Ci,j+1|Ci,1, · · · , Ci,j ] = fj · Ci,j = fj · E[Ci,j ]
donde: j = 1, 2, · · · , J
Se asume por la segunda condición de Mack que Ci,j es positivo para cada j. Por tanto:
fj =
E[Ci,j+1]
E[Ci,j ]
donde: j = 1, 2, · · · , J
39
4.2. EL MÉTODO CHAIN-LADDER ESTOCÁSTICO DE MACK
Por la Ley Fuerte de los Grandes Números el estimador de momentos propuesto para fj
esta dado por:
fj =
∑J−j
i=1 Ci,j+1∑J−j
i=1 Ci,j
donde: j = 1, 2, · · · , J
Por consiguiente fi es llamado el estimador del modelo Chain-Ladder Estocástico y a partir
de él, se obtiene la estimación de la reserva de IBNR. Cabe mencionar que este estimador del
modelo Chain-Ladder Estocástico es el mismo que el calculado con el modelo Chain-Ladder
Clásico, por lo cual se obtendrá la misma estimación de reserva de IBNR en los dos modelos,
la gran diferencia radica en que el modelo estocástico proporciona un error cuadrático medio el
cual es una forma de evaluar la diferencia entre un estimador y el valor real de la cantidad que
se quiere calcular.
4.2.2. Predicciones en el Modelo de Mack
El objetivo primordial consiste en predecir la severidad futura Ci,I+2−i para un periodo
continuo con base en el triángulo de siniestralidad. Por ello el Modelo de Mack [1997] define la
ecuación predictiva como:
E[Ci,I+2−i] = fI+1−i · Ci,I+1−i
donde: i = 2, 3, · · · , I
Esto implica que la estimación de la reserva de IBNR se pueda obtener de la siguiente forma:
Ĉi,I+2−i = fI+1−i · Ci,I+1−i
donde: i = 2, 3, · · · , I
40
4.2. EL MÉTODO CHAIN-LADDER ESTOCÁSTICO DE MACK
Como ya se mencionó la estimación del IBNR es la misma en las metodologiás de Chain-
Ladder Clásico y Estocástico, el planteamiento de predicciones en el Modelo de Mack es una
forma distinta de verlo al ya descrito en la sección 4.1, pero la finalidad es la misma, es decir
completar el triángulo inferior partiendo de los últimos valores conocidos y con ellos generar
las estimaciones de la reserva técnica de IBNR.
4.2.3. Error Cuadrático Medio de Mack
El error cuadrático medio de las variables Ti, para estimar T̂i, se define como:
ECM(T ) = E[(T̂i − Ti)2]
donde:
(T̂i − Ti) mide el error que se comete al estimar T̂i mediante Ti.
Se considera el cuadrado de ese error para evitar que las diferencias positivas se compensen
con las negativas.
Finalmente, se calcula cuánto vale, en promedio, este error cuadrático.
En Estad́ıstica, el error cuadrático medio es usado para determinar la medida en la que el
modelo no se ajusta a la información, o si el quitar ciertas observaciones puede simplificar el
modelo de manera correcta. Se puede decir que un error cuadrático medio mı́nimo a menudo
indica una variación mı́nima, y por lo tanto indica un buen estimador.
El error cuadrático medio de las predicciones Ĉi,I+2−i viene dada por:
MackS.E. = E[(Ĉi,I+2−i − Ci,I+2−i)2]
En Mack [1997] se definen los intervalos de confianza de los montos de reservas totales
estimados para el periodo de vigencia i, con la siguiente formula:
[Ĉi,I+k−i − (z1−α
2
·MackS.E.) , Ĉi,I+k−i + (z1−α
2
·MackS.E.)]
41
4.2. EL MÉTODO CHAIN-LADDER ESTOCÁSTICO DE MACK
Siendo z1−α
2
el percentil 100(1− α) % de una distribución normal estándar.
La fórmula anterior se puede entender como el rango que puede variar la estimación de
la reserva técnica de IBNR, debido al error cuadrático medio que presenta el modelo con una
cierta ponderación es decir con un nivel de confianza o de probabilidad que permanezca dentro
de este rango. Este es el gran aporte de los modelos estocásticos, que permiten obtener una
estimación puntual de la reserva y un intervalo de variabilidad.
4.2.4. Algoritmo para estimación: Chain-Ladder Estocástico
1. Se calculan fi los factores de Chain-Ladder Estocástico respecto al triángulo de siniestra-
lidad acumulada:
fj =
∑I−j+1
i=1 Ci,j∑I−j+1
i=1 Ci,j−1
j = 2, 3, · · · , J
2. Con estos factores se estima la reserva de IBNR es decir se completa el triángulo de
siniestralidad para cada año de vigencia i = 1, · · · , I. La reserva estimada se obtiene
mediante la siguiente expresión:
Ĉi,j∗+k = Ci,j∗+k−1 · fj∗+k cumpliendo que j∗ + k ≥ J
donde:
j∗ = I − i+ 1
k = 1, · · · , J − 1
3. La provisión técnica total de IBNR vendrá dada por la suma de la diferencia entre el
monto de siniestralidad estimada y el monto de siniestralidad real.
4. Se calcula el error cuadrático medio y el intervalo de confianza de la estimación:
[Ĉi,I+k−i − (z1−α
2
·MackS.E.) , Ĉi,I+k−i + (z1−α
2
·MackS.E.)]
Siendo z1−α
2
el percentil 100(1− α) % de una distribución normal estándar.
42
4.2. EL MÉTODO CHAIN-LADDER ESTOCÁSTICO DE MACK
4.2.5. Desarrollo de una Aplicación (interacción entre R y Excel)
El algoritmo Chain-Ladder Estocástico describe:
1. Los factores de Chain-Ladder Estocástico se calculan por medio de las ĺıneas del código
enumerado del 1 al 4 del apartado Chain-Ladder Estocástico.
2. Se completa el triángulo de siniestralidad con los factores anteriores con la ĺınea de código
enumerado con 5 del apartado antes mencionado.
3. Se calculan los errores cuadráticos medios por estimación es decir por año de vigencia y el
error cuadrático medio total con el código enumerado del 6 a 8 del apartado ya descrito.
4. Mediante la libreŕıa XLConnet de R logramos realizar la interacción entre R y Excel, se
genera dicha conjunción al correr el código enumerado del 13 a 26 del apartado antes
mencionado. En resumen, estás ĺıneas recaban los valores de los factores Chain-Ladder
Estocástico, el triángulo de cuant́ıas acumuladas y los valores de los errores cuadráti-
cos medios por estimación y total, para luego ser agregados en el archivo de Excel de
nombre Triángulo.xlsm en la hoja de cálculo CLEsto en la celda A3, A12, A78 y A88
respectivamente.
5. Una vez los valores en el archivo Triángulo en la hoja de cálculo CLEsto, se utiliza
la interfaz gráfica de Excel para llevar acabo el cálculo de los intervalos de confianza,
aśı como una tabla comparativa entre la estimación del IBNR realizada y el IBNR Real
facilitado por la compañ́ıa de seguros.
43
4.3. CHAIN-LADDER CON BOOTSTRAP
Figura 4-2: Vista al archivo ”Triángulo.xlsm”hoja de cálculo CLEsto
Como se indicó se utiliza la interfaz gráfica de Excel para presentar de forma amigable
los resultados y facilitar la manipulación de los mismos.
4.3. Chain-Ladder con Bootstrap
Como ya se ha mencionado el Bootstrap o Bootstrapping es una técnica de remuestreo
desarrollada para llevar a cabo ciertas inferencias. A grandes rasgos, se trata de reemplazar el
sistema clásico de cálculo que conlleva la aplicación de expresiones anaĺıticas complejas, por un
mecanismo con base en la aplicación de un algoritmo numérico de simulación. Éste consiste en
generar un elevado número de muestras para realizar esas inferencias.
La propuesta de esta metodoloǵıa para dar una solución al problema de la estimación de
reservas parte de England [1999]. Dado que las reservas suelen estimarse a partir de diversos
modelos, el remuestreo se realizará a partir de los residuos del modelo seleccionado, tal y como
sugiere Efron [1994]. Un aspecto fundamental consiste en determinar cuál será la expresión
de los residuos; siendo los más habituales los que resultan a partir de la media dispersión de
Pearson. Debido al desconocimiento de la distribución de las variables Ci,j se remuestrean los
44
4.3. CHAIN-LADDER CON BOOTSTRAP
residuos. Para ello, se utilizará el residuo de Pearson, que tiene la propiedad de distribuirse
asintóticamente como una distribución normal con media 0 y desviación 1. Con esto, se remues-
trea una variable que tiene una distribución asintótica conocida.