Logo Studenta

Calculo-de-la-reserva-de-siniestros-ocurridos-no-reportados-IBNR-utilizando-remuestreo-por-Boostrap

¡Este material tiene más páginas!

Vista previa del material en texto

Universidad Nacional Autónoma de México
FACULTAD DE CIENCIAS
Cálculo de la Reserva de Siniestros Ocurridos
No Reportados (IBNR) utilizando remuestreo
por Boostrap
T E S I S
QUE PARA OBTENER EL TITULO DE:
Actuario
PRESENTA:
Jorge Hilario Guzmán Ruiz
DIRECTOR DE TESIS:
M.C. Irma Roćıo Zavala Sierra
Ciudad Universitaria, CDMX Noviembre, 2017
´
 
UNAM – Dirección General de Bibliotecas 
Tesis Digitales 
Restricciones de uso 
 
DERECHOS RESERVADOS © 
PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL 
 
Todo el material contenido en esta tesis esta protegido por la Ley Federal 
del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). 
El uso de imágenes, fragmentos de videos, y demás material que sea 
objeto de protección de los derechos de autor, será exclusivamente para 
fines educativos e informativos y deberá citar la fuente donde la obtuvo 
mencionando el autor o autores. Cualquier uso distinto como el lucro, 
reproducción, edición o modificación, será perseguido y sancionado por el 
respectivo titular de los Derechos de Autor. 
 
 
 
Cálculo de la Reserva de Siniestros Ocurridos No Reportados
(IBNR) utilizando remuestreo por Boostrap
por
Jorge Hilario Guzmán Ruiz
Tesis presentada para obtener el titulo de
Actuario
en la
FACULTAD DE CIENCIAS
Universidad Nacional Autónoma de México
Ciudad Universitaria, CDMX. Noviembre, 2017
´
Datos del Jurado
Datos del Alumno:
Nombre: Guzmán Ruiz Jorge Hilario.
Universidad Nacional Autónoma de México.
Facultad de Ciencias.
Carrera: Actuaŕıa.
Número de Cuenta: 30608500-6.
Datos del tutor:
M. en C. Irma Roćıo Zavala Sierra.
Datos de los sinodales:
Act. Maŕıa Patricia Luna Dı́az. Act. Viviana Dı́az Magallanes.
Act. Alfonso Parrao Guzmán. Act. Silvia Leticia Malpica Flores.
Datos del trabajo escrito:
T́ıtulo: Cálculo de la Reserva de Siniestros Ocurridos No Reportados (IBNR) utilizando remuestreo
por Boostrap.
Número de páginas: 104 p.
Año: 2017.
A pesar del tiempo perdido ...,
sólo puedo pedir: una disculpa.
Jorge Hilario Guzmán Rúız
Agradecimientos
Agradezco a Dios por permitirme llegar hasta donde estoy, terminando una etapa más
de mi vida. Porque me ha cuidado durante el camino que he seguido, me ha permitido tener
a mi familia conmigo, me ha dado buenos amigos y principalmente buena salud. A mi familia,
porque me acompañan en cada momento, porque cuando tropiezo no me dejan caer. A mis
padres, porque no tengo manera de agradecerles lo que me han brindado: A ti mamá por todos
tus sacrificios y cariño. A ti papá por tu gran apoyo. A mi hermana que a pesar de la gran
diferencia en personalidades siempre contaras conmigo.
A mis abuelitos, que representan las personas más bondadosas, son mi ejemplo que aún en
la vida se puede conjugar la humildad y la lealtad.
A mis t́ıos por el aprendizaje a cada momento.
A mis primos, por los buenos momentos y por la infancia.
A mis amigos por las risas y alegŕıas.
Le agradezco profundamente a la M.C. Irma Rocio Zavala Sierra porque sin ella y todo su
apoyo y paciencia esta tesis no se hubiera podido realizar, pero sobre todo porque me enseño
que la experiencia no depende de la edad. Gracias por tu amistad.
Gracias M.F. Luis Enrique Nava Rugerio por el apoyo en la realización de esta tesis y por
demostrarme que de las cáıdas de la vida se toma lo mejor, y que en el ámbito laboral aún se
puede encontrar amistades para toda la vida.
A mis sinodales, les agradezco su gúıa, expertise y el tiempo que invirtieron en la revisión
del presente trabajo.
Por último, agradecerle a la Universidad Nacional Autónoma de México, por la formación
concedida y por permitirme ser un integrante más de todos los que estamos eternamente orgu-
llosos de poder expresar: mi casa de estudios es la UNAM. A la Facultad de Ciencias, porque
dentro de ella experimente toda clase de vivencias que jamás olvidare pues marcaron mi vida.
”Por mi raza, hablará mi esṕıritu”
v
vi
Índice general
1. Introducción 2
1.1. Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2. Metodoloǵıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2. Reserva de siniestros ocurridos no reportados (IBNR) 6
2.1. Reserva Técnica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2. Definición de IBNR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.3. Caracteŕısticas Generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.4. Triángulo de Siniestros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.5. Métodos Clásicos de estimación de la IBNR . . . . . . . . . . . . . . . . . . . . . 12
2.5.1. Grossing-up . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.5.2. Link ratio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.5.3. Mı́nimos cuadrados de De Vylder . . . . . . . . . . . . . . . . . . . . . . . 14
2.6. Métodos Estocásticos de estimación de la IBNR . . . . . . . . . . . . . . . . . . . 15
2.6.1. Bornhuetter-Ferguson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3. Técnica Bootstrap 17
3.1. Introducción al Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.2. Bootstrap no paramétrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2.1. Teorema de Glivenko-Cantelli . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.3. Técnicas de simulación en el cálculo de probabilidades . . . . . . . . . . . . . . . 23
3.4. Métodos de remuestreo Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.4.1. Remuestreo por partes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
vii
ÍNDICE GENERAL
3.4.2. Remuestreo por partes: Parámetros β′s . . . . . . . . . . . . . . . . . . . 27
3.4.3. Remuestreo residual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.4.4. Remuestreo residual: Chain-Ladder Estocástico con Boostrap . . . . . . . 29
3.4.5. Diferencia entre métodos . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4. Cálculo de la Reserva de IBNR usando Boostrap 32
4.1. Chain-Ladder clásico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.1.1. Variantes de Chain-Ladder . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.1.2. Algoritmo para estimación: Chain-Ladder Clásico . . . . . . . . . . . . . . 36
4.1.3. Desarrollo de una Aplicación (interacción entre R y Excel) . . . . . . . . 37
4.2. El método Chain-Ladder estocástico de Mack . . . . . . . . . . . . . . . . . . . . 38
4.2.1. Factores de desarrollo para el estimador Chain-Ladder . . . . . . . . . . . 39
4.2.2. Predicciones en el Modelo de Mack . . . . . . . . . . . . . . . . . . . . . . 40
4.2.3. Error Cuadrático Medio de Mack . . . . . . . . . . . . . . . . . . . . . . . 41
4.2.4. Algoritmo para estimación: Chain-Ladder Estocástico . . . . . . . . . . . 42
4.2.5. Desarrollo de una Aplicación (interacción entre R y Excel) . . . . . . . . 43
4.3. Chain-Ladder con Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.3.1. Algoritmo para estimación: Chain-Ladder Estocástico con Bootstrap . . . 45
4.3.2. Desarrollo de una Aplicación (interacción entre R y Excel) . . . . . . . . 46
4.4. Regresión Lineal Múltiple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.4.1. Algoritmo para estimación: Regresión Múltiple con Bootstrap . . . . . . . 47
4.4.2. Desarrollo de una Aplicación (interacción entre R y Excel) . . . . . . . . 49
5. Resultados del Cálculo de la Reserva de IBNR usando Boostrap 51
5.1. Chain-Ladder con Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
5.1.1. Chain-Ladder Clásico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
5.1.2. Chain-Ladder Estocástico . . . . . . . . . . . . . . . . . . .. . . . . . . . 54
5.1.3. Chain-Ladder Estocástico con Bootstrap . . . . . . . . . . . . . . . . . . . 56
5.2. Regresión Múltiple con Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
5.3. Cuadro comparativo de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . 60
viii
ÍNDICE GENERAL
6. Conclusiones 61
A. Códigos en R 65
B. Modelo de Regresión 76
B.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
B.2. Regresión Múltiple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
B.3. Estimación de los parámetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
B.4. Regresión Múltiple con Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
C. Gráficos 82
D. Enlaces de Descarga 85
E. Ejemplos 86
Bibliograf́ıa 93
ix
Nomenclatura
IBNR Incurred But Not Reported (Incurrido Pero No Reportado).
SONOR Siniestros Ocurridos No Reportados.
IBNR Real Siniestros Ocurridos No Reportados Reales de la Compañ́ıa de Seguros.
ci,j Monto pagado en el año de ocurrencia j, respecto al año de vigencia i.
Ci,j Monto acumulado en el año de ocurrencia j, respecto al año de vigencia i.
i Años de vigencia o de origen.
j Años de ocurrencia o de pago.
j∗ Último año de ocurrencia sobre el cual se tiene información para todos los años -
de vigencia, es decir los siniestros que se encuentran en la diagonal del triángulo.
I Año máximo de vigencia o de origen.
J Año máximo de ocurrencia o de pago.
Bootstrap To Pull Oneself Up By One’s Bootstraps (Levantarse mediante el propio esfuerzo).
BEL Best Estimate Liabilities (Mejor Estimación de Pasivos).
1
Caṕıtulo 1
Introducción
Hoy en d́ıa la estimación de las provisiones técnicas se llevan a cabo de forma muy mecánica,
con el objetivo de obtener el nivel esperado de reservas para hacer frente a los pagos futuros,
asociados a siniestros que se hubieran producido durante el ejercicio de cálculo y en los anterio-
res. Por lo tanto, en este nuevo contexto denominado Solvencia II, es importante la proyección
de siniestros que puedan acontecer y relacionarlo con el nivel de reservas estimado previamente.
Durante los últimos años, han sido muchos los autores que han tratado los métodos de
cálculo de las provisiones técnicas o también conocidas como reservas técnicas. La abundante
bibliograf́ıa generada, junto a la importancia suscitada en la actualidad dentro del marco nor-
mativo de Solvencia II, ha provocado que esta metodoloǵıa sea uno de los temas de investigación
más importantes en el sector asegurador.
Aśı pues, la necesidad de lograr que las instituciones cumplan con las obligaciones que han
contráıdo con sus asegurados, ha provocado que se plantee la incorporación de elementos es-
tocásticos en los cálculos de las reservas que, por un lado, justifiquen la metodoloǵıa de cálculo
del nivel de reservas y, por el otro, permitan valorar cuantitativamente la incertidumbre aso-
ciada a estos mecanismos.
El nuevo contexto normativo sobre el cálculo de las reservas técnicas invita a la aplicación
de métodos estocásticos para su estimación. Actualmente, se dispone de múltiples posibilidades
2
1.1. OBJETIVO
todas ellas igualmente válidas siempre que se lleven a cabo de forma correcta. Debido a que,
la metodoloǵıa más popular en el sector asegurador seguramente sea la de Chain-Ladder, esto
debido a su fácil aplicación; en el presente trabajo se explicará y se implementará en conjunto
con la metodoloǵıa del bootstrap.
Todo lo antes mencionado motiva la elaboración de este trabajo, el cual tiene como base
en estudiar la metodoloǵıa bootstrap, bajo una perspectiva estocástica y centrado en el cálculo
de las provisiones técnicas (IBNR), cabe mencionar que esta metodoloǵıa puede ser aplicada
a todos los ramos de corto plazo, para llevar a cabo la ejemplificación se eligió el ramo de
Gastos Médicos Mayores debido a las facilidades de proveer la información real por parte de la
compañ́ıa aseguradora.
1.1. Objetivo
En la tesis presente se plantea un problema real al que tienen que hacer frente las compañ́ıas
de seguros el cual es realizar el cálculo de la reserva siniestros ocurridos no reportados, se
propone resolver este problema mediante la generación de una aplicación que conjugue por una
parte las ventajas del lenguaje estad́ıstico R y por otra la facilidad de la interfaz gráfica del
programa Excel. Un objetivo del presente trabajo es aplicar los métodos Clásicos y Estocásticos
para la estimación requerida de la reserva por las compañ́ıas aseguradoras, haciendo notar la
ventaja que tienen los métodos con una base estad́ıstica sobre los métodos clásicos. Desde un
punto de vista pedagógico, esta aplicación buscará ser de gran utilidad puesto que:
Facilitará a los estudiantes de Actuaŕıa la compresión por una parte de los métodos para
la obtención de la reserva, y por otra el poder de la simulación Bootstrap, un método
muy utilizado en el cálculo de la reserva de IBNR.
Facilitará también el seguimiento, paso a paso, de todo el proceso que es necesario realizar
para dar respuesta al problema planteado.
El cálculo de la reserva de siniestros ocurridos no reportados (IBNR), se realizará la esti-
mación de la reserva v́ıa el método Chain-Ladder extendido con la metodoloǵıa Bootstrap, la
3
1.2. METODOLOGÍA
cual será aplicada a un triángulo de siniestralidad del ramo de Gastos Médicos Mayores, pro-
porcionado por una compañ́ıa de seguros (los datos reales fueron multiplicados por un factor
debido al acuerdo de confidencialidad de la información de la aseguradora). Los resultados de
este estudio serán comparados con los siniestros ocurridos no reportados reales de la compañ́ıa
de seguros, estos siniestros serán definidos en el presente trabajo como IBNR Real, los cuales
también fueron proporcionados por la compañ́ıa aseguradora.
1.2. Metodoloǵıa
Para lograr el objetivo expuesto, se llevó a cabo la siguiente metodoloǵıa:
Búsqueda bibliográfica en el marco teórico y normativo para sustentar los modelos pro-
puestos.
Determinación de criterios matemáticos y formulación a seguir.
Uso de los programas: R y Excel para ejemplificar los resultados obtenidos.
Con la información recabada en los puntos anteriores, se han desarrollado los caṕıtulos que
conforman el presente trabajo:
1. Introducción: Breve exposición del trabajo, motivación, objetivos y metodoloǵıa.
2. Reserva de siniestros ocurridos no reportados (IBNR): Explicación de los fundamentos
esenciales para el entendimiento de las reservas técnicas, definición de IBNR e introducción
a los métodos clásicos y estocásticos.
3. Técnica Bootstrap: Introducción al método de remuestreo y teorización sobre el método
Bootstrapping.
4. Cálculo del IBNR usando Boostrap: Análisis y determinación de los factores de Chain-
Ladder y Regresión Múltiple para la estimación de la reserva de IBNR, aśı como la
metodoloǵıa de remuestreo: por residuales y por partes. Simplificación de los métodos e
instrucciones para el cálculo de la reserva de IBNR.
4
1.2. METODOLOGÍA
5. Aplicación del cálculo de la Reserva de IBNR: Ilustración de los cálculos y resultados
obtenidos mediante la aplicación del programa R y la interfaz gráfica de Excel.
6. Conclusiones: Recapitulación de los resultados obtenidos en el presente trabajo.
Finalmente se incluye un Apéndice con los códigos de R utilizados para cada uno de los
ejemplos presentados en este trabajo, al igual que los gráficos generados de los presentes códigos
de R, aśı como los enlaces de descarga donde el usuario podrá hacerse con el archivo adjunto
del programa Excel y los códigos antes mencionados; de igual manera se anexa el Apéndice
B donde se puede encontrar el Modelo de Regresión Múltiple donde se analiza y determinanlas B′s representan los parámetros de cambio de la variable respuesta y, para la estimación de
la reserva de IBNR, aśı como la metodoloǵıa remuestreo por partes. Toda la información del
documento está debidamente referenciada.
5
Caṕıtulo 2
Reserva de siniestros ocurridos no
reportados (IBNR)
Antes de iniciar con la definición de la reserva técnica de siniestros ocurridos no reportados
(IBNR), es conveniente conceptualizar el sector asegurador.
Las compañ́ıas de seguros son instituciones financieras que asumen riesgos a los que se ven
expuestos sus asegurados, a cambio de un pago que se denomina prima, se pagará la indemniza-
ción al asegurado en caso de ocurrir un determinado evento (siniestro) cuyo riesgo está cubierto
por la cobertura de la póliza de seguro en los diferentes ramos y coberturas que maneje la
compañ́ıa.
Un aspecto básico de la regulación y supervisión de las operaciones de seguros es que las
compañ́ıas cumplan con las obligaciones que han contráıdo con sus asegurados. El cumplimiento
de tales obligaciones consiste fundamentalmente en hacer frente a las reclamaciones futuras que
hagan los asegurados, para lo cual las aseguradoras deben contar con los recursos financieros
suficientes. Es obligatorio contar con una provisión o fondo de reserva denominado reserva
técnica para cubrir uno de los objetivos que es garantizar una parte de la solvencia de la
compañ́ıa al afrontar el pago de reclamaciones futuras por parte de sus asegurados. La finalidad
de las reservas técnicas es cubrir los siniestros esperados de la distribución siniestral, por seguro
6
2.1. RESERVA TÉCNICA
o ramo, de igual manera mantener una parte de la solvencia requerida por la compañ́ıa de
seguros para afrontar el pago de siniestros reclamados por sus asegurados.
2.1. Reserva Técnica
Como se mencionó anteriormente la Reserva Técnica es un recurso financiero que la asegu-
radora provisiona, con el propósito de cubrir una parte de las indemnizaciones futuras producto
de obligaciones existentes.
Una de las provisiones de mayor importancia para la estabilidad de las compañ́ıas de se-
guros es la reserva de siniestros ocurridos no reportados (IBNR siglas que corresponden a la
expresión inglesa ”incurred but not reported”), sobre todo en ramos con un notable diferimiento
en las reclamaciones (Daños, Gastos Médicos Mayores y Vida). Es necesario entender algunos
conceptos para definir la reserva de IBNR:
Colas de siniestros: Periodo que abarca desde el final de la vigencia de la póliza hasta el
término de los reportes o pagos de los siniestros.
Expuestos: Total de asegurados cubiertos al riesgo durante el periodo de vigencia de la
póliza.
Frecuencia: El número de siniestros por unidad expuesta.
Reclamación: Reporte del asegurado, haciendo del conocimiento de algún siniestro a la
aseguradora.
Reserva Técnica: Recursos que destina una compañ́ıa de seguros para respaldar las obli-
gaciones que ha contráıdo con sus asegurados.
Siniestro: Monto asignado que será pagado al asegurado o beneficiario para indemnizar el
7
2.2. DEFINICIÓN DE IBNR
daño.
2.2. Definición de IBNR
Una de las primeras definiciones formales de la reserva de siniestros ocurridos no reportados
(IBNR) en México se puede encontrar en la Ley General de Instituciones y Sociedades Mutua-
listas de Seguros de 1981 en la fracción II del Art́ıculo 50, está definición a lo largo del tiempo
ha sufrido variaciones y modificaciones.
Hoy en d́ıa se pueden encontrar muchas definiciones respecto a la reserva de IBNR como
se mencionan en Villanueva Basto [2015] y Salgado [2012], en el presente trabajo se utiliza la
siguiente definición a dicha reserva, la cual se eligió por ser concisa y de fácil compresión para
el lector:
“La reserva técnica de IBNR considera siniestros ocurridos no reportados, estos son
aquellos siniestros que se producen en un intervalo de tiempo, durante la vigencia de la póliza,
pero que la reclamación se realiza con posterioridad a la fecha de fin de vigencia o valuación
de un periodo contable.
La falta de constitución de la reserva por siniestros ocurridos y no reportados ocasionaŕıa
efectos perjudiciales a los resultados técnicos presupuestados por las compañ́ıas de seguros.
Ya que al no considerar las colas de siniestros dentro de estos resultados se subestima la
frecuencia de la siniestralidad, lo que puede conducir a primas insuficientes cobradas a los
expuestos. Cada empresa de seguros deberá constituir y valuar dicha reserva tomando como
base el método actuarial de cálculo que en su opinión sea acorde con las caracteŕısticas de su
cartera y experiencia siniestral.”
En otras palabras, la reserva de IBNR son los siniestros que la aseguradora ignora su ocu-
rrencia, por un atraso en el aviso. Según Ordoñez [2010] una de las cuestiones fundamentales en
la demora del reclamo es debido a que éstos normalmente se reportan a terceros que facilitan o
contactan con la compañ́ıa aseguradora, por lo cual hay que esperar un periodo de tiempo hasta
8
2.3. CARACTERÍSTICAS GENERALES
que el reclamo llegue a la misma aseguradora y a su base de datos. En la definición propuesta
a dicha reserva, se espećıfica la obligación de elegir un método actuarial para el cálculo de la
reserva de IBNR, en este caso existen dos tipos de enfoques básicos, cada uno de los cuales
agrupa numerosas metodoloǵıas. El primero se denomina método actuarial “clásico” el cual es
una perspectiva determińıstica. El segundo es comúnmente calificado de método actuarial “es-
tocástico” y arroja predicciones de la IBNR más certeras que los métodos clásicos. En Taylor
[1986] o Gil [1995] se puede encontrar una extensa recopilación de estos métodos.
2.3. Caracteŕısticas Generales
Si bien es cierto que en cada metodoloǵıa para el cálculo de las provisiones técnicas para
siniestros pendientes 1 utilizan reglas y conceptos de partida distintos, se pueden definir algunos
datos básicos necesarios en todas ellas. Por lo general, éstos son:
cij : Monto pagado en el año de ocurrencia j, respecto al año de origen o vigencia i.
Cij : Monto acumulado pagado e incluido el año de ocurrencia j, respecto al año de origen
o vigencia i.
Para el análisis de la reserva de siniestros ocurridos no reportados (IBNR), la información
disponible se presenta en el denominado formato triángulo de siniestros (run-off triangle), el
cual contiene los montos reales de siniestros pagados históricamente por la compañ́ıa de seguros,
debido a su construcción toma la forma de un triángulo. Los montos que se buscan estimar son
los datos que completen el triángulo inferior totalmente aśı como las colas de cada año de vigen-
cia, es decir los siniestros que se encuentran debajo de la diagonal del triángulo. En la sección
2.4 de este caṕıtulo se menciona la importancia del triángulo, el cual puede ser representado de
la siguiente forma:
1Consecuencias económicas que no han sido totalmente indemnizadas por la Aseguradora.
9
2.4. TRIÁNGULO DE SINIESTROS
Año de Ocurrencia
1 2 3 · · · J − 1 J
1 c1,1 c1,2 c1,3 · · · c1,J−1 c1,J
Año 2 c2,1 c2,2 c2,3 · · · c1,J−1
de 3 c3,1 c3,2 c3,3 · · ·
V igencia · · · · · · · · · · · ·
I − 1 cI−1,1 cI−1,2
I cI,1
Donde las filas hacen referencia al año de origen o vigencia del siniestro (i = 1, 2, 3, · · · , I) y
las columnas, al año de ocurrencia o de pago (j = 1, 2, 3, · · · , J). Definiremos a I y J para refe-
rirse al número máximo de años de vigencia y ocurrencia, respectivamente. El número máximo
de años de los cuales se tiene información es max{I, J} y, debido a que filas y columnas inician
con el numeral 1 se debe verificar que todos los datos cumplan: i+ j ≤ max{I, J}+ 1, lo que
indica que se trata de un elemento del triángulo superior.
Cabe mencionar que en la literatura sobre la construcción del triángulo suelen tomarse
periodos anuales, pero noexiste ninguna diferencia esencial en si éstos son meses, trimestres,
semestres, etc.
2.4. Triángulo de Siniestros
El primer paso para obtener una buena estimación de la reserva de IBNR es la construc-
ción del triángulo de siniestros, también conocido como triángulo de IBNR el cual contiene la
información histórica de siniestralidad de la compañ́ıa de seguros, las dimensiones son el año o
periodo de vigencia (eje vertical) y el año o periodo de ocurrencia (eje horizontal).
A medida que el año de vigencia de los siniestros es más reciente se reduce la información, de
ah́ı que la matriz resultante tenga la forma triangular. La siguiente figura ejemplifica la forma
del triángulo:
10
2.4. TRIÁNGULO DE SINIESTROS
Año de Ocurrencia
1 2 3 · · · J − 1 J
1 C1,1 C1,2 C1,3 · · · C0,J−1 C0,J
Año 2 C2,1 C2,2 C2,3 · · · C1,J−1
de 3 C3,1 C3,2 C3,3 · · ·
V igencia · · · · · · · · · · · ·
I − 1 CI−1,0 CI−1,1
I CI,1
La gran relevancia e importancia que tienen los triángulos de siniestralidad radica en que
a partir de ellos se analiza y se determina el mejor método actuarial de cálculo para obtener
la reserva de IBNR. La finalidad del método actuarial elegido por las compañ́ıas de seguros es
completar el triángulo en su totalidad de la manera más precisa a las reclamaciones reales, es
decir, estimar los siniestros de la parte inferior de la diagonal más las colas de siniestralidad de
cada vigencia, también conocido como triángulo inferior.
Una vez que se recaba la información histórica de las reclamaciones pagadas por las com-
pañ́ıas de seguros, se construye el triángulo de siniestralidad, a partir de éste se aplicará el
método actuarial 2 elegido para lograr la estimación de la reserva técnica.
Todas las metodoloǵıas inician su construcción a partir del triángulo de siniestralidad, y no
es la excepción en los Métodos Clásicos y Estocásticos, a continuación, se presentan brevemen-
te algunas metodoloǵıas pertenecientes a estos dos métodos (como ya se mencionó si el lector
está interesado puede encontrar mayor detalle de estas metodoloǵıas en Taylor [1986] o Gil
[1995]). En el caṕıtulo 4 se describirá tanto el método Chain-Ladder Clásico como el método
Chain-Ladder Estocástico.
2Modelo estad́ıstico y matemático para la evaluación de riesgos financieros en la industria aseguradora.
11
2.5. MÉTODOS CLÁSICOS DE ESTIMACIÓN DE LA IBNR
2.5. Métodos Clásicos de estimación de la IBNR
Los métodos clásicos o determińısticos se basan en el supuesto de mantener constante la
proporción de siniestros que se reportan de un peŕıodo a otro, independientemente del peŕıodo
de origen del siniestro; no utilizan expĺıcitamente supuestos probabiĺısticos para la obtención
de la reserva, es decir, no presentan variabilidad. Su aplicación es sencilla, pero no es posible
obtener intervalos de confianza para la estimación de la reserva. A pesar de eso, son bastante
utilizados por las compañ́ıas de seguros.
A continuación, se describen algunas metodoloǵıas pertenecientes a estos métodos (su ejem-
plificación se presentará en el Apéndice E del presente trabajo):
Grossing-up
Link ratio
Mı́nimos cuadrados de De Vylder
2.5.1. Grossing-up
También conocido como método de crecimiento o extrapolación, se basa en el cálculo de
la proporción acumulada de siniestros para cada periodo de ocurrencia con respecto al total
reportado, para cada año de vigencia. Un dato fundamental para aplicar esta metodoloǵıa es
la estimación de la siniestralidad total del primer año, considerando que es el más antiguo,
es decir, el monto total que la compañ́ıa deberá pagar, correspondiente al primer año. Dicho
importe se divide en dos partes:
Monto conocido por el paso del tiempo: C1,j o bien c1,j , ∀j = 1, 2, · · · , J .
Estimación del monto total de siniestros de ese año, que debe cumplir: C1,∞ ≥ C1,j .
Tomando como referencia el primer año se obtienen los cocientes pj , definidos de la siguiente
manera:
pj =
C1,j
C1,∞
12
2.5. MÉTODOS CLÁSICOS DE ESTIMACIÓN DE LA IBNR
Se toma el supuesto de que estas proporciones se mantienen constantes, sea cual sea el año de
ocurrencia, aplicándose aśı al resto de los años de vigencia a fin de obtener las correspondientes
Ĉi,j . Estos montos se obtienen:
Ĉi,∞ =
Cij final
pi
Las reservas estimadas se obtendrán como la suma de las diferencias entre ese nivel Ĉ1,j y
la última cifra conocida de provisión, Ci,I−i, tal y como sigue:
IBNR =
∑I
i=0(Ĉi,∞ − Ci,I−i)
2.5.2. Link ratio
Este método parte del triángulo de siniestros acumulados y obtiene las tasas de variación
en un año de vigencia a otro (también denominados porcentajes de crecimiento o link ratios)
entre un periodo de ocurrencia y el siguiente. El cálculo de dichos ratios se obtiene según la
expresión:
fj =
Ci,j+1
Cij
i = 1, 2, · · · , I y j = 1, 2, · · · , J
Una vez obtenidas cada una de las tasas, deben determinarse los factores de proyección que
constituyen, el elemento básico de cálculo para esta metodoloǵıa. Dichos factores no son más
que los productos de los ratios previamente calculados, estimando cuál será la siniestralidad de
un ejercicio suponiendo que en el paso de un año a otro, dicha variable crecerá al ritmo fijado
por la link ratio. La manera anaĺıtica de expresarlo seŕıa:
Fk =
∏h
j=k fj h variando de 1 a J
siendo k el ejercicio considerado y fj la link ratio aplicada en el cálculo.
Finalmente para calcular la reserva técnica, dichos factores son aplicados a las columnas
del triángulo de ocurrencia, con diversas metodoloǵıas, las más conocidas son: El método
del máximo, El método del mı́nimo y El método media aritmética, que sencillamente
se escoge la fj máxima, mı́nima o media aritmética respectivamente y se le aplica el factor
calculado a cada columna de año de ocurrencia.
13
2.5. MÉTODOS CLÁSICOS DE ESTIMACIÓN DE LA IBNR
2.5.3. Mı́nimos cuadrados de De Vylder
Esta metodoloǵıa supone que la fracción de siniestros reportados hasta el periodo j resulta
independiente del año de vigencia i. De este modo, puede usarse un modelo multiplicativo para
la representación de las reclamaciones. Los datos de partida del triángulo deben ser montos no
acumulados cij .
La hipótesis principal del modelo es:
cij = xi · pj cumpliéndose
∑J
j=1 pj = 1
donde:
xi: monto total a pagar de los siniestros en el año de origen i.
pj : proporción de xi que se paga en el año de ocurrencia j.
Luego, los estimadores anteriores se obtienen por mı́nimos cuadrados; es decir, se trata de
determinar los valores de xi y pj tales que
∑
(cij−xi ·pj)2 sea mı́nima, donde la suma se realiza
sobre el conjunto de sub́ındice del que se tenga información. El sistema de ecuaciones resultante
es:
xi =
∑
∀j∈J cij · pj∑
∀j∈J p
2
j
y pj =
∑
∀i∈I cij · xi∑
∀i∈I x
2
i
Cabe resaltar que las columnas del triángulo de siniestralidad con los montos acumulados o
no, resultan proporcionales.
La similitud entre todos los métodos clásicos a los cuales se ha hecho referencia,
únicamente ofrecen predicciones puntuales de la IBNR mediante un modelo deter-
mińıstico, en otras palabras los modelo proporcionan una reserva técnica única sin tomar en
cuenta las condiciones de variabilidad, siendo una limitante de estos métodos.
14
2.6. MÉTODOS ESTOCÁSTICOS DE ESTIMACIÓN DE LA IBNR
2.6. Métodos Estocásticos de estimación de la IBNR
Los métodos estocásticos son más sofisticados, y su origen proviene, según Taylor [2003], a
mediados de los años 70. Este método supone aleatoriedad, es decir, aceptar la variación de si-
niestralidad a lo largo del tiempo para cualquier año de ocurrencia. Estos métodos, como afirma
England [2002], buscan obtener estimaciones tanto del valor como de la variabilidad de la IBNR,
a través de funciones de distribución de probabilidad. Muchos de los métodos estocásticos que
se han propuesto enla literatura, parten de la formulación pura del método Chain Ladder o de
ligeras modificaciones (la cual se analizará en el Caṕıtulo 4 del presente trabajo).
A continuación, se presenta brevemente una metodoloǵıa perteneciente a los métodos es-
tocásticos:
2.6.1. Bornhuetter-Ferguson
Este modelo propuesto por Bornhuetter y Ferguson en 1972, combina dos metodoloǵıas:
la Loss Ratio con otra basada en la experiencia de la compañ́ıa. Mientras el primer método
proporciona una siniestralidad a priori, el segundo se basa en la liquidación de siniestros que se
encuentra en la diagonal del triángulo (estos siniestros son representados de la siguiente manera:
Ci,J−i+1 para i = 1, · · · , I).
La expresión matemática que resulta para la estimación de los montos futuros acumulados
pueden formularse como:
Ĉij = Ĉi,k−i + (γ̂ − γ̂k−i) · α̂i i+ j > k
siendo:
γ̂: vector de los estimadores a priori de los montos acumulados.
α̂: vector de los estimadores a priori de las pérdidas finales esperadas.
Si el lector requiere entender mejor la expresión del método Bornhuetter-Ferguson y las
hipótesis requeridas, puede remitirse a [Schmidt, 2007] donde se explica con mayor detalle di-
15
2.6. MÉTODOS ESTOCÁSTICOS DE ESTIMACIÓN DE LA IBNR
cho método.
Una vez analizadas brevemente, algunas metodoloǵıas pertenecientes a los Métodos clásicos
y estocásticos, es razonable pensar que la elección del método actuarial para el cálculo
de la IBNR, puede estar condicionado, debido a que los métodos clásicos no cum-
plen con estar fundamentados en una base matemática, aśı como con la variabilidad
que la IBNR puede presentar, a diferencia de los métodos estocásticos que responden
de forma adecuada a estas necesidades. En el caṕıtulo siguiente se explicará la técnica
Bootstrap que será parte fundamental en los modelos propuestos para el cálculo de la reserva
de siniestros ocurridos no reportados en los Caṕıtulos 4 y 5.
16
Caṕıtulo 3
Técnica Bootstrap
Antes de iniciar la introducción al Bootstrap, es conveniente que se entienda el concepto
de remuestreo. Desde finales de la década de los 60’s comenzó a desarrollarse un revolucionario
método conocido con el nombre de “resampling” (remuestreo), para solucionar, por una parte,
problemas en el marco de la teoŕıa de probabilidad y la inferencia estad́ıstica y, por otra, la des-
motivación de los estudiantes durante los cursos de estad́ıstica en los años 60’s. Dicho método
se basa en el empleo de la simulación, utilizando los recursos computacionales. Los resultados
que se pueden alcanzar con las técnicas del remuestreo, logran dar solución a problemas clásicos
(intervalos de confianza, prueba de hipótesis, tamaño muestral), tareas cuya solución anaĺıtica
es dif́ıcil o imposible de obtener con las herramientas tradicionales; pero no se debe pensar que
la conclusión es que el método de remuestreo es un método capaz de sustituir la inferencia clási-
ca, más bien debe ser visto como una herramienta útil en situaciones donde ésta es inoperante
o sumamente engorrosa.
En la primavera de 1967, el profesor Julian L. Simon de la Universidad de Ilinois, comienza a
desarrollar un método revolucionario para enseñar y aplicar la estad́ıstica, actualmente conoci-
do como “resampling” (remuestreo), su esencia consiste en usar el conjunto de datos observados
o generados, para que a partir de éstos se generen nuevas muestras hipotéticas.
En 1979, Bradley Efron desarrolla y publica el análisis formal del Bootstrap, término que
proviene de la expresión inglesa: to pull oneself up by one’s bootstraps (que podŕıa traducirse
17
3.1. INTRODUCCIÓN AL BOOTSTRAP
como: levantarse mediante el propio esfuerzo). Es entonces cuando realmente el enfoque de
Simon cobra una importante fuerza teórica y capta el interés de toda la comunidad estad́ıstica,
quienes comienzan a explorarlo y utilizarlo para solucionar una amplia gama de problemas
en probabilidad e inferencia. Este proceder ha sido considerado por la American Statistical
Association como: el único gran descubrimiento en estad́ıstica desde 1970 [Miranda, 2003].
3.1. Introducción al Bootstrap
El método Bootstrap o Bootstrapping es un procedimiento de “resampling” (remuestreo),
basado en generar un gran número de muestras para estudiar el comportamiento de determi-
nados estad́ısticos, la idea de fondo es construir un modelo de distribución a partir de la infor-
mación proporcionada por la muestra, este procedimiento es diferente a los métodos clásicos
donde la base para hacer inferencias sobre la muestra se encuentra en suponer una distribución
muestral teórica, cuyos parámetros pueden ser estimados a partir de estad́ısticos observados en
la muestra, el Bootstrap implica obviar los supuestos sobre la distribución teórica que siguen
los estad́ısticos. En su lugar, la distribución del estad́ıstico se determina simulando un número
elevado de muestras aleatorias generadas directamente a partir de los datos observados en la
muestra.
Definición 1 Un estad́ıstico (muestral) es una función F que, dada una muestra estad́ıstica
de valores (X1, X2, ..., Xn), asigna un número, F (X1, X2, ..., Xn), que sirve para estimar deter-
minados parámetros de la distribución de la que procede la muestra.
En otras palabras, un estad́ıstico es una medida cuantitativa derivada de un conjunto de
datos de una muestra, con el objetivo de estimar o inferir caracteŕısticas de una población o
modelo estad́ıstico.
Existen diversos procedimientos para llevar a cabo una simulación Bootstrap, los cuales se
clasifican en dos grandes rubros, los procedimientos paramétricos y los no paramétricos:
Bootstrap paramétrico: Se conoce que F pertenece a una familia paramétrica de distribu-
ción y sólo se estiman sus parámetros.
18
3.2. BOOTSTRAP NO PARAMÉTRICO
Bootstrap no paramétrico: Se desconoce la fórmula de F y se estima con F̂ obtenida a
partir de la muestra.
Definición 2 Modelos paramétricos y no paramétricos: Sea X una variable aleatoria (v.a.) con
distribución de probabilidad dada por la función de distribución F.
La v.a. X sigue un modelo paramétrico, si su distribución de probabilidad F pertenece a
una familia de distribución con parámetros de dimensión finita.
La v.a. X sigue un modelo no paramétrico si sobre su distribución F únicamente se supo-
nen algunas condiciones de regularidad. Ejemplos de estas condiciones son: Continuidad
y Simetŕıa.
A pesar de la importancia de la metodoloǵıa Bootstrap paramétrico, el presente estudio
se enfocará en la metodoloǵıa del Bootstrap no paramétrico, la principal razón se debe a que
en la metodoloǵıa Bootstrap paramétrico se conoce la función de distribución de las variables
aleatorias caso contrario que en la metodoloǵıa Bootstrap no paramétrico, lo mismo ocurre
al tratar de inferir la reserva de IBNR, es decir no se conoce la función de distribución que
generan los siniestros que conforman el triángulo de siniestralidad, los cuales seŕıan las variables
aleatorias. Por lo que en futuras ocasiones que se mencione la metodoloǵıa Bootstrap únicamente
se hará referencia al Bootstrap no paramétrico.
3.2. Bootstrap no paramétrico
Es un método de inferencia estad́ıstica válido cuando no se hacen hipótesis paramétricas
sobre la distribución de los datos.
La estimación de parámetros con la técnica Bootstrap implica básicamente desarrollar un
proceso en el que se distinguen diferentes pasos, los cuales consisten:
19
3.2. BOOTSTRAP NO PARAMÉTRICO
1. A partir de la muestra original (X1, X2, ..., Xn), se hace un muestreo con reposición, es
decir, la extracción de un primer elemento se repone en la muestra original de tal forma
que podŕıa ser elegido de nuevo como segundo elemento de la muestra. Cada observación
individual tiene una probabilidad 1n de ser elegida cada vez.
2. Para la muestra obtenidase calcula el valor de un determinado estad́ıstico T que se utiliza
como estimador del parámetro poblacional, en cuyo estudio se tiene interés.
3. Se repiten los dos pasos anteriores, hasta obtener un elevado número de estimaciones. En
este punto, las herramientas tecnológicas son de suma importancia, para desarrollar las
tareas de selección de muestra y determinación de las estimaciones.
4. Se construye una distribución emṕırica del estad́ıstico, que representa una buena aproxi-
mación a la verdadera distribución. Es decir, se determina de este modo la distribución
muestral de un estad́ıstico sin haber hecho suposiciones sobre la distribución teórica a
la que se ajusta y sin manejar fórmulas anaĺıticas para determinar los correspondientes
parámetros de esa distribución.
Suponga una muestra (X1, X2, ..., Xn) con una función de distribución desconocida, tales
que:
(X1, X2, ..., Xn) ∼i.i.d F
Son variables aleatorias independientes e idénticamente distribuidas (i.i.d.). La metodoloǵıa
Bootstrap permitirá obtener la distribución emṕırica F̂n, que constituye la estimación no pa-
ramétrica de la distribución F. Esta estimación se apoya en el Teorema de Glivenko-Cantalli,
que establece una convergencia casi segura (c.s.), cuando n → ∞, entre las distribuciones F y
F̂n, denotando que se trata de una convergencia asintótica.
supx| ˆF (x)n − F (x)| →c.s. 0
Por lo tanto, es factible establecer F (x) = ˆF (x)n, lo que significa que la función de distri-
bución original es igual a la función de distribución estimada.
20
3.2. BOOTSTRAP NO PARAMÉTRICO
3.2.1. Teorema de Glivenko-Cantelli
El Teorema de Glivenko-Cantelli, determina el comportamiento asintótico de la función de
distribución emṕırica conforme el número de observaciones crece.
Teorema 1 Sea {Xn}n≥1 una sucesión de variables aleatorias independientes e idénticamente
distribuidas (i.i.d) definidas en el espacio de probabilidad (Ω,Λ, P ) con función de distribución
común F . Se denota por F̂n la función de distribución emṕırica resultante de las n primeras
variables aleatorias X1, ..., Xn. Entonces,
supx∈<| ˆF (x)n − F (x)| →c.s. 0
Demostración. Se presentará la demostración que hace Vélez [1993], p.36. Por la ley fuer-
te de los grandes números, F̂ (x)n → F (x) casi seguro (c.s.), es decir, para cada x ∈ < existe
Ax ∈ Λ tal que P (Ax) = 1 y limnFn(x)(w) = F (x) si w ∈ Ax. Se ha denotado por Fn(x)(w) a la
función de distribución emṕırica obtenida al observar X1(w), ..., Xn(w), siendo w un elemento
del espacio Ω. De la ley fuerte de los grandes números tomamos I(−∞,x) para cada x ∈ <, existe
Bx ∈ Λ tal que P (Bx) = 1 y limnFn(x−)(w) = F (x−) si w ∈ Bx, donde g(x−) denota el ĺımite
por la izquierda de una función g en x.
Para cada número natural k, y cada j = 1, ..., k, se consideran los puntos
xjk = {x ∈ < : F (x−) ≤ jk ≤ F (x)}
y los sucesos de A siguientes:
Ajk = Axjk = {w ∈ Ω : Fn(xjk)→ F (xjk)}
Bjk = Bxjk = {w ∈ Ω : Fn(x
−
jk)→ F (x
−
jk)}
Dk = ∩kj=1(Ajk ∩Bjk), D = ∩∞k=1Dk.
21
3.2. BOOTSTRAP NO PARAMÉTRICO
Dk es el suceso definido por la condición de que la función de distribución emṕırica converja
a la teórica para todos los puntos xjk (de igual manera para los ĺımites por la izquierda), para
un k fijo. D es el suceso en que esto ocurre simultáneamente para todo k. Por la ley de los
grandes números, P (Ajk) = P (Bjk) = 1 para todo j y todo k, luego P (Dk) = 1 para todo k y,
por tanto, P (D) = 1.
Obsérvese que, si x ∈ [xjk, x(j+1)k], por ser F y Fn funciones de distribución se tiene que
F (xjk) ≤ F (x) ≤ F (x−(j+1)k), y Fn(xjk) ≤ Fn(x) ≤ Fn(x
−
(j+1)k)
Como además F (x−(j+1)k)− F (xjk) ≤
1
k
F (x)n − F (x) ≤ Fn(x−(j+1)k)− F (xjk) ≤ Fn(x
−
(j+1)k)− F (x
−
(j+1)k) +
1
k
y
Fn(x)− F (x) ≥ Fn(xjk)− F (x−(j+1)k) ≥ Fn(xjk) + F (xjk)−
1
k
con lo cual, si δ
(k)
n es la mayor entre todas las diferencias
|Fn(xjk)− F (xjk)| y |Fn(x−jk)− F (x
−
jk)| (para n y k fijos)
se tiene que
Fn(x)− F (x) ≤ δ(k)n + 1k y Fn(x)− F (x) ≥ δ
(k)
n − 1k
Aśı, para cualquier k ∈ N ,
supx∈<|Fn(x)− F (x)| ≤ δ
(k)
n +
1
k
Obsérvese que, si se verifica el suceso D, para cualquier k ∈ N y cualquier ε > 0, se tiene
que δ
(k)
n < ε a partir de un cierto n, de forma que
supx∈<|Fn(x)− F (x)| ≤ ε+ 1k
a partir de cierto n. Por lo tanto,
22
3.3. TÉCNICAS DE SIMULACIÓN EN EL CÁLCULO DE PROBABILIDADES
supx∈<|Fn(x)− F (x)| →n 0
siempre que se verifique D. Como P (D) = 1, se sigue que
supx∈<|Fn(x)− F (x)| →n 0 casi seguro
La importancia del teorema anterior radica en que a mayor número de muestras mejor
será la estimación a la que se llegará.
En resumen, el método Bootstrap, supone utilizar la muestra considerando que en si misma
contiene la información necesaria sobre la distribución muestral. Cuanto más grande sea el
tamaño de la muestra, mejor será la estimación que se haga sobre la distribución muestral. Sin
embargo, esto no significa que, con muestras pequeñas, entre 10 y 20 casos, el método Bootstrap
no pueda ofrecer resultados correctos.
3.3. Técnicas de simulación en el cálculo de probabilidades
En la vida cotidiana todos los seres humanos han realizado algún cálculo de probabilidad,
aunque no lo noten, estos cálculos de probabilidad se llevan a cabo de forma inconsciente e
inconsistentemente. Por ejemplo, al estimar la probabilidad de éxito sobre su elección de ruta
para llegar al trabajo, es decir, encontrar poco tráfico, o cuando se mira al cielo para estimar
la probabilidad de lluvia y decidir si llevar o no el paraguas, etc.
Para realizar un cálculo de probabilidades de forma consistente se puede utilizar alguna de
las tres estrategias básicas:
1. Teoŕıa formal de las probabilidades.
2. Experiencia f́ısica (observar un gran número de veces y calcular la frecuencia relativa con
que ocurre el evento de interés).
3. Simular la experiencia f́ısica (el experimento en el cual se está interesado).
23
3.3. TÉCNICAS DE SIMULACIÓN EN EL CÁLCULO DE PROBABILIDADES
La primera de ellas implica un conocimiento teórico de las reglas de probabilidades y su
mayor dificultad radica en que, en determinadas situaciones resulta verdaderamente complejo
hallar la solución anaĺıtica del problema.
La segunda, no requiere de tal conocimiento teórico, sin embargo, realizar cierto experimen-
to un gran número de veces puede resultar una tarea engorrosa y tediosa. Aunque, en ocasiones,
es la única manera de estimar una probabilidad.
La última posibilidad, aplicando técnicas de simulación, se ha convertido en una estrategia
sumamente atractiva e intuitiva, ya que no se requiere del conocimiento teórico de la teoŕıa de
probabilidades y agiliza el proceso de realizar el experimento. Su principal dificultad radica en
que simular un experimento exige conocer las leyes f́ısicas que lo rigen.
Los siguientes ejemplos ilustran el poder de la simulación como herramienta utilizada para
resolver problemas en el marco de las probabilidades.
Ejemplo 1 ¿Cuál es la probabilidad de que 2 o más personas, entre un total de 25 alumnos
de un curso de la Facultad de Ciencias, cumplan años el mismo d́ıa?
La solución anaĺıtica para este problema seŕıa la siguiente, se denomina al suceso A como
”hay al menos dos personas que celebran sus cumpleaños a la vez” y Ac al evento complemen-
tario ”no hay dos personas para las que coincida la fecha de nacimiento”.
Suponga un año de 365 d́ıas, el número de casos posibles de celebración es 36525 un número
enorme. El número de casos favorables a que no existan dos personas que hayan nacido el
mismo d́ıa se puede obtener de la siguiente manera: 365 ∗ 364 ∗ 363 ∗ ... ∗ 341, esto se explica
de la siguiente forma: la primera persona puede haber nacido uno de los 365 d́ıas del año, la
siguiente uno de los 364 d́ıas restantes y aśı sucesivamente, para que la probabilidad de que no
haya dos personas que cumplan años el mismo d́ıa este dada por:
p(Ac)= 365∗364∗363∗...∗341
36525
= 0.4313
24
3.3. TÉCNICAS DE SIMULACIÓN EN EL CÁLCULO DE PROBABILIDADES
aśı la probabilidad que se buscaba es:
p(A) = 1− p(Ac) = 1− 0.4313 = 0.5687
Mediante simulación, la solución es extremadamente sencilla si se compara con el procedi-
miento desarrollado anteriormente. Los pasos para dar solución con técnicas de simulación son
los siguientes:
1. Se crean 25 números aleatorios que se encuentren en el rango de 1 hasta 365 (los d́ıas del
año).
2. Si los 25 números son diferentes, se registra 0; en caso contrario 1.
3. Se repiten los pasos anteriores digamos 1,000 veces.
4. La solución es la proporción de unos entre el número de veces que repetimos el experi-
mento.
Para explotar las herramientas computacionales para realizar las simulaciones, en este es-
tudio se utilizó el programa R (lenguaje de programación estad́ıstico) R Core Team [2013], (El
código de los programas a los cuales se hará referencia se encontrarán en el apartado apéndice
A). Con dicho programa, proporcionar solución al problema anterior es muy sencillo. En la
siguiente tabla se observan las probabilidades obtenidas mediante el programa:
No. Simulaciones Probabilidad
ID. 1 100 0.56
ID. 2 1,000 0.552
ID. 3 5,000 0.579
ID. 4 10,000 0.5659
En la tabla anterior se observa que las probabilidades al ir incrementando el número de
simulaciones son muy aproximadas al resultado teórico. Lo que ejemplifica el principio del
Teorema de Glivenko-Cantalli, que refiere que a mayor número de simulaciones se obtiene una
estimación casi segura a la probabilidad resultante con las técnicas de la teoŕıa de probabilidad.
25
3.3. TÉCNICAS DE SIMULACIÓN EN EL CÁLCULO DE PROBABILIDADES
Ejemplo 2 Si se lanzan 23 dados. ¿Cuál es la probabilidad de que la suma sea un múltiplo
de 7?
Resulta complicado resolver este problema con la teoŕıa de probabilidad, ya que implicaŕıa
determinar de cuántas maneras distintas se puede obtener un múltiplo de 7 y después dividirlo
por el número 623, mediante las técnicas de simulación, la resolución es muy sencilla. Los pasos
que sigue el programa son los siguientes:
1. Se crea un vector con los múltiplos del número 7 dentro del intervalo [23, 138].
2. Se crean 23 números aleatorios que se encuentren en el intervalo de [1, 6] (los números del
dado).
3. Si la suma de los 23 números coincide con algún elemento del vector del paso 1, se registra
1; en caso contrario 0.
4. Se repiten los pasos anteriores digamos 1,000 veces.
5. La solución es la proporción de unos entre el número de veces que repetimos el experi-
mento.
A continuación se muestran las probabilidades que se obtuvieron con el programa:
No. Simulaciones Probabilidad
ID. 1 100 0.11
ID. 2 1,000 0.151
ID. 3 5,000 0.1352
ID. 4 10,000 0.1418
Lo que se intenta ilustrar con estos ejemplos, es que resolver casi cualquier problema en el
marco de la teoŕıa de probabilidad usando el poder de las simulaciones, es una tarea simple,
resulte o no sencilla la solución con los métodos formales basados en fórmulas de la teoŕıa clásica.
Por lo tanto, se analizará el poder de la simulación por medio de la técnica bootstrap mediante
los métodos de remuestreo como herramientas para llevar acabo el cálculo de la estimación de
la reserva de IBNR.
26
3.4. MÉTODOS DE REMUESTREO BOOTSTRAP
3.4. Métodos de remuestreo Bootstrap
Existen dos métodos de remuestreo bootstrap clásicos. El primero de ellos recibe el nombre
de Remuestreo por partes y el segundo Remuestreo a partir de los residuos o residuales. El
uso de uno por sobre el otro dependerá de la naturaleza del modelo y de la interpretación de
éste. En la Sección 3.4.5 se pueden encontrar algunas razones que justifiquen el uso de uno
u otro método. Por ejemplo, en un análisis respecto a los estimadores de los coeficientes de
regresión lineal múltiple cuando la teoŕıa normal no se justifica, es de gran utilidad el proceso
de remuestreo por partes, ya que la hipótesis de normalidad en un modelo de regresión afirma
que los residuos del modelo ε siguen una distribución normal no aśı las variables aleatorias del
modelo (para mayor detalle véase Apéndice B).
A continuación, se presenta las metodoloǵıas de los remuestreos.
3.4.1. Remuestreo por partes
Este método consiste en realizar el remuestreo a partir de los datos originales, es decir
imaginemos a los datos como muestras aleatorias e independientes de una distribución F, es
decir, (xi, yi) ∼ F . En el caso no paramétrico, el estimador F̂ de F debe ser la distribución
emṕırica de los datos. Esta metodoloǵıa se realizará para el cálculo de la reserva de IBNR
mediante el Modelo de Regresión (véase Apéndice B), los resultados se presentan en el Caṕıtulo
5.
3.4.2. Remuestreo por partes: Parámetros β′s
Como ya se ha mencionado este método consiste en realizar el remuestreo a partir de los
datos originales. En este caso no paramétrico, se obtendrán los estimadores β′s de un modelo
de regresión lineal múltiple (véase Apéndice B), el algoritmo para realizar el remuestreo por
bootstrap es el siguiente:
Para i = 1, · · · , I donde en nuestro ejemplo práctico i son los años de vigencia en el triángulo
de siniestralidad.
27
3.4. MÉTODOS DE REMUESTREO BOOTSTRAP
1. Se selecciona 1∗, · · · , I∗ de forma aleatoria y con reemplazo a partir de {1, · · · , I}.
2. Para j = 1, · · · , J , tome x∗i,j = xi∗,j , y∗i = yi∗ , en este ejemplo práctico xi∗,j son los montos
ci,j del triángulo de siniestralidad y yi∗ es la suma de dichos montos.
3. Por último, obtener β̂, por mı́nimos cuadrados a partir de (x∗1, y
∗
1), · · · , (x∗n, y∗n).
En el caso de tener pocas observaciones es probable que la matriz (XtX) resulte singular 1.
En ese caso no se podrán calcular los estimadores de los coeficientes de regresión con el método
de mı́nimos cuadrados por lo que se deberá generar una nueva muestra bootstrap.
3.4.3. Remuestreo residual
Este método supone realizar el remuestreo a partir de los residuos (se llama residuo a la
diferencia entre los valores de la variable original y los valores que predecimos a partir de
nuestra muestra) cuando se supone que éstos son quienes dan estructura al modelo y cuando
la varianza de los residuos es una constante desconocida σ2. Para entender estos conceptos
se ejemplifican con la obtención de los residuos, mediante el modelo estad́ıstico basado en la
distribución Gamma propuesto por Mack [1993], se utiliza este modelo para la estimación de
siniestros del triángulo superior, con lo cual se podrán generar los residuos antes mencionados.
Por lo tanto, la obtención de la estimación de los siniestros esta dado por:
Ĉi,j = E[Ci,j ] = mi,j
donde:
i = 1, 2, · · · , I y j = 1, 2, · · · , J
mi,j = Representan la estimación de los datos originales es decir una estimación del triángu-
lo superior.
Aśı los residuos ri se denotan con la siguiente formula: ri = Ci,j−mi,j , por lo que la varianza
de los residuos viene dada por: V AR[
∑I
i=1 ri] = σ
2.
1Una matriz singular o no invertible, es aquella que no cuenta con otra matriz que al ser multiplicadas generen
la matriz identidad. Una matriz es singular si y solo si su determinante es nulo.
28
3.4. MÉTODOS DE REMUESTREO BOOTSTRAP
La distribución Gamma es una de las más importantes, desde el punto de vista actuarial,
por ser una de las que mejor se ajusta a la distribución emṕırica de las cuant́ıa o montos de los
siniestros [Cid, 2000].
Se consideran fijas las observaciones Ci,j , y se remuestrea a partir de los residuos; aunque
no es exactamente esto lo que se llevará acabo, ya que se aplica el ajuste de Pearson 2 a los
residuos, dicha metodoloǵıa se utilizará como solución para hallar un modelo que reproduzca
los resultados de Chain-Ladder Estocástico.
3.4.4. Remuestreo residual: Chain-Ladder Estocástico con Boostrap
Se presenta el algoritmo a seguir para realizarel remuestreo residual aplicado al Chain-
Ladder estocástico:
1. Se calculan los factores de proyección aplicando el método Chain-Ladder estocástico (véase
sección 4.2.1) al triángulo run-off de los datos originales de cuant́ıas acumuladas.
2. Se obtienen los valores acumulados estimados para los años anteriores de forma recurrente,
dividiendo el valor del año j entre el factor de proyección del año j-1, donde j es el año
de ocurrencia en triángulo de siniestralidad, es decir se realizan un número elevado de
Triángulos de Siniestros.
3. Se calculan los incrementos anuales para cada Triángulo de Siniestralidad partir de los
valores estimados en el paso 2. Las variaciones en las cantidades estimadas se calculan
por fila.
mi,j =
 Ĉi,j j = 1Ĉi,j − Ĉi,j−1 1 < j; j = J − i
donde mi,j son los incrementos estimados.
4. Elaboración de los residuos de Pearson. Para su cálculo se aplica la siguiente expresión:
2El ajuste de Pearson provee una medida de qué tan bien las observaciones son pronosticadas por el modelo.
29
3.4. MÉTODOS DE REMUESTREO BOOTSTRAP
r̂i,j =
Ci,j −mi,j√
mi,j
(3-1)
5. Se remuestrean los residuos utilizando la técnica bootstrap imponiendo la condición de
que todos los residuos tengan la misma probabilidad de ser remuestreados.
6. Se calculan los incrementos a partir de la muestra por el método bootstrap. Se tendrán
que despejar la ecuación del paso 4, partiendo de la ecuación (3-1) de los residuos de
Pearson, es decir:
Ĉi,j = r̂i,j ·
√
mi,j +mij
7. Se vuelven a calcular los factores de proyección del método Chain-Ladder de las mues-
tras regeneradas. A partir de los datos acumulados se obtiene los factores de la muestra
bootstrap.
8. Para finalizar, se calcula la estimación de la reserva de IBNR a partir de la muestra
bootstrap y sus factores de proyección. Al conocer la distribución, pueden calcularse
estad́ısticos de información tales como, la desviación estándar o cuantiles de la reserva.
El proceso de estos ocho pasos descritos se repite un número elevado de veces, Irene Lo-
zano Albarrán [2010] sugiere que el número de repeticiones sea de 5,000 o incluso superior. En
los ejemplos presentados en su publicación realizan un total de 10,000 repeticiones. En cada
una de las repeticiones se obtiene una nueva muestra y un nuevo valor de los estad́ısticos.
3.4.5. Diferencia entre métodos
La gran diferencia entre los métodos de remuestreo, se identifica en la forma de calcular las
réplicas o nuevas muestras bootstrap, el primero lo realiza a partir de los datos originales y el
segundo lo hace con los residuos.
En las dos formas de obtener replicaciones bootstrap se pueden mencionar dos puntos que
se deben tener en cuenta para de escoger uno de los métodos:
30
3.4. MÉTODOS DE REMUESTREO BOOTSTRAP
El método por partes permite aplicarse aún en casos de heterocedasticidad es decir que
las observaciones provienen de distribuciones de probabilidad con distinta varianza.
El método de remuestreo por pares es frágil cuando se tiene pocas observaciones.
En este sentido, un método no es mejor que el otro, la elección dependerá de cada caso y
de la interpretación de las variables, aśı como el objetivo del estudio en cuestión.
31
Caṕıtulo 4
Cálculo de la Reserva de IBNR
usando Boostrap
El bootstrapping es un método estocástico, el cual genera una distribución estad́ıstica de los
siniestros finales. La teoŕıa también conocida como Bootstrap proviene de la estad́ıstica general
y fue desarrollada alrededor de 1980 por Bradley Efron. Puede ofrecer soluciones numéricas a
una amplia gama de problemas estad́ısticos, esta técnica fue desarrollada para llevar a cabo
ciertas inferencias.
En esencia, se trata de sustituir el tradicional sistema de cálculo y sus complejas expresiones
anaĺıticas por un mecanismo basado en la aplicación de un algoritmo numérico de simulación.
La simulación consiste en repetir un proceso de generación de muestras en un número sufi-
cientemente elevado de veces, para realizar inferencias. Por lo cual es necesario el uso de las
herramientas computacionales. Algunas ventajas de la técnica de Bootstrap son:
Es útil cuando la precisión en el cálculo de los estimadores, suele ser algebraicamente
complicada, o bien no se conoce la distribución de los datos.
Permite obtener una buena aproximación de los principales estimadores a partir de la
muestra, aún sin conocer la distribución de donde provienen los datos.
Es importante distinguir entre el bootstrap paramétrico del que no lo es, en el Caṕıtulo 3 del
32
presente trabajo se profundizó con mayor detalle. Pero, la diferencia fundamental entre ambos
es el conocimiento o no de la función de distribución responsable de la generación de los valores
que se desea analizar. Si se conoce la función de distribución, entonces se estaŕıa en el caso
paramétrico, en el caso contrario seŕıa el no paramétrico, situación en la que las probabilidades
de ocurrencia vendŕıan dadas por la función emṕırica de distribución.
Como se ha mencionado en caṕıtulos anteriores, uno de los objetivos principales de las
compañ́ıas de seguros recae en la estimación correcta de sus obligaciones futuras. Para cada
aseguradora es fundamental conocer sus pasivos y cómo pueden cubrirlos para evitar la insol-
vencia. Con el fin de lograr este propósito, se han desarrollado diversos métodos de estimación,
en gran parte determińısticos, que permiten prever las obligaciones futuras. Uno de estos méto-
dos es el llamado ”Método Chain-Ladder Clásico” el cual será explicado en la sección 4.1 del
presente trabajo.
El Método Chain-Ladder es probablemente la metodoloǵıa más utilizada por las compañ́ıas
para la estimación de obligaciones futuras. Las razones de su popularidad recaen principalmente
en que es fácil de usar, no requiere de un software especializado para implementarlo y carece de
supuestos probabiĺısticos, con la excepción que la proporción de siniestros o reclamos que son
reportados a la compañ́ıa de un periodo a otro se mantienen constantes. Dado que en la prácti-
ca esta última suposición es bastante cuestionable por la existencia de factores que afectan tal
comportamiento, se hace necesario el estudiar e introducir métodos con una base probabiĺıstica
más formal que no sólo nos permitan una estimación puntual de reservas más realistas, sino
también de su variabilidad e intervalos de confianza.
A partir del Método Chain-Ladder Clásico, Mack [1993] introdujo una versión estocástica del
mismo que permitió la estimación de la variabilidad de las reservas mediante el error cuadrático
medio como una medida de incertidumbre contenida en los reclamos o siniestros.
33
4.1. CHAIN-LADDER CLÁSICO
4.1. Chain-Ladder clásico
En general el método Chain-Ladder utiliza un factor para ”suavizar”los datos y, con base
en éstos, realizar interpolaciones con el objetivo de estimar los siniestros agregados para cada
año de ocurrencia y, posteriormente, la reserva correspondiente.
El supuesto de esta metodoloǵıa es que las columnas del triángulo de ocurrencia son pro-
porcionales. La sustentación del supuesto depende en buena medida, tanto del tipo de negocio,
como de la homogeneidad y tamaño de la cartera.
Para estimar la proporción de cambio de un ejercicio a otro se calculan los factores fj
para cada año j de ocurrencia en el triángulo de siniestralidad. Donde fj es la tasa de modi-
ficación de liquidación de siniestro también llamado factor de Chain-Ladder, el cual trata de
estimar la proporción de cambio de un ejercicio a otro, fj está dada por la siguiente formulación:
fj =
∑I−j+1
i=1 Ci,j∑I−j+1
i=1 Ci,j−1
j = 2, 3, · · · , J
La fórmula anterior se puede interpretar como la suma de los siniestros del triángulo de si-
niestralidad de la columna j que representa el año de ocurrencia hasta el año de vigencia I−j+1
(enotras palabras, se suman los siniestros de la columna j hasta el último valor conocido de
vigencia) esto se divide entre la suma de los siniestros de la columna j − 1 hasta el mismo año
de vigencia antes descrito. Es decir, se obtiene un factor de proyección o de crecimiento de un
año al otro, es por eso que la fórmula se inicia en el año de ocurrencia j = 2, debido a que
para el año j = 1 el triángulo de siniestralidad se encuentra completo y no es necesario estimar
ninguna reserva.
A partir de las proporciones obtenidas, se calculan las proyecciones Ĉi,j es decir los valores
que faltan en el triángulo de IBNR hasta completarlo. Se definen los valores de la diagonal del
triángulo de la siguiente manera Ci,I−i+1 para cada año de vigencia i = 1, · · · , I es decir la
última siniestralidad que se conoce, a partir de ellos se estiman los siniestros futuros Ĉi,j∗+k
donde j∗ = I − i + 1 y k = 1, · · · , J − 1. Es decir, se completa la siniestralidad de los años
34
4.1. CHAIN-LADDER CLÁSICO
después del último valor conocido. Dichos valores se obtienen de la siguiente expresión:
Ĉi,j∗+k = Ci,j∗+k−1 · fj∗+k cumpliendo que j∗ + k ≥ J
La provisión técnica total de IBNR vendrá dada por la suma de la diferencia entre el monto
de siniestralidad estimada y el monto de siniestralidad del año anterior. Algunos aspectos im-
portantes a considerar en esta metodoloǵıa, tal y como se destaca en Claramunt [2003]:
Los datos del triángulo de siniestralidad deben ser positivos en su mayoŕıa.
Válido en situaciones con tasa de inflación constantes.
Aunque no se trata de un método estocástico, surge como un caso particular de diferentes
modelos estocásticos.
4.1.1. Variantes de Chain-Ladder
Varios han sido los intentos de depurar la metodoloǵıa clásica de Chain-Ladder, dando lugar
a variantes del modelo. No obstante, la técnica permanece esencialmente igual, manteniendo el
supuesto principal idéntico. La diferencia radica en la ponderación de los factores de desarrollo.
En este sentido, Van Eeghen [1981] describe variantes del método Chain-Ladder. En todas
ellas, parte del triángulo run-off formado por los factores de desarrollo di,j , obtenidos de la
siguiente manera:
di,j =
Ci,j
Ci,j−1
j = 2, 3, · · · , J
Además, cada variante utiliza una hipótesis alternativa. De entre todas ellas, se destacan
dos por su simplicidad matemática y por ser las más habituales en la literatura relacionada con
ello:
1. Ajuste de tendencias lineales (por mı́nimos cuadrados) a cada columna de di,j
35
4.1. CHAIN-LADDER CLÁSICO
2. Supuesto de que el factor de desarrollo es constante en cada columna, estimándose me-
diante una media aritmética ponderada de los factores de desarrollo emṕırico; esto es:
d̂i,j =
∑k−j−1
i=0 wi,j · di,j∑k−j−1
i=0 wi,j−1
con peso wi,j :
wi,j = 1 (Se supone que existe una tendencia lineal dentro del triangulo).
wi,j = Ci,j (Chain-Ladder clásico).
wi,j = i + j + 1 (Ponderación que sirve para dar peso a algunos años de ocurrencia
y años de vigencia).
wi,j = (i + j + 1)
2 (Ponderación que sirven para dar mayor peso a algunos años de
ocurrencia y años de vigencia).
4.1.2. Algoritmo para estimación: Chain-Ladder Clásico
1. Se calculan los factores de Chain-Ladder respecto al triángulo de siniestralidad acumulada:
fj =
∑I−j+1
i=1 Ci,j∑I−j+1
i=1 Ci,j−1
j = 2, 3, · · · , J
2. Con estos factores se estimarán los valores que faltan en el triángulo de siniestralidad para
cada año de vigencia i = 1, · · · , I hasta completarlo. Dichos valores se hallan mediante la
siguiente expresión:
Ĉi,j∗+k = Ci,j∗+k−1 · fj∗+k cumpliendo que j∗ + k ≥ J
donde:
j∗ = I − i+ 1
k = 1, · · · , J − 1
3. La provisión técnica total de IBNR vendrá dada por la suma de la diferencia entre el
monto de siniestralidad estimada y el monto de siniestralidad real.
36
4.1. CHAIN-LADDER CLÁSICO
4.1.3. Desarrollo de una Aplicación (interacción entre R y Excel)
Sin querer entrar en detalles de la programación, en este apartado del trabajo se explica el
objetivo perseguido por la aplicación, su estructura y la utilidad para el usuario. Aśı el objetivo
principal que se busca con la creación de dicha aplicación es el de permitir al usuario calcular la
estimación de reserva de IBNR partiendo de un triángulo de siniestralidad completo, formado
por cuant́ıas no acumuladas (ci,j) y con igual número de años de vigencia i que de ocurrencia
j.
El lector podrá comprender el desarrollo de la herramienta informática para el cálculo de
la provisión técnica IBNR utilizando las metodoloǵıas descritas en el presente trabajo, es decir
se explicará el algoritmo por medio de la herramienta informática, en este caso se explica el
algoritmo de la metodoloǵıa Chain-Ladder Clásico.
Dicha aplicación se realiza gracias a los códigos generados en el programa R y a un ar-
chivo para presentar los resultados mediante la interfaz gráfica del programa Excel, el lector
podrá obtener los códigos mencionados en el Apéndice A y el archivo de Excel antes descrito
en los enlaces de descarga en el Apéndice D.
Dicho lo anterior el algoritmo Chain-Ladder Clásico describe:
1. Los factores de Chain-Ladder se calculan por medio de las ĺıneas del código enumerado
del 1 al 7 del apartado Chain-Ladder Clásico.
2. Se completa el triángulo de siniestralidad con los factores anteriores con el código enume-
rado del 8 al 12 del apartado antes mencionado.
3. Se transforma el triángulo acumulado a cuant́ıas sin acumular para obtener la reserva
técnica de IBNR con el código enumerado del 13 a 14 del apartado ya descrito.
4. Gracias a la libreŕıa XLConnet de R se logra realizar la interacción entre R y Excel, se
genera dicha conjunción al correr el código enumerado del 15 a 25 del apartado antes
mencionado. En resumen, estas ĺıneas recaban los valores de los factores Chain-Ladder y
37
4.2. EL MÉTODO CHAIN-LADDER ESTOCÁSTICO DE MACK
el triángulo de cuant́ıas sin acumular para luego ser agregados en el archivo de Excel de
nombre Triángulo.xlsm en la hoja de cálculo CLClas en la celda A1 y A10 respectivamente.
5. Una vez los valores en el archivo Triángulo en la hoja de cálculo CLClas, se utiliza la
interfaz gráfica de Excel para llevar a cabo una tabla comparativa entre la estimación del
IBNR realizada y el IBNR Real facilitado por la compañ́ıa de seguros.
Figura 4-1: Vista al archivo ”Triángulo.xlsm”hoja de cálculo CLClas
La finalidad de utilizar la interfaz gráfica de Excel es presentar de forma amigable los re-
sultados y facilitar la manipulación de los mismos, esto debido a que hoy en d́ıa la mayoŕıa
de los resultados de las compañ́ıas aseguradoras son presentados en dicho programa.
4.2. El método Chain-Ladder estocástico de Mack
Mack [1993] planteó la siguiente cuestión: ¿Cómo se puede utilizar la información represen-
tada por observaciones pasadas y presentes, para predecir las severidades acumuladas futuras
totales de los siniestros?
Con esta pregunta Mack introdujo algunas condiciones en el modelo Chain-Ladder que se
detallan a continuación:
38
4.2. EL MÉTODO CHAIN-LADDER ESTOCÁSTICO DE MACK
1. Los montos pagados por siniestros con diferentes periodos de vigencia son independientes
e idénticamente distribuidos; es decir, ∀i 6= l, Ci,j y Cl,k son variables aleatorias indepen-
dientes e idénticamente distribuidas para cualquier valor de j y k.
2. Las variables aleatorias Ci,j son positivas casi en la mayoŕıa de los registros y tiene espe-
ranza finita.
3. Existen números reales no negativos fi, los cuales son denominados factores de desarrollo,
para i y j = 1, 2, · · · , n.
E[Ci,j+1|Ci,1, · · · , Ci,j ] = fj · Ci,j = Ĉi,j (4-1)
La principal motivación de Mack para introducir la ecuación (4-1) fue explicar la forma
de los llamados estimadores Chain-Ladder los cuales son comúnmente usados en la práctica
para la estimación de reservas futuras. En estesentido, el modelo de Mack es dictado por un
procedimiento estad́ıstico amplio.
4.2.1. Factores de desarrollo para el estimador Chain-Ladder
Los factores de desarrollo se generan a partir de de la ecuación (4-1), donde se observa:
E[Ci,j+1|Ci,1, · · · , Ci,j ] = fj · Ci,j = fj · E[Ci,j ]
donde: j = 1, 2, · · · , J
Se asume por la segunda condición de Mack que Ci,j es positivo para cada j. Por tanto:
fj =
E[Ci,j+1]
E[Ci,j ]
donde: j = 1, 2, · · · , J
39
4.2. EL MÉTODO CHAIN-LADDER ESTOCÁSTICO DE MACK
Por la Ley Fuerte de los Grandes Números el estimador de momentos propuesto para fj
esta dado por:
fj =
∑J−j
i=1 Ci,j+1∑J−j
i=1 Ci,j
donde: j = 1, 2, · · · , J
Por consiguiente fi es llamado el estimador del modelo Chain-Ladder Estocástico y a partir
de él, se obtiene la estimación de la reserva de IBNR. Cabe mencionar que este estimador del
modelo Chain-Ladder Estocástico es el mismo que el calculado con el modelo Chain-Ladder
Clásico, por lo cual se obtendrá la misma estimación de reserva de IBNR en los dos modelos,
la gran diferencia radica en que el modelo estocástico proporciona un error cuadrático medio el
cual es una forma de evaluar la diferencia entre un estimador y el valor real de la cantidad que
se quiere calcular.
4.2.2. Predicciones en el Modelo de Mack
El objetivo primordial consiste en predecir la severidad futura Ci,I+2−i para un periodo
continuo con base en el triángulo de siniestralidad. Por ello el Modelo de Mack [1997] define la
ecuación predictiva como:
E[Ci,I+2−i] = fI+1−i · Ci,I+1−i
donde: i = 2, 3, · · · , I
Esto implica que la estimación de la reserva de IBNR se pueda obtener de la siguiente forma:
Ĉi,I+2−i = fI+1−i · Ci,I+1−i
donde: i = 2, 3, · · · , I
40
4.2. EL MÉTODO CHAIN-LADDER ESTOCÁSTICO DE MACK
Como ya se mencionó la estimación del IBNR es la misma en las metodologiás de Chain-
Ladder Clásico y Estocástico, el planteamiento de predicciones en el Modelo de Mack es una
forma distinta de verlo al ya descrito en la sección 4.1, pero la finalidad es la misma, es decir
completar el triángulo inferior partiendo de los últimos valores conocidos y con ellos generar
las estimaciones de la reserva técnica de IBNR.
4.2.3. Error Cuadrático Medio de Mack
El error cuadrático medio de las variables Ti, para estimar T̂i, se define como:
ECM(T ) = E[(T̂i − Ti)2]
donde:
(T̂i − Ti) mide el error que se comete al estimar T̂i mediante Ti.
Se considera el cuadrado de ese error para evitar que las diferencias positivas se compensen
con las negativas.
Finalmente, se calcula cuánto vale, en promedio, este error cuadrático.
En Estad́ıstica, el error cuadrático medio es usado para determinar la medida en la que el
modelo no se ajusta a la información, o si el quitar ciertas observaciones puede simplificar el
modelo de manera correcta. Se puede decir que un error cuadrático medio mı́nimo a menudo
indica una variación mı́nima, y por lo tanto indica un buen estimador.
El error cuadrático medio de las predicciones Ĉi,I+2−i viene dada por:
MackS.E. = E[(Ĉi,I+2−i − Ci,I+2−i)2]
En Mack [1997] se definen los intervalos de confianza de los montos de reservas totales
estimados para el periodo de vigencia i, con la siguiente formula:
[Ĉi,I+k−i − (z1−α
2
·MackS.E.) , Ĉi,I+k−i + (z1−α
2
·MackS.E.)]
41
4.2. EL MÉTODO CHAIN-LADDER ESTOCÁSTICO DE MACK
Siendo z1−α
2
el percentil 100(1− α) % de una distribución normal estándar.
La fórmula anterior se puede entender como el rango que puede variar la estimación de
la reserva técnica de IBNR, debido al error cuadrático medio que presenta el modelo con una
cierta ponderación es decir con un nivel de confianza o de probabilidad que permanezca dentro
de este rango. Este es el gran aporte de los modelos estocásticos, que permiten obtener una
estimación puntual de la reserva y un intervalo de variabilidad.
4.2.4. Algoritmo para estimación: Chain-Ladder Estocástico
1. Se calculan fi los factores de Chain-Ladder Estocástico respecto al triángulo de siniestra-
lidad acumulada:
fj =
∑I−j+1
i=1 Ci,j∑I−j+1
i=1 Ci,j−1
j = 2, 3, · · · , J
2. Con estos factores se estima la reserva de IBNR es decir se completa el triángulo de
siniestralidad para cada año de vigencia i = 1, · · · , I. La reserva estimada se obtiene
mediante la siguiente expresión:
Ĉi,j∗+k = Ci,j∗+k−1 · fj∗+k cumpliendo que j∗ + k ≥ J
donde:
j∗ = I − i+ 1
k = 1, · · · , J − 1
3. La provisión técnica total de IBNR vendrá dada por la suma de la diferencia entre el
monto de siniestralidad estimada y el monto de siniestralidad real.
4. Se calcula el error cuadrático medio y el intervalo de confianza de la estimación:
[Ĉi,I+k−i − (z1−α
2
·MackS.E.) , Ĉi,I+k−i + (z1−α
2
·MackS.E.)]
Siendo z1−α
2
el percentil 100(1− α) % de una distribución normal estándar.
42
4.2. EL MÉTODO CHAIN-LADDER ESTOCÁSTICO DE MACK
4.2.5. Desarrollo de una Aplicación (interacción entre R y Excel)
El algoritmo Chain-Ladder Estocástico describe:
1. Los factores de Chain-Ladder Estocástico se calculan por medio de las ĺıneas del código
enumerado del 1 al 4 del apartado Chain-Ladder Estocástico.
2. Se completa el triángulo de siniestralidad con los factores anteriores con la ĺınea de código
enumerado con 5 del apartado antes mencionado.
3. Se calculan los errores cuadráticos medios por estimación es decir por año de vigencia y el
error cuadrático medio total con el código enumerado del 6 a 8 del apartado ya descrito.
4. Mediante la libreŕıa XLConnet de R logramos realizar la interacción entre R y Excel, se
genera dicha conjunción al correr el código enumerado del 13 a 26 del apartado antes
mencionado. En resumen, estás ĺıneas recaban los valores de los factores Chain-Ladder
Estocástico, el triángulo de cuant́ıas acumuladas y los valores de los errores cuadráti-
cos medios por estimación y total, para luego ser agregados en el archivo de Excel de
nombre Triángulo.xlsm en la hoja de cálculo CLEsto en la celda A3, A12, A78 y A88
respectivamente.
5. Una vez los valores en el archivo Triángulo en la hoja de cálculo CLEsto, se utiliza
la interfaz gráfica de Excel para llevar acabo el cálculo de los intervalos de confianza,
aśı como una tabla comparativa entre la estimación del IBNR realizada y el IBNR Real
facilitado por la compañ́ıa de seguros.
43
4.3. CHAIN-LADDER CON BOOTSTRAP
Figura 4-2: Vista al archivo ”Triángulo.xlsm”hoja de cálculo CLEsto
Como se indicó se utiliza la interfaz gráfica de Excel para presentar de forma amigable
los resultados y facilitar la manipulación de los mismos.
4.3. Chain-Ladder con Bootstrap
Como ya se ha mencionado el Bootstrap o Bootstrapping es una técnica de remuestreo
desarrollada para llevar a cabo ciertas inferencias. A grandes rasgos, se trata de reemplazar el
sistema clásico de cálculo que conlleva la aplicación de expresiones anaĺıticas complejas, por un
mecanismo con base en la aplicación de un algoritmo numérico de simulación. Éste consiste en
generar un elevado número de muestras para realizar esas inferencias.
La propuesta de esta metodoloǵıa para dar una solución al problema de la estimación de
reservas parte de England [1999]. Dado que las reservas suelen estimarse a partir de diversos
modelos, el remuestreo se realizará a partir de los residuos del modelo seleccionado, tal y como
sugiere Efron [1994]. Un aspecto fundamental consiste en determinar cuál será la expresión
de los residuos; siendo los más habituales los que resultan a partir de la media dispersión de
Pearson. Debido al desconocimiento de la distribución de las variables Ci,j se remuestrean los
44
4.3. CHAIN-LADDER CON BOOTSTRAP
residuos. Para ello, se utilizará el residuo de Pearson, que tiene la propiedad de distribuirse
asintóticamente como una distribución normal con media 0 y desviación 1. Con esto, se remues-
trea una variable que tiene una distribución asintótica conocida.

Otros materiales

Materiales relacionados