46327

Aviación

•
Outros

Carlos marcel _
31/10/2023
¡Este material tiene más páginas!
Entonces, ¿te gustó este material?
Ayude a animar a otros estudiantes a mejorar el contenido
¿Te gustó este material? ¡Compartir! 🧡
Aviación

4366 Materiales compartidos
Descarga la aplicación para disfrutar aún más
Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!
Vista previa del material en texto
Universidad de Costa Rica
Facultad de Ciencias
Escuela de Matemática
Trabajo final de graduación para optar por el grado de licenciatura en Ciencias
Actuariales
APLICACIÓN DE LA TEORÍA BAYESIANA EN LA
TARIFACIÓN DEL SEGURO DE AVIACIÓN
Siviany Gerardo Araya Vargas
San José, Costa Rica.
2021
Aplicación de la teoría bayesiana en la tarifación del seguro de aviación. 
Trabajo final de graduación sometido y aceptado por el Tribunal del trabajo final de 
graduación como requisito para optar por el grado de licenciatura en Ciencias Actuariales. 
Tribunal Examinador 
Dr. Álvaro Guevara Villalobos 
Presidente del Tribunal 
Director del Trabajo 
Lector 
M.Sc. Rodrigo Arias López 
Lector 
Miembro del Tribunal, Lector externo 
Siviany Gerardo Araya Vargas 
Candidato 
El presente trabajo de investigación lo dedico al Ser Supremo que gobierna todo lo
que existe, quien me ha brindado sabiduŕıa para desarrollar nuevos conocimientos,
enerǵıa para vivir y amar la ciencia.
A mi madre y a mi padre, por su ejemplo y entrega en cada etapa de mi vida, a mi
t́ıa por darme un horizonte, a toda mi familia por su apoyo incondicional.
A mi compañero de aventuras, quien me dio palabras de aliento en cada momento
de frustración, quien sonrió a mi lado en cada momento de aciertos.
A la vida misma.
I
Agradecimientos
Deseo brindar un agradecimiento profundo a mi tutor PhD. Luis Barboza, profe-
sor e investigador de la Universidad de Costa Rica, quien con su amplio conocimiento
en la estad́ıstica bayesiana se dedicó a conducir mi proyecto para lograr los objetivos
planteados en cada etapa del mismo.
Un agradecimiento especial a mi Alma Mater, la Universidad de Costa Rica, a todos
los profesores que me transmitieron sus conocimientos y en general, al sistema de
Educación Pública de Costa Rica que permitió que este sueño de vida fuera posible
desde sus ráıces.
Agradezco a las jefaturas y colaboradores del Instituto Nacional de Seguros, que
permitieron desarrollar mi proyecto con la información y herramientas que fueron
necesarias.
Un agradecimiento fraterno a toda mi familia, en especial a mi madre, por ser mi
motor de vida.
II
Resumen
El proceso de tarifación en las compañ́ıas de seguros, se basa generalmente en
los datos de las pérdidas para medir su cuant́ıa y relación existente con los montos
expuestos de la cartera del seguro espećıfico. Esto no es posible para nuevos riesgos o
productos de seguros donde los datos de pérdidas son escasos o no están disponibles.
En el marco de la normativa creada por la Superintendencia General de Seguros
en Costa Rica, las compañ́ıas deben investigar y/o desarrollar teoŕıa para incorpo-
rarla dentro de la nota técnica, creando sustento técnico para utilizar correctamente
la poca información existente y permitiendo, bajo un análisis de sensibilidad, regis-
trar bajo una base sólida y en un contexto realista, tarifas que se catalogan como
experimentales. Las tarifas experimentales se establecen subjetivamente con poca
o ninguna justificación actuarial y se ajustan con la experiencia de años posterio-
res, que podŕıa representar inadecuadamente la distribución natural de los siniestros
asociados al producto.
En el contexto de la estad́ıstica bayesiana, podemos encontrar una gran cantidad
de modelos que permiten obtener una prima de riesgo con base en el conocimiento
de expertos del área de suscripción y otras dependencias que manejan información
del seguro de aviación. Por lo tanto, en la presente tesis se propone incorporar la
opinión de los profesionales en materia del seguro de aviación del Instituto Nacional
de Seguros dada la escasez de información relevante para medir todos y cada uno
de los eventos que generen una pérdida para la compañ́ıa, asociados a los riesgos
asumidos por la misma en esa ĺınea de seguros con un riesgo potencial elevado.
Un enfoque bayesiano permite añadir complejidad a la forma de tarifar estos
seguros, generando primas de riesgo con una base más solida y en un contexto más
realista. Estos modelos podŕıan ser incorporados en las notas técnicas, apoyando
no solo a la aseguradora, sino también al regulador en su gestión de asegurar la
estabilidad de las compañ́ıas y su responsabilidad frente a los asegurados que están
expuestos a riesgos y esperan ser indemnizados ante los eventos que puedan acaecer.
III
Abstract
The pricing process in the Insurance Companies, is mainly based on loss data to
measure their amount and relationship with respect to the exposed amounts of the
specific insurance portfolio. This aproach is not possible for new risks or insurance
products where loss data is scarce or unavailable.
In the regulation created by the Superintendencia General de Seguros in Costa
Rica, the companies must investigate and develop sustainable theory to incorporate
it into the technical note, creating technical support for correctly utilize the little
existing information and allowing, under a sensitivity analysis, to register on a solid
basis and in a realistic context, quotes that are classified as experimental. Expe-
rimental quotes are subjectively established with little or no actuarial justification
and adjust with the experience of later years, even the latter being, possibly not
representative of the distribution of the associated claims to the product.
In the context of bayesian statistics, we can find a wide range of models to be
used for obtaining a risk premium based on the knowledge of expert underwriters
and other technicians who study day-to-day aviation insurance. It is proposed to
incorporate the opinion of the professionals in the aviation insurance at Instituto
Nacional de Seguros, given the lack of relevant information to measure each and
every one of the events that can trigger a loss for the company, associated with the
risks assumed by it in this insurance line with a high potential risk.
A bayesian approach allows to add a special complexity to the way in which
these insurances are priced, generating risk premiums with a more solid base and in
a more realistic context. These could be incorporated in the technical notes of the
products under study, giving a technical support not only the insurer, but also the
regulator that helps it in its function of taking care of the stability of the companies
and their responsibility to the insured people who are exposed to risks and who
expect to be compensated for the events that may occur.
IV
Índice general
Agradecimientos II
Resumen III
Abstract IV
Índice general V
Lista de figuras IX
Índice de figuras IX
Lista de tablas XI
Índice de cuadros XI
1. Introducción 1
1.1. Justificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Planteamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3. Objetivo General . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4. Objetivos Espećıficos . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
V
ÍNDICE GENERAL ÍNDICE GENERAL
1.5. Antecedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2. Marco Teórico 6
2.1. Seguro de Aviación . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2. Modelos para el número de siniestros . . . . . . . . . . . . . . . . . . 8
2.2.1. Definición de frecuencia . . . . . . . . . . . . . . . . . . . . . 8
2.2.2. Método tradicional . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2.3. Ajuste de distribución por Máxima Verosimilitud . . . . . . . 8
2.2.4. Distribución binomial negativa . . . . . . . . . . . . . . . . . . 9
2.2.5. Distribución Poisson . . . . . . . . . . . . . . . . . . . . . . . 11
2.2.6. Regresión Binomial Negativa Inflada con Ceros . . . . . . . . 13
2.2.7. Regresión Poisson Inflada con Ceros . . . . . . . . . . . . . . . 16
2.3. Modelos para la severidad . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3.1. Distribución Emṕırica . . . . . . . . . . . . . . . . . . . . . . 182.3.2. Distribución Log-normal . . . . . . . . . . . . . . . . . . . . . 19
2.3.3. Distribución Exponencial . . . . . . . . . . . . . . . . . . . . . 20
2.3.4. Distribución Pareto . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3.5. Distribución Burr . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.6. Distribución Weibull . . . . . . . . . . . . . . . . . . . . . . . 22
2.3.7. Distribución Gamma . . . . . . . . . . . . . . . . . . . . . . . 22
2.4. Modelo de Riesgo Colectivo . . . . . . . . . . . . . . . . . . . . . . . 23
2.5. Contexto Bayesiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.5.1. Modelo inicial . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.5.2. Modelo Jerárquico . . . . . . . . . . . . . . . . . . . . . . . . 25
2.6. Modelos compuestos para la frecuencia . . . . . . . . . . . . . . . . . 26
2.6.1. Distribución Binomial Negativa con parámetro r conocido . . 27
VI
ÍNDICE GENERAL ÍNDICE GENERAL
2.6.2. Binomial Negativa con ambos parámetros desconocidos . . . . 28
2.6.3. Distribución Poisson con previa Gamma . . . . . . . . . . . . 30
2.7. Modelos compuestos para la severidad . . . . . . . . . . . . . . . . . 31
2.7.1. Lognormal con ambos parámetros desconocidos . . . . . . . . 31
2.7.2. Exponencial con previa Gamma . . . . . . . . . . . . . . . . . 32
2.7.3. Pareto con ambos parámetros desconocidos . . . . . . . . . . . 33
2.7.4. Weibull con parámetro de forma conocido . . . . . . . . . . . 34
2.7.5. Previas para la distribución Gamma . . . . . . . . . . . . . . 34
2.7.6. Algoritmo básico Metropolis-Hastings . . . . . . . . . . . . . . 35
2.7.7. Método de muestreo de Gibbs . . . . . . . . . . . . . . . . . . 36
2.7.8. Criterio de Información de Devianza (DIC) . . . . . . . . . . . 37
2.7.9. Medidas del error en cadenas de Markov . . . . . . . . . . . . 38
2.8. Cálculo de primas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3. Metodoloǵıa 41
4. Análisis Descriptivo 47
4.1. Base de Siniestros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.2. Frecuencia Observada . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.3. Severidad Observada . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.4. Método Frecuentista . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.4.1. Análisis Determińıstico . . . . . . . . . . . . . . . . . . . . . . 51
4.4.2. Ajuste de distribuciones . . . . . . . . . . . . . . . . . . . . . 52
5. Ajuste Modelos de Frecuencia 55
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.2. Modelo F1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
VII
ÍNDICE GENERAL ÍNDICE GENERAL
5.3. Modelo F2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
5.4. Modelo F3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
5.5. Modelo óptimo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
6. Ajuste Modelos de Severidad 63
6.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
6.2. Modelo S1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
6.3. Modelo S2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
6.4. Modelo S3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
6.5. Modelo S4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
6.6. Modelo S5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
6.7. Modelo S6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
6.8. Modelo S7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
6.9. Modelo S8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
6.10. Modelo S9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
6.11. Modelo S10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
6.12. Modelo óptimo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
7. Modelo y Tarifación 79
7.1. Modelo Seleccionado . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
7.2. Tarifación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
Bibliograf́ıa 93
VIII
Índice de figuras
4.1. Siniestros Pagados por Trimestre de Estudio . . . . . . . . . . . . . . 48
4.2. Histograma de la Cantidad de Siniestros Pagados por Trimestre . . . 48
4.3. Boxplot de Montos Pagados por Siniestros y sus Logaritmos . . . . . 50
4.4. Histogramas de los Montos Pagados por Siniestros y sus Logaritmos . 50
4.5. Comparación entre distribución de frecuencia emṕırica y ajustada . . 52
4.6. Gráfico cuantil-cuantil para distribuciones de severidad ajustadas . . 53
5.1. Traza de las realizaciones del parámetro λ, Modelo F2, CV=20 . . . . 60
5.2. Densidad posterior del parámetro λ, Modelo F2 CV=20 . . . . . . . . 60
5.3. Comportamiento de la autocorrelación, Modelo F2 CV=20 . . . . . . 61
5.4. Convergencia del diagnóstico Gelman-Rubin para λ, Modelo F2 CV=20 61
5.5. Histograma del parámetro λ del Modelo F2, CV=20 . . . . . . . . . . 62
6.1. Traza del parámetro α del modelo S10, CV=20 . . . . . . . . . . . . 71
6.2. Traza del parámetro R del modelo S10, CV=20 . . . . . . . . . . . . 71
6.3. Traza del hiperparámetro R del modelo S10, CV=20 . . . . . . . . . 72
6.4. Densidad posterior del parámetro α, Modelo S10 CV=20 . . . . . . . 72
6.5. Densidad posterior del parámetro R, Modelo S10 CV=20 . . . . . . . 73
IX
ÍNDICE DE FIGURAS ÍNDICE DE FIGURAS
6.6. Densidad posterior del hiperparámetro R, Modelo S10 CV=20 . . . . 73
6.7. Gráfico de autocorrelación del parámetro α, Modelo S10, CV=20 . . 74
6.8. Gráfico de autocorrelación del parámetro R, Modelo S10, CV=20 . . 74
6.9. Gráfico de autocorrelación del hiperparámetro R, Modelo S10 CV=20 75
6.10. Convergencia del diagnóstico Gelman-Rubin del parámetro α . . . . . 75
6.11. Convergencia del diagnóstico Gelman-Rubin del parámetro R . . . . . 76
6.12. Convergencia del diagnóstico Gelman-Rubin del hiperparámetro R . . 76
6.13. Histograma del parámetro α del modelo S10, CV=20 . . . . . . . . . 77
6.14. Histograma del parámetro R del modelo S10, CV=20 . . . . . . . . . 78
6.15. Histograma del hiperparámetro R del modelo S10, CV=20 . . . . . . 78
7.1. Histograma de la pérdida anual esperada del modelo de riesgo colectivo 80
8.1. Escenarios del modelo F1, definido con la libreŕıa R2OpenBUGS . . . 85
8.2. Escenarios del modelo F2, definido con la libreŕıa R2OpenBUGS . . . 85
8.3. Escenarios del modelo F3, definido con la libreŕıa R2OpenBUGS . . . 86
8.1. Modelos de Severidad S1 definidos con la libreŕıa R2OpenBUGS . . . 87
8.2. Modelos de Severidad S2 definidos con la libreŕıa R2OpenBUGS . . . 87
8.3. Modelos de Severidad S3 definidos con la libreŕıa R2OpenBUGS . . . 88
8.4. Modelos de Severidad S4 definidos con la libreŕıa R2OpenBUGS . . . 88
8.5. Modelos de Severidad S5 definidos con la libreŕıa R2OpenBUGS . . . 88
8.6. Modelos de Severidad S6 definidos con la libreŕıa R2OpenBUGS . . . 89
8.7. Modelos de Severidad S7 definidos con la libreŕıa R2OpenBUGS . . . 89
8.8. Modelos de Severidad S8 definidos con la libreŕıa R2OpenBUGS . . . 90
8.9. Modelos de Severidad S9 definidos con la libreŕıa R2OpenBUGS . . . 90
8.10. Modelos de Severidad S10 definidos con la libreŕıa R2OpenBUGS . . 91
8.1. Modelo de Riesgo Colectivo definido con la libreŕıa R2OpenBUGS . . 92
X
Índice de cuadros
3.1. Esquema de modelos para la frecuencia escritura amplia . . . . . . . 42
3.2. Esquema de modelos para la severidad (A) . . . . . . . . . . . . . . . 43
3.3. Esquema de modelos para la severidad (B) . . . . . . . . . . . . . . . 44
4.1. Resultados bondad de ajuste χ2 . . . . . . . . . . . . . . . . . . . . . 52
4.2. Resultados criterios de ajuste distribuciones de severidad . . . . . . . 54
4.3. Resultados del modelo de riesgo colectivo con tarifacióntradicional . 54
5.1. Estad́ısticos relacionados a cada modelo de frecuencia ajustado . . . . 59
5.2. Estad́ısticos relacionados a cada parámetro del modelo ajustado . . . 62
6.1. Estad́ısticos relacionados a cada modelo de severidad ajustado . . . . 70
6.2. Estad́ısticos relacionados a cada parámetro del modelo ajustado . . . 77
7.1. Escenarios de prima de riesgo para diferentes parámetros establecidos 81
CAPÍTULO 1
Introducción
1.1. Justificación
Las compañ́ıas de seguros están desarrollando constantemente nuevos productos
de seguros generales (daños), respondiendo a necesidades del mercado: intermedia-
rios, clientes externos, clientes internos o motivaciones poĺıticas o económicas.
Para inscribir el producto ante el regulador es necesario diseñar una nota técnica,
que en el caso de Costa Rica, corresponde a un documento formal solicitado por la
Superintendencia General de Seguros (SUGESE) de acuerdo con lo establecido en
el Reglamento sobre Autorizaciones, Registros y Requisitos de Funcionamiento [1].
La nota técnica contiene los modelo y parámetros técnicos para la definición de la
estructura tarifaria y de coberturas del producto, en términos generales, aśı como un
resumen de la documentación contractual sobre la cual se regulan las condiciones
generales con las cuales el asegurado tiene conocimiento del contrato de seguro
celebrado.
A nivel de nota técnica es necesario medir el nivel de riesgo asociado al producto,
aśı como las causas, las formas de clasificarlos y la manera en que pueden verse dis-
minuidos, con el fin de generar un menor impacto a los asegurados y a las compañ́ıas
de seguro, y con ello representar los números en una cantidad que deben cobrar las
aseguradoras para cubrir los riesgos asegurables de manera suficiente y estable a
lo largo del tiempo. En resumen, se debe determinar una prima pura asociada al
riesgo a la cual se le incorporan una serie de recargos para considerar los gastos de
administración, los gastos que se producen al generar los contratos, el margen de
utilidad esperado, y otros gastos que interfieren en el costo del seguro.
En el Instituto Nacional de Seguros existen ĺıneas de seguros en donde la in-
1
1.1. JUSTIFICACIÓN INTRODUCCIÓN
formación estad́ıstica de siniestros es escasa para poder determinar una función de
distribución que se pueda ajustar a la realidad, estos datos contienen información
valiosa sobre los eventos más probables y no reflejan los eventos catastróficos o de
mayor severidad, dado que corresponden a ĺıneas de seguro que potencialmente re-
presentan una elevada severidad, pero una baja frecuencia. Los seguros de aviación
contemplan coberturas de daño directo y de responsabilidad civil, en este tipo de
seguros se cuenta con información estad́ıstica, pero se considera insuficiente para
establecer la exposición real a la que puede verse enfrentada la compañ́ıa de seguros
por los eventos que puedan generarse.
En Costa Rica se han registrado casos importantes de cáıda de aeroplanos; entre
los eventos de mayor trascendencia se pueden mencionar las tragedias del Vuelo 9916
de Nature Air en 2017, y el Vuelo 32 de Sansa en 1990. Estos eventos potenciales que
podŕıan estar asociados a la cartera del Instituto pueden ser amparados por contratos
de reaseguro a nivel internacional o bien pueden asumidos en su totalidad por la
compañ́ıa aseguradora, en cualquier caso, es importante medir la vulnerabilidad
y el nivel de riesgo que existe, dentro del plan de sostenibilidad financiera de la
institución.
Tradicionalmente, las compañ́ıas de seguros miden los niveles de siniestros y
montos asegurados expuestos para establecer una prima de riesgo, cuando no existe
información generalmente se recurre a primas experimentales las cuales deben ser
ajustadas cada cierto peŕıodo midiendo la suficiencia de las primas cobradas.
Debido a que estos modelos de tarifación experimental no cuentan con suficiente
respaldo técnico, se expone a las aseguradoras y a los asegurados a un riesgo de insu-
ficiencia tarifaria o de sobreprecio. Sumado a estas preocupaciones, cabe mencionar
que en Costa Rica el mercado de seguros se aperturó en la última década, y las
exigencias del mercado no permiten tener movimientos abruptos en las cantidades
cobradas a los asegurados. Se busca entonces enfocar los esfuerzos a determinar tari-
fas que contemplen otro tipo de información disponible en adición a la de siniestros
y asi evitar el registro de seguros cuyas primas se definieron sin ninguna justificación
actuarial de fondo.
En el Instituto Nacional de Seguros, la aplicación de la teoŕıa bayesiana en los
procesos de tarifación no ha sido la práctica, esta rama de la estad́ıstica permite
incorporar información bajo criterio experto en un contexto de formalidad, dentro
de la cual existen múltiples modelos que pueden ser utilizados para atender este tipo
de circunstancias. Es necesario explorar otros mecanismos para medir el riesgo, en
donde se pueda considerar el criterio de profesionales que han trabajado ese tipo
de seguros durante varios años, buscando teoŕıa aplicable que permita ajustar la
distribución de la frecuencia de siniestros y de la severidad de los mismos, de una
manera más técnica.
2
1.2. PLANTEAMIENTO INTRODUCCIÓN
1.2. Planteamiento
Con este trabajo se pretende tarifar productos de ĺıneas de seguros con riesgos
potenciales, inicialmente con el estudio particular de la ĺınea de aviación que cuentan
con información histórica de siniestros muy escasa o insuficiente para la distribución
de siniestros que mejor se ajuste a la realidad, contemplando todos aquellos even-
tos posibles y que potencialmente pueden generar pérdidas económicas al Instituto
Nacional de Seguros.
1.3. Objetivo General
Desarrollar una nueva metodoloǵıa de tarifación para las coberturas del seguro
de aviación del Instituto Nacional de Seguros madiante la exploración y aplicación
de modelos bayesianos, utilizando información previa de profesionales expertos de
la institución, con el fin de brindar un enfoque técnico a ĺıneas de seguros generales
que presentan poca información estad́ıstica y cuyas tarifas deben ser suficientes para
cubrir todos los riesgos esperados.
1.4. Objetivos Espećıficos
1. Analizar los modelos de Bayes para la frecuencia de siniestros que se han utili-
zado en otras investigaciones y realizar un proceso de optimización, escogiendo
un modelo que permita contemplar la cantidad de riesgos que se presentaŕıan
en un umbral de tiempo definido, por eventos que afecten la ĺınea de Aviación
del INS.
2. Analizar los modelos de Bayes para la severidad como recopilación de varias
investigaciones y realizar un proceso de optimización, escogiendo el modelo
más adecuado para medir los montos de pérdidas individuales que se estaŕıan
presentando ante riesgos materializados y amparados bajo las coberturas del
producto de aviación del INS.
3. Conformar un modelo de riesgo colectivo y determinar la distribución de las
pérdidas acumuladas en un peŕıodo anual, e incorporar los componentes ac-
tuariales de la tarifación tradicional en seguros con el fin de obtener una tarifa
comercial para el producto con base en la distribución posterior del modelo
general.
3
1.5. ANTECEDENTES INTRODUCCIÓN
1.5. Antecedentes
El método clásico de tarifación, conocido por su nombre en inglés: “Burning Cost
Ratio”, determina la relación entre los siniestros acumulados incurridos y las sumas
aseguradas expuestas (base expuesta) en un peŕıodo de estudio[2], produciendo una
proporción de monto asegurado que se debe destinar para hacer frente a los siniestros
esperados en el futuro. La utilización del modelo tradicional es efectivo en ĺıneas de
seguro con una frecuencia de siniestros medible y estable a los largo del tiempo y
sobre las cuales no se esperan afectaciones por eventos catastróficos. A nivel regional,
las compañ́ıas de seguros deben desarrollar nuevas estrategiaspara medir su riesgo
y con ello tarifar adecuadamente los productos que ofrece.
A nivel internacional, desde el año 2012, las compañ́ıas de seguros se han tenido
que ir adaptando a un marco normativo a nivel internacional que regula los re-
querimientos de capital de las aseguradoras, conocido como Solvencia II (European
Comission 2009). Las empresas deben implementar modelos de provisiones técni-
cas que resulten más sensibles al riesgo. Bajo un enfoque más técnico se establecen
provisiones de siniestros principalmente, esto impacta directamente el proceso de
tarifación. En una publicación realizada por la reaseguradora Munich Re se indica
que en este proceso es dif́ıcil evaluar el impacto en la capacidad del mercado y los
precios, pero es probable que la mayor transparencia con respecto al costo total del
riesgo conduzca a que los precios y las reservas sean más proporcionales al riesgo[3].
Existen productos, coberturas o ĺıneas de Seguro en los cuales no se cuenta con
información estable, los riesgos asociados dependen de variables complejas, factores
ambientales, poĺıticos, entre otros, que dificultan el proceso de medición del riesgo y
ajuste de los precios. Un ejemplo práctico donde se presenta una situación particular
es el caso de seguros de aviación, en donde se aseguran las aeronaves para uso comer-
cial o privado. En un mercado pequeño, resulta dif́ıcil medir la prima que se debe
cobrar para este producto, dado que las afectaciones se dan por casos catastróficos,
presentándose muy pocos casos en un periodo determinado, pero con una severidad
(monto) bastante elavada.
En un periodo de 5 años, por ejemplo, podŕıa no haberse registrado ningún even-
to, y en el mejor de los escenarios, en cuanto a recopilación de datos, podŕıan tenerse
registros de algunos casos ocurridos, pero estos no permitiŕıan estimar cuánto se de-
beŕıa cobrar realmente, si se utilizara el método tradicional de tarifación. Utilizando
la metodoloǵıa bayesiana se puede romper esta brecha de información, en el proceso
se considera el criterio experto de varios profesionales de la compañ́ıa, principalmen-
te del área de suscripción, quienes pueden medir algunos factores importantes para
conocer el nivel de riesgo y sus cualidades.
Con base en los estudios realizados sobre la inferencia bayesiana en el mercado de
seguros se concluye que el marco bayesiano permite evaluar, de forma más prácti-
4
1.5. ANTECEDENTES INTRODUCCIÓN
ca, los parámetros y la incertidumbre de predicción utilizando las distribuciones
predictivas previa y posterior, respectivamente. Además, indican que los modelos
que utilizaron, ajustaron bien los datos históricos, capturando el efecto de cohorte
estocástico, siendo este parsimonioso y relativamente simple[4].
Se logró identificar un estudio realizado en el año 2008 para tarifar un nuevo
producto de viajes al espacio, dado que corresponde a un riesgo dif́ıcil de medir, fue
necesario realizar un modelo aplicable pero ajustado a la realidad, el autor concluye
que el método desarrollado fortalece la estabilidad de las estimaciones en los casos
que existe carencia de información [5]. El proceso incorpora la opinión de los expertos
en un marco bayesiano con datos de pérdida de niveles inferiores y superiores. La
aplicación a una compañ́ıa de seguros, es que se pueden explorar productos que
posean un mayor riesgo que el estudiado, aśı como productos con un riesgo menor a
éste. La prima de riesgo deseada se encontraŕıa entre las primas de riesgo calculadas
para estos productos, ya sea de forma general o a nivel de coberturas.
En la metodoloǵıa de este proyecto, se utilizan varios modelos bayesianos para
la frecuencia y severidad basados en varios estudios realizados en los últimos años,
entre los que se puede citar un estudio de estad́ıstica bayesiana y la distribución
Weibull realizado en el año 2016[6], otro realizado en 2017 con aplicación de la
teoŕıa bayesiana y la distribución Exponencial-Gamma [7] y un tercero más reciente
(año 2019) en donde se realiza un análisis bayesiano sobre la distribución lognormal
[8] como los más recientes. En los art́ıculos utilizados como referencia para este
estudio, se introducen modelos con diferentes niveles de jerarqúıas y se obtienen
conclusiones sobre cuales distribuciones previas se pueden implementar en conjunto
con cada distribución teórica de verosimilitud para frecuencia y severidad. Con base
en este marco de referencia se define una serie de modelos que se aplicarán a los
datos y la información obtenida de expertos en el seguro de aviación.
Los resultados obtenidos crean una base estad́ıstica con la cual obtener las primas
de riesgo y comerciales del producto analizado, que es el objetivo del proceso de
tarifación como tal. Existen estudios, que parten de la definición del modelo general
de riesgo colectivo e incorporan principios de estimación de pérdidas esperadas. En
el año 2008 se desarrolló una investigación que resume algunos principios para la
obtención de la prima de riesgo[9]. Todos estos enfoques de estimación sirven de
base para el cálculo de tarifas del producto, y por ende como insumos en los cálculos
de reservas posteriores y determinación de requerimientos de capital de la compañ́ıa
de seguros. Además, conforman una nueva metodoloǵıa de gran valor que servirá de
herramienta para losmprofesionales en actuaŕıa de la unidad de productos (pricing)
del Instituto, principalmente en el proceso de tarifación de la ĺınea de aviación.
5
CAPÍTULO 2
Marco Teórico
2.1. Seguro de Aviación
Las estad́ısticas mundiales señalan que, comparando la cantidad de accidentes
mortales contra la cantidad de viajes realizados, es más seguro viajar en avión que
en automóvil, sin embargo, los aviones no están exentos a una serie de riesgos de la
naturaleza y provocados por humanos, que en la mayoŕıa de ocasiones desencadenan
pérdidas humanas y económicas enormes, una vez que se presenta un evento.
Los seguros de aviación tradicionalmente han utilizado dos clasificaciones de
coberturas de seguro: Casco y responsabilidad civil [10]. En la primera se encuentran
todas aquellas coberturas que aseguran la estructura del avión, en la segunda, se
aborda la responsabilidad que tiene un tomador de la póliza ante las vidas humanas,
las mercanćıas o bienes de terceros que se vean afectados por la actividad comercial
que desempeña con el avión asegurado.
La historia del seguro de aviación se remonta a la primera década del siglo XX.
Existe una cierta controversia sobre cuándo fue suscrita la primera póliza de seguro
de aviación, sin embargo, hay dos detalles importantes como lo son: (1) La industria
de la aviación comercial y la industria de seguros de aviación obviamente están
relacionadas en el sentido de que la primera nunca habŕıa existido sin la segunda.
(2) El mercado de seguros en Londres pronto se convirtió en un centro de seguros
de aviación y es reconocido aśı hasta nuestros d́ıas [10].
La industria de seguros de aviación recibió un gran impulso después de la Se-
gunda Guerra Mundial, cuando los aviones de transporte militar revisados ingresa-
ron al mercado comercial y se formaron operadores de aviones comerciales a gran
escala[10]. Este escenario contribuyó a la mejora de la industria de las aeroĺıneas,
6
2.1. SEGURO DE AVIACIÓN MARCO TEÓRICO
aśı como su tráfico, tamaño y actualización de la flota. Este escenario también pro-
vocó un crecimiento acelerado de la demanda por capacidad de seguro para casco y
responsabilidad civil.
Las coberturas que cubren casco y responsabilidad civil incluyen las espećıficas a
riesgos relacionados con la guerra, inicialmente el mercado no estaba consolidado y
las tarifas para dichas coberturas se determinaban más por efecto oferta-demanda y
no por un análisis particular a la exposición de cada cartera asegurada. La década de
1980 se caracterizó por el desembolso de grandes pagospor parte de las aseguradoras
(debido a una combinación de pérdidas recurrentes de aviones a reacción de fuselaje
ancho y una alta tasa de pérdidas humanas), y fluctuaciones en las tarifas de las
primas que llevaron a aunar esfuerzos para crear compañ́ıas cautivas propias[10].
Los mercados comerciales de este tipo de seguros se ven enriquecidos con la
experiencia de eventos aislados, puesto que en esas situaciones es cuando se logra
medir realmente la suficiencia de primas en un programa de seguros, las provisiones
y las primas que se cobran a cada asegurado.
Después de los ataques terroristas del 11 de septiembre, las aeroĺıneas se vieron
afectadas por una cancelación mundial de coberturas de responsabilidad a terceros
relacionadas al riesgo de guerra, en el mercado comercial y aumentos significativos
en los costos de otros seguros de riesgo de guerra. El gobierno de EE. UU. intervino
y amplió un programa federal de seguros para el riesgo de guerra en aviación, para
garantizar que las compañ́ıas aéreas estadounidenses pudieran recibir una cobertura
de seguro que no era ofrecida en ese momento. El mercado de seguros comercia-
les, desde entonces se ha estabilizado, y varias compañ́ıas aéreas están comprando
nuevamente cobertura de riesgo de guerra de aseguradoras privadas[11].
Nos enfrentamos ante un mundo muy cambiante, por lo que es necesario conside-
rar toda la exposición de riesgo que se presenta en una cartera asegurada y modelar
con base en la historia y análisis profundos de las variables en juego, cuales podŕıan
ser las pérdidas que va a presentar la compañ́ıa de seguros a futuro por la suscripción
de dichos riesgos. En este punto juega un papel importante el reaseguro, mecanismo
mediante el cual las aseguradoras trasladan parte de su riesgo a un tercero con el
fin de diversificar el riesgo.
Los contratos de reaseguro no proporcional surgieron por la necesidad que teńıan
las compañ́ıas de seguros de protegerse frente a las consecuencias de aquellos sinies-
tros cuya cuant́ıa o amplitud podŕıan poner en peligro su capacidad financiera [12].
Para ciertas ĺıneas con posibilidad de siniestros con las caracteŕısticas anteriores, se
puede optar por contratos espećıficos como el exceso de pérdida. En este tipo de
contrato, se paga una prima espećıfica por las capas de protección recibidas, y esto
hace que en la práctica sea responsabilidad de la compañ́ıa aseguradora medir sus
riesgos y tarifar las primas adecuadas para pagar siniestros y los costos de las capas
de reaseguro.
7
2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO
2.2. Modelos para el número de siniestros
A manera de ilustración, se detallan los modelos de frecuencia clásicos, con los
cuales se realiza el ajuste del número de siniestros esperados.
2.2.1. Definición de frecuencia
La frecuencia de siniestros f se mide como el número de reclamaciones del se-
guro que se dan por cada unidad expuesta al riesgo y en un periodo de tiempo
determinado, se puede expresar mediante la fórmula:
f =
N
Unidades Expuestas al Riesgo
A lo largo de esta tesis, se entenderá por N la cantidad de reclamaciones de
un periodo determinado, de acuerdo con la experiencia del Instituto, se trabajan
periodos anuales.
Se detallan los modelos tradicionales y relacionados con estadistica bayesiana
con el fin de dar tratamiento a la variable aleatoria N .
2.2.2. Método tradicional
Se determina el número de siniestros N como un valor único, considerando el
número de observaciones de siniestros ocurridos en un periodo de t años. Se denota
por C la cantidad de siniestros registrados para definir la siguiente fórmula:
N =
C
t
2.2.3. Ajuste de distribución por Máxima Verosimilitud
Para definir el estimador de Máxima Verosimilitud, se considera una base de
datos que consiste en n eventos A1, ..., An donde Aj corresponde al valor de la j −
esima observación. Por ejemplo, Aj puede ser un punto cualquiera o un intervalo.
Se asumen que el evento Aj procede de la observación de la variable aleato-
ria Xj. Las variables aleatorias X1, ..., Xn no necesitan tener la misma función de
8
2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO
probabilidad asociada pero si depender de un mismo vector de parámetros θ.
Bajo el supuesto de que X1, ..., Xn son variables aleatorias independientes, la
función de verosimilitud se define como:
L(θ) =
n∏
j=1
P (Xj ∈ Aj|θ)
El estimador de máxima verosimilitud corresponde al vector θ que maximiza la
función L(θ).
No hay garant́ıa de que la función definida tenga un máximo en su dominio. Es
posible que mientras los parámetros tiendan al valor cero o a infinito, la función de
verosimilitud continúe aumentando. Se debe tener mucho cuidado al maximizar esta
función tomando encuenta los máximos locales que la función pudiese presentar. No
siempre será posible expresar la función L(θ) de forma anaĺıtica, sin embargo existen
métodos numéricos de aproximación incorporados en este marco teórico[13].
Cuando se realizan observaciones de una variable aleatoria se pueden tener mues-
tras censuradas o truncadas según la limitación de información que presente el análi-
sis. Cuando no existe información alguna para un subconjunto de la población total
se habla de una muestra truncada, si para ese subconjunto se redefinen los valores
de las observaciones, se habla de una muestra censurada.
Cuando no existe truncamiento ni censura, y el valor de cada observación se
registra, se puede ver la función de verosimilitud de la siguiente manera:
L(θ) =
n∏
j=1
fXj(xj|θ)
Y su logaritmo como:
l(θ) =
n∑
j=1
ln
[
fXj(xj|θ)
]
2.2.4. Distribución binomial negativa
La función de probabilidad de una distribución binomial negativa está dada
por[13]:
9
2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO
Pr(N = k) = pk =
Γ(k + r)
Γ(r)Γ(k + 1)
(
1
1 + β
)r(
β
1 + β
)k
,
k = 0, 1, 2, ..., r > 0, β > 0.
Sea nk el número de peŕıodos en los cuales la frecuencia es de exactamente k
reclamos. La función logaritmo de la verosimilitud para esta distribución es:
l =
∞∑
k=0
nkln(pk)
=
∞∑
k=0
nk
[
ln
(
Γ(k + r)
Γ(r)Γ(k + 1)
)
− r ln(1 + β) + k ln(β)− k ln(1 + β)
]
Esta función depende de los parámetros r y β, para encontrar el máximo, es
necesario recurrir a las derivadas parciales e igualarlas a cero, para obtener las
soluciones de los parámetros. La derivada parcial respecto a β es:
∂l
∂β
=
∞∑
k=0
nk
(
k
β
−
r + k
1 + β
)
Por su parte, la derivada parcial respecto a r es:
∂l
∂r
= −
∞∑
k=0
nk ln(1 + β) +
∞∑
k=0
nk
∂
∂r
ln
(r + k − 1) · · · r
k!
= −n ln(1 + β) +
∞∑
k=0
nk
∂
∂r
ln
k−1∏
m=0
(r +m)
= −n ln(1 + β) +
∞∑
k=0
nk
∂
∂r
k−1∑
m=0
ln(r +m)
= −n ln(1 + β) +
∞∑
k=0
nk
k−1∑
m=0
1
r +m
10
2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO
Si se igualan estas ecuaciones a cero, se obtiene lo siguiente:
µ̂ = r̂β̂ =
∑∞
k=0 k nk
n
= x
Además:
n ln(1 + β̂) =
∞∑
k=1
nk
(
k−1∑
m=0
1
r̂ +m
)
Se observa que el estimador de máxima verosimilitud para la media es el promedio
muestral. Ambas ecuaciones se pueden resolver de forma numérica. Si se reemplaza
β̂ por µ̂/r̂ se obtiene la ecuación:
H(r̂) = n ln
(
1 +
x
r̂
)
−
∞∑
k=1
nk
(
k−1∑
m=0
1
r̂ +m
)
= 0
La función H(r̂)se puede maximizar numéricamente, utilizando para r̂ el método de
Newton-Raphson. La ecuación requerida para la k − esima interación es:
rk = rk−1 −
J(rk−1)
H ′(rk − 1)
2.2.5. Distribución Poisson
La forma de la función de probabilidad de una distribución Poisson es[13]:
pk =
e−λλk
k!
k = 0, 1, 2, ...
Sea N una variable aleatoria con distribución Poisson de parámetro λ, se cumple
lo siguiente:
E(N) = V ar(N) = λ
Sean N1, N2, ..., Nn variables aleatorias independientes con distribución Poisson
de parámetros λ1, λ2, ..., λn, para determinar la distribución asociada a la suma de
las variables anteriores, se calcula lo siguiente:
11
2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCOTEÓRICO
PN(z) =
n∏
j=1
PNj(z)
=
n∏
j=1
exp[λj(z − 1)]
= exp
[
n∑
j=1
λj(z − 1)
]
= eλ(z−1)
Se concluye entonces que la suma de dichas variables aleatorias Poisson tiene distri-
bución Poisson con parámetro λ1 + λ2 + ...+ λn.
Utilizando la notación de la sección anterior, se tiene la siguiente forma para la
verosimilitud del conjunto de observaciones completas:
L =
∞∏
K=0
pnkk
La función logaritmo respectiva se obtiene por:
l =
∞∑
k=0
nk ln(pk)
Dado que la distribución Poisson sólo tiene un parámetro, la busqueda del
parámetro óptimo se vuelve más sencilla.
La función logaritmo de la verosimilitud es la siguiente:
l =
∞∑
k=0
nk(−λ+ k ln(λ)− ln(k!))
= −λn+
∞∑
k=0
k nk ln(λ)−
∞∑
k=0
nk ln(k!)
Se deriva la expresión anterior y se iguala a cero para obtener el óptimo:
12
2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO
∂l
∂d
= −n+
∞∑
k=0
k nk
1
λ
λ̂ =
∑∞
k=0 k nk
n
= x
2.2.6. Regresión Binomial Negativa Inflada con Ceros
Cuando se cuenta con poca información estad́ıstica sobre siniestros pagados du-
rante un peŕıodo, es posible que en algunos registros mensuales no se visualicen casos,
ocasionando que la variable se distribuya de forma binomial negativa salvo por la
frecuencia que se presenta para el valor cero, que está por encima de la frecuencia
de acuerdo con la distribución ajustada.
Para cada observación se consideran 2 casos, si el caso 1 ocurre, con certeza
el conteo es cero. Si el caso dos sucede, el conteo está dado por una distribución
binomial negativa con los parámetros respectivos. Se expresa esta distribución de la
siguiente manera[14]:
Pr(yi = j) =
{
πi + (1− πi)g(yi = 0) si j = 0
(1− πi)g(yi) si j > 0
Donde πi es la función loǵıstica relacionada definida abajo y g(yi) es la distribución
binomial negativa dada por:
g(yi) = Pr(Y = yi|r, βi) =
Γ(yi + r)
Γ(r)Γ(yi + 1)
(
1
1 + βi
)r(
βi
1 + βi
)yi
En donde βi =
µi
r
.
El componente negativo binomial puede incluir un tiempo de exposición t y un
conjunto de k variables regresoras, la expresión relacionada es:
µi = exp(ln(ti) + αix1t + α2x2t + · · ·+ αkxkt)
La función loǵıstica relacionada se determina por:
πi =
λi
1 + λi
13
2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO
Donde:
λi = exp(ln(ti) + γ1z1i + γ2z2i + · · ·+ γmzmt)
El componente loǵıstico contiene una tiempo de exposición t y un conjunto de
m variables regresoras (z′s). Note que los z′s y los x′s pueden o no tener términos
en común.
El logaritmo de la función de verosimilitud está dada por:
l = l1 + l2 + l3
Donde:
l1 =
∑
{i:yi=0} ln
[
λi + (1 + βi)
−r]
l2 =
∑
{i:yi>0}
(
−ln(yi!)−(yi+r)ln(1+βi)−yiln(r)+yiln(rβi)−
∑yi−1
j=0 ln(j+r)
)
l3 =
∑n
i=1 ln(1 + λi)
El gradiente de l es:
∂l
∂αj
=
∑
{i:yi=0}
[ − rβi(1 + βi)−1−r
λi + (1 + βi)−r
]
xij +
∑
{i:yi>0}
[yi − βi
1 + βi
]
xij j = 1, 2, ..., k
∂l
∂γj
=
∑
{i:yi=0}
[ λi
λi + (1 + βi)−r
]
zij −
∑n
i=1
[ λi
1 + λi
]
zij j = 1, 2, ...,m
∂l
∂r
=
∑
{i:yi=0}
[βi − (1 + βi)ln(1 + βi)
(1 + βi)[λi(1βi)−r + 1]
]
zij −
∑
{t:yi>0}
{
ln(1 + βi) +
yi − rβ
r(1 + β)
−
∑yi−1
j=0
1
j + r
}
Las segundas derivadas son:
∂2l
∂αj∂βh
=
∑
{i:yi=0}
xijxihrβi[(rβi − 1)λi(1 + βi)r − 1]
(1 + βi)2[λi(1 + βi)r + 1]2
−
∑
{i:yi>0}
rβi(1 + βi)xijxih
(1 + βi)2
, i, h = 1, 2, ..., k
14
2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO
∂2l
∂γj∂γh
=
∑
{i:yi=0}
zijzihλi(1 + βi)
r
[λi(1 + βi)r + 1]2
−
∑n
i=1
zijzihλi
(1 + λi)2
, i, h = 1, 2, ...,m
∂2l
∂αj∂γh
=
∑
{i:yi=0}
xijzisrβiλi(1+βi)
r−1
[λi(1+βi)r−1+1]
j = 1, 2, ..., k; h = 1, 2, ...,m
∂2l
∂βj∂r
=
∑
{i:yi=0}
xijrβiλi(1 + βi)
1+rln(1 + βi)
(1 + βi)2
[
λi(1 + βi)r + 1
]2
−
∑
{i:yi=0}
xijrβ
2
i
r
[λi
r
(1 + βi)
r + λi(1 + βi)
r +
1
r
]
(1 + βi)2
[
λi(1 + βi)r + 1
]2
+
∑
i:y>0
xijrβi(rβi − yi)
r2(1 + βi)2
j = 1, 2, ..., k
∂2l
∂γh∂r
=
∑
{i:yi=0}
zihλi(1 + βi)
r−1[(1 + βi)ln(1 + βi)− βi][
λi(1 + βi)r + 1
] h = 1, 2, ...,m
∂2l
∂r2
=
∑
{i:yi=0}
F1 + F2 − F3
F4
+
∑
{i;yi>0}(F5 + F6)
Donde:
F1 = r
−1βi{2λi(1 + βi)r + r−1βiλi(1 + βi)r + 3βi[λi(1 + βi)r + 1] + 2}
F2 = r
2λi(1 + βi)
2+rln2(1 + βi)
F3 = 2r(1 + βi)ln(1 + βi){λi(1 + βi)r + r−1βiλi(1 + βi)r + βi[λi(1 + βi)r + 1] + 1}
F4 = (1 + βi)
2[λi(1 + βi)
r + 1]2
F5 =
r−2[2(r − yi)βi + 3rβ2i − yi]− 2(1 + βi)2ln(1 + βi)
(1 + βi)2
F6 =
∑y1−1
j=0
2rj + r2
(j + r)2
Los estimadores de máxima verosimilitud presentan una distribución asintótica
es una normal multivariada[14], como se oberva en la siguiente expresión:
15
2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO
β̂γ̂
r̂
 = N
βγ
r


−
∂2l
∂βj∂βh
−
∂2l
∂βj∂γh
−
∂2l
∂βj∂r
−
∂2l
∂βj∂γh
−
∂2l
∂γj∂γh
−
∂2l
∂γj∂r
−
∂2l
∂βj∂r
−
∂2l
∂γj∂r
−
∂2l
∂r2

−1
2.2.7. Regresión Poisson Inflada con Ceros
En este modelo de regresión, el vector de respuestas Y = (Y1, ..., Yn)
′ contiene
variables independientes y se cumple lo siguiente:
Yi ∼ 0 con probabilidad pi
Yi ∼ Poisson(λi) con probabilidad 1− pi
De esta manera:
Pr(Yi = j) =
 pi + (1− pi)e
−λi si j = 0
(1− pi)e−λi
λki
k!
si j > 0
Los parámetros λ = (λ1, ..., λn)
′ y p = (p1, ..., pn)
′ satisfacen:
log(λ) = Bβ
log(p′(1− p)) = Gγ
Para matrices covariadas B y G, y β el vector de coeficientes.
El número de parámetros por ser estimados dependerá del número de covariables
presentes en el modelo. Si existen pocos conteos y λ y p no están relacionadas,
entonces sólo se pueden considerar modelos simples para la variable λ[15].
Cuando λ y p no están relacionados por ninguna función, la función de verosi-
militud con la parametrización estándar resulta en:
16
2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO
l(γ, β; y) =
∑
yi=0
ln(eGiy + exp(−eBiβ))
+
∑
yi>0
(yiBiβ − eBiβ)
−
∑n
i=1 ln(1 + e
Giγ)
−
∑
yi>0
ln(yi!)
Los términos Gi y Bi corresponden a las i-ésimas filas de las matrices G y B
respectivamente.
La suma de exponenciales en el primer término complica la maximización de
l(γ, β; y)[15]. Se supone que se conoce la cantidad de ceros que proviene del estado
perfecto y de la distribución Poisson por separado. Se observa Zi = 1 cuando Yi
proviene del estado perfecto de ceros y Zi = 0 cuando Yi proviene de la distribución
Poisson.
La función de máxima verosimilitud con la información completa es:
lc(γ, β; y, z) =
n∑
i=1
ln(f(zi|γ))
+
n∑
i=1
ln(f(yi|zi, β))
lc(γ, β; y, z) =
n∑
i=1
(ziGiγ − ln(1 + eGiγ))
+
n∑
i=1
(1− zi)(yiBiβ − eBiβ)
−
n∑
i=1
(1− zi)ln(yi!)
lc(γ, β; y, z) = lc(γ; y, z) + lc(β, y, z)
−
n∑
i=1
(1− zi)ln(yi!)
Esta última expresión es más fácil de maximizar, dado que sus términos se pueden
maximizar por separado.
17
2.3. MODELOS PARA LA SEVERIDAD MARCO TEÓRICO
2.3. Modelos para la severidad
En esta sección nos interesa conocer la distribución del monto de pérdida liga-
do a la ocurrencia de un siniestro, es decir, la pérdida económica que presentó la
Compañ́ıa ante un evento siniestral amparado por la póliza del producto en estu-
dio. Estos valores son positivos y tiende a existir una acumulación de siniestros con
un promedio determinado y casos puntuales de siniestros que generan montos de
pago bastante elevados, alcanzando inclusive un monto cercano o igual a la suma
asegurada para cada aeronave. Existe una relación directa entre el monto asegurado
y el monto de la reclamación, ante la ocurrencia de un siniestro se estima un daño
directo parcial de la aeronave para la cual se definió, en la emisión de la póliza, un
valor monetario estimado sobre el cual se ajustaŕıan las pérdidas a futuro.
A menudo es deseable encontrar una expresión anaĺıtica expĺıcita para una dis-
tribución de pérdidas, más cuando las estad́ısticas con las que se cuenta son de-
masiado escasas como para utilizar la distribución emṕırica como primera opción
de ajuste[16]. Cabe destacar que no siempre es adecuado utilizar distribuciones de
pérdida teóricas debido a su naturaleza fuertemente sesgada, sin embargo cuando setrata de este análisis, existen distribuciones candidatas como la log-normal, exponen-
cial, Pareto, Burr, Weibull y gamma, que son candidatos t́ıpicos para distribuciones
de severidad de las pérdidas.
2.3.1. Distribución Emṕırica
Una estimación natural para ajustar la distribución de las pérdidas por siniestros
es la distribución de severidad emṕırica (observada), para un conjunto de observa-
ciones xi, ..., xn dicha distribución es definida por[16]:
Fn(x) =
1
n
#{i : xi ≤ x}
Esto es la función constante a trozos con saltos de tamaño 1/n en los puntos xi.
Cuando se tiene un gran cantidad de datos, se puede aproximar con alguna función
continua, en donde los puntos de saltos se ven conectados por funciones lineales.
La aplicación de la distribución emṕırica resulta adecuada cuando existe una can-
tidad suficientemente grande de observaciones de montos de siniestros. Casi nunca
se puede aplican en la cola de una distribución, especialmente en caso con posibi-
lidad de grandes pérdidas como es el caso de estudio para Aviación. Una forma de
trabajar estos casos es ajustar la distribución emṕırica hasta un ĺımite definido, y
los montos de gran tamaño ajustarlos con alguna función análitica conocida para
colas pesadas.
18
2.3. MODELOS PARA LA SEVERIDAD MARCO TEÓRICO
2.3.2. Distribución Log-normal
Se considera una variable aleatoria X que presenta una distribución normal con
densidad definida por:
fX(x) =
1
σ
√
2π
exp
{
−
(x− µ)2
2σ2
}
, −∞ < x <∞
Sea Y = eX tal que X = log(Y ), la función de densidad de la probabilidad
llamada log-normal y está dada por:
fY (y) = fX(log(y))
1
y
=
1
yσ
√
2π
exp
{
−
(log(y)− µ)2
2σ2
}
, y > 0
Para esta variable aleatoria se tiene los siguientes resultados:
E(Y ) = exp
(
µ+
σ2
2
)
V ar(Y ) = {exp(σ2)− 1}exp(2µ+ σ2)
Utilizando la metodoloǵıa definida en apartados anteriores, se obtiene la función
de verosimilitud asociada, con los siguientes estimadores respectivos:
µ̂ =
1
n
n∑
i=1
log(yi)
σ̂2 =
1
n
n∑
i=1
{log(yi)− µ̂}2
La distribución log-normal es muy útil en este tipo de modelación, debido a que es
una distribución sesgada por la derecha, tiene una cola gruesa y se ajusta bien en la
mayoŕıa de ocasiones. Además, es infinitamente divisible y cerrada bajo transforma-
ciones de escala y exponencial. Sin embargo, también sufre algunos inconvenientes,
en particular, que la transformación de Laplace no tiene una representación de forma
cerrada y la función generadora de momentos no existe [16].
19
2.3. MODELOS PARA LA SEVERIDAD MARCO TEÓRICO
2.3.3. Distribución Exponencial
Se considera una variable aleatoria con la siguientes funciones de densidad y
distribución, respectivamente:
f(x) = βe−βx, x > 0
F (x) = 1− e−βx, x > 0
Dicha distribución se conoce como Exponencial de parámetros (intensidad) β > 0,
realizando los cálculos respectivos, se tiene que la distribución posee media β−1 y
varianza β−2. El estimador de máxima verosimilitud asociado resulta en:
β̂ =
n∑n
i=1 xi
La distribución exponencial a menudo se utiliza en la modelación de riesgos de
seguros, debido a sus muchas y variadas propiedades matemáticas de fácil mane-
jo. Sin embargo, una desventaja de la distribución exponencial es que su densidad
disminuye monótonamente, una situación que puede no ser apropiada en algunas
situaciones prácticas [16].
2.3.4. Distribución Pareto
Se supone que una variable aleatoria X tiene una distribución exponencial con
media β−1, condicionada sobre β. Por su parte el parámetro β tiene por śı misma
una distribución Gamma (ver apartado 2.3.6). La distribución no condicional de X
es una mezcla y se le conoce como distribución Pareto. Se puede mostrar que si X
es una variable aleatoria exponencial y Y una variable aleatoria gamma, entonces
la variable X/Y tiene distribución Pareto [16].
La función de densidad y de distribución de una Pareto están dadas por:
f(x) =
αλα
(λ+ x)α+1
, x > 0
F (x) = 1−
(
λ
λ+ x
)α
, x > 0
20
2.3. MODELOS PARA LA SEVERIDAD MARCO TEÓRICO
La esperanza y varianza de dicha distribución, respectivamente, resultan en:
E(X) =
λ
α− 1
,
V ar(X) =
αλ2
(α− 1)2(α− 2)
Para esta distribución no existe una forma cerrada para expresar los estimadores
de máxima verosimilitud asociados, y solamente pueden ser evaluados de forma
numérica.
La ley de Pareto es muy útil para modelar la severidad de reclamos en segu-
ros, debido en gran parte a su cola extremadamente pesada, comparada con las
otras distribucines de esta sección. Su principal inconveniente radica en su falta
de trazabilidad matemática en algunas situaciones. Al igual que para la distribu-
ción log-normal, la transformación de Laplace no tiene una representación de forma
cerrada y la función generadora de momentos no existe. Además, al igual que la
exponencial, su densidad disminuye monótonamente, lo que puede no ser adecuado
en algunas situaciones prácticas [16].
2.3.5. Distribución Burr
La experiencia ha demostrado que la fórmula de la distribución Pareto es a me-
nudo apropiada para modelar la severidad de siniestros, particularmente cuando se
prevé que siniestros con una afectación económica grande puedan ocurrir. En al-
gunas ocasiones existe la necesidad de encontrar una distribución de cola pesada
con mayor flexibilidad que la de la ley de Pareto, incluyendo una función de densi-
dad no monótona[16]. Esa flexibilidad ya viene dada por la distribución Burr y su
parámetro adicional r > 0. Si Y sigue una distribución Pareto entonces la función
de distribución de X = Y 1/r se conoce como una distribución Burr.
Las funciones de densidad y de distribución respectivas son:
f(x) = rαλα
xr−1
(λ+ xr)α+1
, x > 0
F (x) = 1−
(
λ
λ+ xr
)α
, x > 0
21
2.3. MODELOS PARA LA SEVERIDAD MARCO TEÓRICO
Los estimadores de máxima verosimilitud sólo pueden ser evaluados de forma
numérica. Una variable Burr se puede generar usando el método de transformación
inversa. La función de distribución acumulada inversa tiene una forma anaĺıtica
F−1(x) =
[
λ{(1 − x)−1/α − 1}
]1/r.
. Se puede entonces establecer X =
{
λ(U−1/α −
1)
}1/r
, donde U sigue una distribución uniforme estándar[16].
Para esta distribución existe la media, pero la cola derecha es demasiado pesada,
la media muestral estará casi siempre por debajo de E(X).
2.3.6. Distribución Weibull
Si V es una variable aleatoria con distribución exponencial, la distribución de la
variable X = V 1/τ , τ > 0 se le conoce como distribución Weibull (o Frechet). Las
funciones de densidad y de distribución respectivas son:
f(x) = τβxτ−1e−βx
τ
, x > 0
F (x) = 1− e−βxτ , x > 0
El estimador de máxima verosimilitud sólo se puede evaluar de forma numérica
y al igual que la distribución Burr, se pueden generar observaciones de la variable
utilizando el método de la transformación inversa [16].
2.3.7. Distribución Gamma
Se tiene una distribución aleatoria X, con distribución gamma (o Pearson tipo
III) cuyas funciones de densidad y distribución respectivas son:
f(x) = β(βx)α−1
e−βx
Γ(α)
, x > 0
F (x) =
∫ x
0
β(βs)α−1
e−βs
Γ(α)
ds
Para β = 1, se conoce como función gamma incompleta, la integral a continuación:
Γ(α, x) =
1
Γ(α)
∫ x
0
sα−1e−sds
Si el parámetro α = 1 resulta en una distribución exponencial. Si α > 0, la dis-
tribución se cataloga como ley de Erlang. Si β = 1/2 y α = v/2 se habla de una
distribución chi-cuadrada (χ2) con v grados de libertad [16].
22
2.4. MODELO DE RIESGO COLECTIVO MARCO TEÓRICO
La media y la varianza resultan en:
E(X) =
α
β
V ar(X) =
α
β2
Sus estimadores de máxima verosimilitud sólo pueden evaluarse bajo métodos
numéricos. La distribución gamma es una de las más importantes para modelaciones
debido a sus propiedades matemáticas de fácil manejo. Es una distribución que se
utiliza bastante para formar otras distribuciones, sin embargo por śı sola no es una
fórmula razonable para modelar la severidad de reclamos[16].2.4. Modelo de Riesgo Colectivo
El modelo de riesgo colectivo es bien conocido en al área de las ciencias actua-
riales y se utiliza para ajustar la frecuencia y la severidad de forma independiente
y posteriormente obtener las pérdidas totales bajo un modelo agregado. Para este
modelo se considera un portafolio de pólizas de un mismo tipo.
Se denota por N el número total de reclamos que pueden generarse de un de-
terminado riesgo en un cierto peŕıodo de tiempo, y Zj, denota el monto de pérdida
producto de la ocurrencia del j-ésimo evento[?]. El monto de pérdida total bajo el
modelo agregado está dada por:
X =
N∑
j=1
Zj
Siendo X = 0 cuando N = 0. Los dos principales supuestos que se emplean en
este modelo son:
1. Los montos de pérdida Zj’s son variables aleatorias positivas independientes e
idénticamente distribuidas.
2. El número total de reclamos del peŕıodo es una variable aleatoria y es inde-
pendiente de los montos de las pérdidas Zj’s.
23
2.5. CONTEXTO BAYESIANO MARCO TEÓRICO
Bajo los supuestos definidos, la esperanza y la varianza del modelo agregado se
pueden descomponer en términos de las esperanzas y varianzas de los modelos indi-
viduales de frecuencia y severidad:
E(X) = E(E[X|N ]) = E(N)E(Z)
V ar(X) = E(V [X|N ]) + V (E[X|N ]) = E(N)V (Z) + [E(Z)]2V (N)
2.5. Contexto Bayesiano
El objetivo de este estudio, es utilizar la teoŕıa bayesiana con el fin de que, a
partir de la experiencia y supuestos sobre los parámetros involucrados, se puedan
desarrollar modelos que logren ajustar la natulareza de los datos con el panorama
que se cree que va a seguir la misma. Este análisis no comprende la forma tradi-
cional de ajustar una distribución de manera directa y tomarla como cierta para la
información.
La idea básica de las técnicas bayesianas, es que los parámetros desconocidos, de
las distribuciones involucradas en el modelo de ajuste, sean tratados como variables
aleatorias[5]. Una distribución de probabilidad provee la verosimilitud de que varios
posibles valores de dichos parámetros sean tomados como ciertos.
2.5.1. Modelo inicial
En el paradigma bayesiano, el interés es modelar tanto la distribución de los
datos X, aśı como la del parámetro desconocido θ, pues ambos se consideran como
variables aleatorias[17].
Supongamos que π(θ) contiene la información sobre el parámetro θ. Suponga que
tenemos un vector de n observaciones x̂ = (x1, x2, · · · , xn)T .
La verosimilitud se denota como f(x̂|θ) y describe la probabilidad de obtener
los valores de x̂ dado que θ es el parámetro verdadero. Por el teorema de Bayes, la
distribución posterior de θ es:
π(θ|x̂) = f(x̂|θ)π(θ)
f(x̂)
24
2.5. CONTEXTO BAYESIANO MARCO TEÓRICO
Donde π(θ) es la distribución previa y π(θ|x̂) es la distribución posterior del paráme-
tro θ
Observe que la distribución de θ se actualiza con la información que se va obte-
niendo según los datos que se recolectan, y tal proceso se ve reflejado en la distri-
bución posterior del parámetro.
Como f(x̂) no depende de θ, es suficiente considerar la forma funcional de:
π(θ|x̂) ∝ f(x̂|θ)π(θ)
Una vez con la distribución posterior, es posible hacer inferencia puntual sobre el
parámetro mediante alguna medida de tendencia central como la media o la moda,
o bien considerar intervalos de confianza.
Mediante la distribución previa π(θ) se pretende capturar el criterio experto y el
conocimiento previo que tenga la compañ́ıa aseguradora respecto al riesgo a tarifar.
Este proceso de actualización de la información por el método de Bayes se puede
repetir de manera continua, en cuyo caso la distribución posterior se convierte en la
distribución previa del nuevo modelo[5].
2.5.2. Modelo Jerárquico
Al modelo general detallado anteriormente, se le puede añadir un nivel interno de
análisis, produciendo lo que se conoce como un modelo jerárquico, una vez definida
la distribución previa del modelo básico, a los parámetros de dicha distribución se
les aplica el mismo procedimiento para conocer una previa nuevamente. Se detalla
la teoŕıa para el modelo de no regresión que comprende este estudio.
Se puede partir del modelo base[18]:
p(θ|datos) ∝ p(datos|θ)× p(θ)
La ecuación por śı misma revela una estructura jerárquica simple en los parámetros,
dado que indica que la distribución posterior para un parámetro es igual a una
probabilidad condicional de los datos bajo un parámetro (primer nivel) multiplicado
por la probabilidad marginal (previa) del parámetro (segundo nivel).
La estructura jerárquica definida para los parámetros no necesariamente debe
detenerse en ese modelo, sino que podŕıa continuar hasta niveles infinitos. Se supone
en este caso, que se tiene un modelo con una estructura jerárquica adicionando un
25
2.6. MODELOS COMPUESTOS PARA LA FRECUENCIA MARCO TEÓRICO
nivel superior. Se tienen J observaciones y1, ..., yJ y se asume que los datos están
distribuidos de acuerdo con una distribución Q con parámetro θ. Entonces:
yi ∼ Q(θ)
Se asume que los parámetros θ siguen una distribución común W con parámetro
γ (hiperparámetro), es decir:
θ ∼ W (γ)
La distribución posterior de todos los parámetros sigue la siguiente fórmula:
p(γ, θ|y) ∝ p(y|θ, γ)p(θ|γ)p(γ)
Para entender como trabaja esta estructura jerárquica, se nota que los últimos
dos términos [p(θ|γ)p(γ)], al multiplicarse, resultan en una distribución conjunta
para γ y θ: [p(θ, γ)]. Nos queda entonces una distribución marginal conjunta para
los dos parámetros, la cual se multiplica por la densidad de muestreo para los da-
tos [p(y|θ, γ)]. El teorema de Bayes indica que al multiplicar la densidad marginal
conjunta de los parámetros (θ) por la densidad de muestreo de los datos dados los
parámetros, se obtiene la densidad posterior de todos los parámetros[18].
La distribución marginal de γ, sobre la cual se enfoca este modelo, resulta en:
p(γ|y) ∝
∫
p(y|θ, γ)p(θ, γ)p(γ)dθ
La integral anterior se estima normalmente implementando los métodos MonteCarlo
(MCMC), los cuales son descritos más adelante.
2.6. Modelos compuestos para la frecuencia
En esta sección se documentan los modelos de distribución que se utilizarán
para ajustar la frecuencia de siniestros, aśı como los parámetros que deberán ser
analizados para incorporar el criterio experto en el desarrollo de la metodoloǵıa.
26
2.6. MODELOS COMPUESTOS PARA LA FRECUENCIA MARCO TEÓRICO
2.6.1. Distribución Binomial Negativa con parámetro r co-
nocido
Se define la distribución binomial negativa bajo los parámetros r y p =
β
1 + β
,
como sigue:
Pr(N = k) = pk =
Γ(k + r)
Γ(r)Γ(k + 1)
(
1
1 + β
)r(
β
1 + β
)k
,
= pk =
Γ(k + r)
Γ(r)Γ(k + 1)
(1− p)rpk,
Asumiento que se tiene un valor definido para r se procede a establecer como
previa para el parámetro p una distribución Beta con parámetros b y c, es decir:
f(p) =
pb−1(1− p)c−1
B(b, c)
, 0 < p < 1
Donde, B(α, β) =
∫ 1
0
xα−1(1− x)β−1dx =
Γ(α)Γ(β)
Γ(α + β)
es la función beta[19].
Para derivar la distribución posterior de p, se debe calcular primero la distribu-
ción conjunta de p y la muestra observada[19]. Entonces:
P (k1, ..., kT , p) =
T∏
i=1
Γ(ki + r)
Γ(ki + 1)Γr
pr(1− p)ni
=
pTr(1− p)
∑
ki
Γ(r)T
T∏
i=1
Γ(ki + r)
Γ(ki + 1)
Donde T es el número de peŕıodos de pérdida registrados en la muestra. Se multiplica
lo anterior por la distribución previa para p, y se obtiene la distribución conjunta
de la muestra observada y P :
P (k1, ..., kT , p) =
prT+b−1(1− p)
∑
ki+c−1
B(b, c)Γ(r)T
T∏
i=1
Γ(ki + r)
Γ(ki + 1)
27
2.6. MODELOS COMPUESTOS PARA LA FRECUENCIA MARCO TEÓRICO
La distribución de probabilidad para la muestra observada se obtiene integrando
el resultado anterior sobre el intervalo 0 < p < 1. Cuando la distribución conjunta
de las observaciones de la muestra y p se divide por la distribución marginal de la
muestra, se obtiene la distribución condicional de p dada la muestra observada[19].
Para este modelo se obtiene la siguiente distribución,que corresponde a la defi-
nida para una distribución posterior beta:
f(p|ki, ..., kT ) =
prT+b−1(1− p)
∑
ki+c−1∫ 1
0
prT+b−1(1− p)
∑
ki+c−1dp
=
prT+b−1(1− p)
∑
ki+c−1
B(rT + b,
∑
ki + c)
El estimador de Bayes para p es la media de la distribución posterior:
E(p|k1, ..., kT ) =
∫ 1
0
prT+b(1− p)
∑
ki+c−1dp
B(rT + b,
∑
ki + c)
=
B(rt+ b+ 1,
∑
ki + c)
B(rT + b.
∑
ki + c)
=
rT + b
rT + b+ c+
∑
ki
2.6.2. Binomial Negativa con ambos parámetros desconoci-
dos
La utilización de este modelo supone la obtención de las expresiones para E(rm|x)
y E(βm|x) bajo formas cerradas, lo cual es algo poco estudiado respecto a los paráme-
tros de la distribución binomial negativa.
Se considera una previa para el parámero β que cumpla lo siguiente:
p(β|δ1, δ2) ∝
(
β
β + 1
)δ1−1(
1
β + 1
)δ2−1
Si se toma la expresión 1/B(δi, δ2), se está ante una previa con distribución Beta
Prima[20]:
28
2.6. MODELOS COMPUESTOS PARA LA FRECUENCIA MARCO TEÓRICO
p(β|δ1, δ2) =
1
B(δi, δ2)
(
β
β + 1
)δ1−1(
1
β + 1
)δ2−1
, δ1, δ2 > 0
La media y la varianza de esta distribución son:
E(β) =
δ1
δ2 − 1
V ar(β) =
δ1(δ1 + δ2 − 1)
(δ2 − 1)2(δ2 − 2)
Se considera una previa para el parámetro r con la forma:
p(r|a, b, z1, z2) ∝
(r − z1)a
r − z2
b
La constante de proporcionalidad se toma como L1 =
Γ(b)(z1 − z2)b−a−1
Γ(b− a− 1)Γ(a+ 1)
, para
obtener una distribución previa Pearson 6[20]:
p(r|a, b, z1, z2) = L1
(r − z1)a
(r − z2)b
, b > a > 1, y r ≥ z1 ≥ z2
La media y la varianza de esta distribución son:
E(r) = z1 +
(z1 − z2)(a+ 1)
b− a− 2
V ar(r) =
(z1 − z2)2(a+ 1)(b− 1)
(b− a− 2)2(b− a− 3)
Definiendo por C1 =
∑n
i=1 xi + δ2 + 1, K1 = (δ1 + C1)/n y los coeficientes
polimoniales U1, ..., Um de la aproximación a la expresión del enésimo momento de
la posterior para r, se tiene:
E(rm|x) ≈
∑h
j=0 ajQj+m∑h
j=0 ajQj
29
2.6. MODELOS COMPUESTOS PARA LA FRECUENCIA MARCO TEÓRICO
Donde:
Qj =
f∑
l=0
Γ(C1 − j + l − 2)Γ(j + 1)Ul
Γ(C1 + l − 1)KC1−j+l−2)1 nl
Se tiene también que:
E(βm|x) ≈
nm∏m
l=1(Cl − l − 1)
∑h
j=0 ajR
m
j∑h
j=0 ajQj
Rmj =
f∑
l=0
Γ(C1 + l − j −m− 2)Γ(j + 1)V ml
Γ(C1 + l − k − 1)KC1+l−j−m−21 nl
Donde V k0 = 1 y V
m
1 , ..., V
m
f es un conjunto separado de coeficientes polinomiales
para cada uno de los k momentos de la distribución posterior de β.
Dado que la distribución del parámetro β toma una forma definida (no estándar)
se decide tomar la distribución de la sección anterior para el parámetro p =
1
1 + β
para temas de programación.
2.6.3. Distribución Poisson con previa Gamma
Con este modelo, se supone una distribución Gamma para el parámetro λ, es
decir:
p(λ|α, β) = β(βλ)α−1
e−βλ
Γ(α)
Realizando algunos cálculos, bajo el teorema de Bayes, se obtiene lo siguiente
para la distribución posterior:
p(λ|α, β, k) ∝
n∏
i=1
e−λλki
ki!
β(βλ)α−1
e−βλ
Γ(α)
Luego:
30
2.7. MODELOS COMPUESTOS PARA LA SEVERIDAD MARCO TEÓRICO
p(λ|α, β, k) ∝ λ
∑
ki+α−1e−(β+n)λ
Excepto por el factor proporcional, la distribución anterior es una Gamma con
parámetros α +
∑
ki y β + n.
2.7. Modelos compuestos para la severidad
En esta sección se documentan los modelos de distribución que se utilizarán para
ajustar la severidad de siniestros, aśı como los parámetros que deberán ser analizados
para incorporar el criterio experto en el desarrollo de la metodoloǵıa.
2.7.1. Lognormal con ambos parámetros desconocidos
Se parte de la definición que tenemos para la distribución lognormal con paráme-
tros µ y σ, como sigue:
fX(x) =
1
σ
√
2π
exp
{
−
(x− µ)2
2σ2
}
, −∞ < x <∞
Para este análisis consideremos una reparametrización de la distribución log-
normal, se define τ = σ2, donde σ es la desviación estándar en la parametrización
tradicional. Se tiene entonces una distribución lognormal LN(µ, τ), donde:
fX(x) =
1
√
2πτ
exp
{
−
(x− µ)2
2τ
}
, −∞ < x <∞
Se define una previa condicional bivariada para (µ, τ) como sigue[8]:
πln(µ, τ) = π(τ)π(µ|τ)
Donde π(τ) y π(µ/τ), son respectivamente, distribuciones denotadas por InvG(p, q/2)
y N(a, τ/b).
La densidad posterior para este caso resulta en:
πln ∝ A ·B · C
31
2.7. MODELOS COMPUESTOS PARA LA SEVERIDAD MARCO TEÓRICO
Donde:
A = InvGτ
(
m
2
+ p,
1
2
{
m∑
i=1
(ln(xi))
2 + a2b+ q −
(
∑m
i=1 ln(xi) + ab)
2
m+ b
})
B = Nµ|τ
(∑m
i=1 ln(xi) + ab
m+ b
,
τ
m+ b
)
C =
m∏
i=1
[
1− Φ
(
ln(xi)− µ√
τ
)]n
2.7.2. Exponencial con previa Gamma
Se parte de la distribución exponencial (con parámetro lambda):
f(x) = λe−λx, x > 0
Para la cual se supone una distribución Gamma para el parámetro λ, es decir:
f(λ|α, β, ) = β(βλ)α−1
e−βλ
Γ(α)
, λ > 0
La distribución posterior se puede ver como una función condicional sobre los
datos x:
p(λ|x) ∝
( βα
Γ(α)
λα−1e−βλ
)
(λne−λ
∑n
i=1 xi)
Realizando algunos cálculos se tiene:
p(λ|x) ∝ λn+α−1e−λ(
∑n
i=1 xi+β)
Del resultado anterior se concluye que la distribución posterior se puede expresar
como una distribución Gamma(n+ α,
∑n
i=1 +β)[7].
32
2.7. MODELOS COMPUESTOS PARA LA SEVERIDAD MARCO TEÓRICO
2.7.3. Pareto con ambos parámetros desconocidos
Se parte de la definición de la distribución Pareto realizada anteriormente, donde:
f(x) =
αλα
(λ+ x)α+1
, x > 0
Se realiza la siguiente reparametrización α =
1
ξ
y λ =
1
ξτ
, de modo que:
f(x|ξ, τ) =< τ(1 + τξ)−(1/ξ+1), x > 0
Para ξ > 0, se supone que los parámetros ξ y τ son independientes y siguen las
siguientes distribuciones[21]:
ξ ∼ Pareto I(a, c), a > 0, c > 0
τ ∼ Gamma(a1, b1), a1 > 0, b1 > 0
En donde la distribución Pareto I, utilizada como previa, tiene densidad:
p(ξ|a, c) = acaξ−(a+1), ξ > c, a > 0, c > 0
La ventaja de trabajar con estas previas es que el parámetro ξ tiene un ĺımi-
te inferior positivo c, esto evita el problema en las simulaciones cuando se tienen
muestras pequeñas con parámetros relativamente cercanos a cero[21].
Para la distribución posterior se tiene:
p(ξ, τ |x) ∝ l(x|ξ, τ)p(ξ)p(τ)
p(ξ, τ |x) ∝ τn+a1−1ξ−(a+1)exp
[
−
(
1 +
1
ξ
)
n∑
i=1
ln(1 + τξxi)− b1τ
]
I(τ > 0)I(ξ > 0)
Esto indica que no se puede obtener la posterior mediante una forma cerrada, el
método de muestreo de Gibbs es utilizado para obtener muestras de la distribución
posterior[21].
33
2.7. MODELOS COMPUESTOS PARA LA SEVERIDAD MARCO TEÓRICO
2.7.4. Weibull con parámetro de forma conocido
Cuando el parámetro de forma τ es conocido, el parámetro de escala β tiene una
previa conjugada Gamma[6], es decir:
π(β|a, b) =
ba
Γ(a)
βa−1e−bβ β > 0
Para la distribución posterior se tiene:
π(β|τ, x) ∝ βa+n−1e−β(
∑n
i=1 x
τ
i +b)
La distribución posterior corresponde a una Gamma, el estimador respectivo es:
β̂ =
a+ n∑n
i=1 x
τ
i + b
2.7.5. Previas para la distribución Gamma
Una previa conjugada bastante conocida para el parámetro R = 1/β, es una
distribución Gamma usando los parámetros d y e[22]. Es decir:
p(R|d, e) = e(eR)d−1
e−eR
Γ(d)
Dado el vector de observaciones k, y multiplicando la verosimilitud Gamma por
la previa definida en el paso anterior, se obtiene la distribución posterior, q(β) ∼
Gamma(d̂, ê), donde:
d̂ = d+ nα, ê = e+
n∑
i=1
ki
La esperanza posterior resulta entonces en:
R̂ = d̂ · ê
La previa no normalizada que se utiliza para el parámetro α de la distribución
Gamma tiene la forma[22]:
34
2.7. MODELOS COMPUESTOS PARA LA SEVERIDAD MARCO TEÓRICO
p(α|a, b, c) ∝
aα−1Rac
Γ(α)b
En este caso existen tres hiperparámetros a, b, c ∈ R+.
Dado el vector de observaciones y, se multiplica la función de verosimilitud Gam-
ma por la previa para obtener una expresión para q(α):
q(α) ∝
âα−1Raĉ
Γ(α)b̂
Donde:
â = a
n∏
i=1
yi
b̂ = b+ n
ĉ = c+ n
Para efectos de los modelos definidos para frecuencia y severidad en este es-
tudio se utilizará una distribución previa exponencial para el parámetro α de las
distribuciones Gamma presentadas, ambas distribuciones suelen combinarse dado
que pertenecen a la familia exponencial.
2.7.6. Algoritmo básico Metropolis-Hastings
Dada una función dedensidad objetivo f , se construye un núcleo de Markov
K con distribución estacionaria f y luego se genera una cadena de Markov (X(t))
usando ese núcleo de forma que la distribución ĺımite de X(t) es f y las integrales
pueden ser aproximadas de acuerdo con el teorema ergódico[23].
La función f se asocia con una densidad condicional funcional q(y|x), los únicos
requerimientos sobre esta densidad son que la razón f(y)/q(y|x) es conocida hasta
una constante independiente de x y que q(·|x) tiene suficiente dispersión para llevar
a una exploración de todo el soporte de la función f .
35
2.7. MODELOS COMPUESTOS PARA LA SEVERIDAD MARCO TEÓRICO
El algoritmo Metropolis-Hastings asociado a la función de densidad objetivo f
y a la función de densidad condicional q produce una cadena de Markov (X(t)) bajo
el siguiente núcleo de trancisión[23]:
Algoritmo 1: Metropolis-Hastings
Dado x(t),
1. Genere Yt ∼ q(y|x(t)).
2. Tome
X(t+1) = Yt con probabilidad ρ(x
(t), Yt)
X(t+1) = x(t) con probabilidad 1− ρ(x(t), Yt)
Donde:
ρ(x, y) = min
{
f(y)
f(x)
q(x|y)
q(y|x)
, 1
}
2.7.7. Método de muestreo de Gibbs
Los métodos de muestreo basados en las técnicas Markov Chain Monte Carlo
(MCMC) son una v́ıa posible para hacer inferencia respecto a este tipo de modelos[24].
De esta manera se puede estimar la esperanza de la posterior aplicando un promedio
simple sobre las muestras, se puede calcular cualquier estad́ıstico de la distribución
posterior conforme al número de muestras:
E[f(s)]p ≈
1
N
N∑
i=1
f(s(i))
Donde P es la distribución posterior respectiva, f(s) es la esperanza deseada, y
f(s(i)) es la i− esima simulación de P [24].
Se supone que, para algún valor p > 1, se tiene la variable aleatoria X =
(X1, ..., Xp) y las densidades condicionales asociadas f1, ..., fp, de forma que se puede
simular:
Xi|x1, x2, ..., xi−1, xi+1, ..., xp ∼ fi(xi|x1, x2, ..., xi−1, xi+1, ..., xp) para i = 1, 2, ..., p
Las densidades f1, ..., fp se denominan como condicionales completas y una carac-
teŕıstica particular del muestreo de Gibbs es que solo estas densidades son utilizadas
en el proceso de simulación[23].
El algoritmo de muestreo de Gibbs relacionado con el modelo se muestra en la
siguiente trancisión de X(t) a X(t+1)[23]:
36
2.7. MODELOS COMPUESTOS PARA LA SEVERIDAD MARCO TEÓRICO
Algoritmo 2: Muestreo de Gibbs
En cada iteración t = 1, 2, ..., dado x(t) = (x
(t)
1 , ..., x
(t)
p ), se genera,
1. X
(t+1)
1 ∼ f1(x1|x
(t)
2 , ..., x
(t)
p );
2. X
(t+1)
2 ∼ f2(x2|x
(t)
1 , x
(t)
3 , ..., x
(t)
p );
...
3. X
(t+1)
p ∼ fp(xp|x(t)1 , ..., x
(t)
p−1);
2.7.8. Criterio de Información de Devianza (DIC)
Se considera un modelo de probabilidad p(y|θ) con una muestra de observacio-
nes y = (y1, ..., yn) y unos parámetros desconocidos denotados por θ, el criterio de
información de devianza se define como[26]:
DIC := E[D(y, θ|y)] + pD
En este modelo se tiene que p(y, θ) = −2log(p(y|θ)) y la media de la distribución
posterior D(y, θ), E[D(y, θ|y)] se obtiene como:
D̂avg(y) =
1
L
L∑
l=1
D(y, θ)
Además, pD es el número efectivo de parámetros, el cual mide la complejidad del
modelo, y se estima como sigue:
pD := D̂avg −Dθ̂(y)
Donde:
Dθ̂(y) = −2log{p(y|θ)}+ 2log{f(y)}
El número efectivo de parámetros contempla la precisión entre la probabilidad
y la precisión en la parte posterior y solo puede considerarse una medida apropiada
de la complejidad de un modelo que describe razonablemente los datos[25].
En temas de comparación se prefiere utilizar el modelo que minimice el valor del
criterio DIC.
37
2.8. CÁLCULO DE PRIMAS MARCO TEÓRICO
2.7.9. Medidas del error en cadenas de Markov
Al utilizar el paquete coda en RStudio, se obtienen una serie de estimadores,
para cada ajuste de modelo de Bayes a realizar, respecto al error computacional en
la cadena de Markov para la estimación de la distribución posterior en el modelo de
Bayes. Entre los resultados obtenidos se tienen dos estimadores del error estandar,
cuyos nombres en inglés son Naive Standard Error (SENaive) y Time-Series Standard
Error (SEts). Revisando la documentación de la funciones del paquete Coda[27] se
define el primer estimador como:
SENaive =
√
V ar(X)
C · S
En donde C es el número de cadenas que se ejecutan, X = {Xc} es el vector de las
muestras de la distribución posterior para un determinado parámetro (concatenación
de todas las cadenas, c ∈ 1, ..., C) y S es el número de iteraciones de cada cadena.
También se define el error estandar de serie de tiempo como:
SEts =
√
V arts(X)
C · S
En donde V arts(X) es el promedio de los V arts(X
(c))(c) para cada ser de muestras
X(c) y cada V arts(X
(c))(c) es obtenida al aplicar la función ar para obtener un
modelo autoregresivo sobre X(c).
2.8. Cálculo de primas
A partir del modelo de riesgo colectivo definido anteriormente, en donde el monto
de la pérdida total bajo el modelo agregado está dada por:
X =
N∑
j=1
Zj
Donde Zj denota el monto de pérdida debido a la ocurrencia del j-ésimo evento.
Se pueden implementar diferentes modelos de cálculo de prima, cada uno con un
enfoque diferente sobre el monto de prima que se debe destinar a cubrir el monto
agregado de las reclamaciones[9].
38
2.8. CÁLCULO DE PRIMAS MARCO TEÓRICO
• Prima Neta:
H1(θ) = EθX = EθN · EZ1 = θµ,
Donde µ = EZ1 y θ = EθN .
• Prima bajo el principio de varianza con coeficiente η > 0
H2(θ) = EθX + ηV arθX
= θ(µ+ η(σ2 + µ2))
Donde σ2 = V arZ1 y µ = EZ1
• Prima de Esscher con coeficiente ν > 0, se utilizan las igualdades siguientes:
Eθ(e
νX) = Eθ
[(
EeνZ1
)N]
= eθ(MZ1 (ν)−1)
y
Eθ(Xe
νX) = E
(
Z1e
νZ1
)
Eθ
[
N ·
(
EeνZ1)N−1
]
= E
(
Z1e
νZ1
)
θeθ(MZ1 (ν)−1)
En donde MZ(ν) denota la función generadora de momentos para la variable
aleatoria Z en un punto ν, luego la prima de Esscher se calcula como sigue[9]:
H3(θ) =
Eθ
(
XeνX
)
Eθ
(
eνX
)
= E
(
Z1e
νZ1
)
θ
• Prima exponencial con coeficiente ζ > 0:
H4(θ) =
1
ζ
lnEθe
ζX
=
1
ζ
θ(MZ1(ζ)− 1)
39
2.8. CÁLCULO DE PRIMAS MARCO TEÓRICO
En donde MZ1 en la función generadora de momentos de la variable aleatoria
Z1.
En todos los casos se obtiene una prima que es una función lineal del parámetro
desconocido θ[9].
40
CAPÍTULO 3
Metodoloǵıa
Se adoptará la siguiente estructura metodológica para el ajuste del modelo. Los
datos correponden a las bases de siniestros pagados entre los años 2010 y 2019,
y amparados por el seguro de Aviación del Instituto. Se considera una ĺınea de
seguro objetivo en este estudio dado que el producto de aviación en el INS presenta
coberturas y/o clases tarifarias para las cuales no se tienen datos de siniestralidad
y por consiguiente es necesario establecer un modelo que permita incorporar esta
incertidumbre.
Para el modelo general se tomarán los datos de siniestros pagados ligados a
coberturas de daño directo en el seguro de aviación. Como un primer acercamiento
es necesario estudiar la cantidad de siniestros ocurridos por trimestre y por año,
para efectos de medir y establecer modelos de frecuencia con una mayor cantidad de
observaciones, aśı como los montos totales de pérdida para los modelos de severidad.
En cuanto al criterio experto para establecer las distribuciones previas, el Insti-
tuto cuenta con un gran profesional en la materia del seguro de aviación, el señor
Mario Jiménez, evaluador experto en los riesgos de la ĺınea de aviación. Se reali-
zaron entrevistas v́ıa correo con el fin de obtener valores estad́ısticos y percentiles
sobre la distribución de frecuencia anual de siniestros y la distribución de los montos
individuales de siniestros, de acuerdo con su visión del riesgo analizado.
La definición de todos los modelos, y la obtención de datos puntuales y simula-
ciones de resultados se implemantaron en la herramienta libre RStudio utilizando
los paquetes R2Openbugs[28] y Coda [29]para hacer un enlace con la herramienta
OpenBugs, en la cual se definen directamente las distribuciones en cada escenario