Logo Studenta

46327

¡Este material tiene más páginas!

Vista previa del material en texto

Universidad de Costa Rica
Facultad de Ciencias
Escuela de Matemática
Trabajo final de graduación para optar por el grado de licenciatura en Ciencias
Actuariales
APLICACIÓN DE LA TEORÍA BAYESIANA EN LA
TARIFACIÓN DEL SEGURO DE AVIACIÓN
Siviany Gerardo Araya Vargas
San José, Costa Rica.
2021
Aplicación de la teoría bayesiana en la tarifación del seguro de aviación. 
Trabajo final de graduación sometido y aceptado por el Tribunal del trabajo final de 
graduación como requisito para optar por el grado de licenciatura en Ciencias Actuariales. 
Tribunal Examinador 
Dr. Álvaro Guevara Villalobos 
Presidente del Tribunal 
Director del Trabajo 
Lector 
M.Sc. Rodrigo Arias López 
Lector 
Miembro del Tribunal, Lector externo 
Siviany Gerardo Araya Vargas 
Candidato 
El presente trabajo de investigación lo dedico al Ser Supremo que gobierna todo lo
que existe, quien me ha brindado sabiduŕıa para desarrollar nuevos conocimientos,
enerǵıa para vivir y amar la ciencia.
A mi madre y a mi padre, por su ejemplo y entrega en cada etapa de mi vida, a mi
t́ıa por darme un horizonte, a toda mi familia por su apoyo incondicional.
A mi compañero de aventuras, quien me dio palabras de aliento en cada momento
de frustración, quien sonrió a mi lado en cada momento de aciertos.
A la vida misma.
I
Agradecimientos
Deseo brindar un agradecimiento profundo a mi tutor PhD. Luis Barboza, profe-
sor e investigador de la Universidad de Costa Rica, quien con su amplio conocimiento
en la estad́ıstica bayesiana se dedicó a conducir mi proyecto para lograr los objetivos
planteados en cada etapa del mismo.
Un agradecimiento especial a mi Alma Mater, la Universidad de Costa Rica, a todos
los profesores que me transmitieron sus conocimientos y en general, al sistema de
Educación Pública de Costa Rica que permitió que este sueño de vida fuera posible
desde sus ráıces.
Agradezco a las jefaturas y colaboradores del Instituto Nacional de Seguros, que
permitieron desarrollar mi proyecto con la información y herramientas que fueron
necesarias.
Un agradecimiento fraterno a toda mi familia, en especial a mi madre, por ser mi
motor de vida.
II
Resumen
El proceso de tarifación en las compañ́ıas de seguros, se basa generalmente en
los datos de las pérdidas para medir su cuant́ıa y relación existente con los montos
expuestos de la cartera del seguro espećıfico. Esto no es posible para nuevos riesgos o
productos de seguros donde los datos de pérdidas son escasos o no están disponibles.
En el marco de la normativa creada por la Superintendencia General de Seguros
en Costa Rica, las compañ́ıas deben investigar y/o desarrollar teoŕıa para incorpo-
rarla dentro de la nota técnica, creando sustento técnico para utilizar correctamente
la poca información existente y permitiendo, bajo un análisis de sensibilidad, regis-
trar bajo una base sólida y en un contexto realista, tarifas que se catalogan como
experimentales. Las tarifas experimentales se establecen subjetivamente con poca
o ninguna justificación actuarial y se ajustan con la experiencia de años posterio-
res, que podŕıa representar inadecuadamente la distribución natural de los siniestros
asociados al producto.
En el contexto de la estad́ıstica bayesiana, podemos encontrar una gran cantidad
de modelos que permiten obtener una prima de riesgo con base en el conocimiento
de expertos del área de suscripción y otras dependencias que manejan información
del seguro de aviación. Por lo tanto, en la presente tesis se propone incorporar la
opinión de los profesionales en materia del seguro de aviación del Instituto Nacional
de Seguros dada la escasez de información relevante para medir todos y cada uno
de los eventos que generen una pérdida para la compañ́ıa, asociados a los riesgos
asumidos por la misma en esa ĺınea de seguros con un riesgo potencial elevado.
Un enfoque bayesiano permite añadir complejidad a la forma de tarifar estos
seguros, generando primas de riesgo con una base más solida y en un contexto más
realista. Estos modelos podŕıan ser incorporados en las notas técnicas, apoyando
no solo a la aseguradora, sino también al regulador en su gestión de asegurar la
estabilidad de las compañ́ıas y su responsabilidad frente a los asegurados que están
expuestos a riesgos y esperan ser indemnizados ante los eventos que puedan acaecer.
III
Abstract
The pricing process in the Insurance Companies, is mainly based on loss data to
measure their amount and relationship with respect to the exposed amounts of the
specific insurance portfolio. This aproach is not possible for new risks or insurance
products where loss data is scarce or unavailable.
In the regulation created by the Superintendencia General de Seguros in Costa
Rica, the companies must investigate and develop sustainable theory to incorporate
it into the technical note, creating technical support for correctly utilize the little
existing information and allowing, under a sensitivity analysis, to register on a solid
basis and in a realistic context, quotes that are classified as experimental. Expe-
rimental quotes are subjectively established with little or no actuarial justification
and adjust with the experience of later years, even the latter being, possibly not
representative of the distribution of the associated claims to the product.
In the context of bayesian statistics, we can find a wide range of models to be
used for obtaining a risk premium based on the knowledge of expert underwriters
and other technicians who study day-to-day aviation insurance. It is proposed to
incorporate the opinion of the professionals in the aviation insurance at Instituto
Nacional de Seguros, given the lack of relevant information to measure each and
every one of the events that can trigger a loss for the company, associated with the
risks assumed by it in this insurance line with a high potential risk.
A bayesian approach allows to add a special complexity to the way in which
these insurances are priced, generating risk premiums with a more solid base and in
a more realistic context. These could be incorporated in the technical notes of the
products under study, giving a technical support not only the insurer, but also the
regulator that helps it in its function of taking care of the stability of the companies
and their responsibility to the insured people who are exposed to risks and who
expect to be compensated for the events that may occur.
IV
Índice general
Agradecimientos II
Resumen III
Abstract IV
Índice general V
Lista de figuras IX
Índice de figuras IX
Lista de tablas XI
Índice de cuadros XI
1. Introducción 1
1.1. Justificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Planteamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3. Objetivo General . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4. Objetivos Espećıficos . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
V
ÍNDICE GENERAL ÍNDICE GENERAL
1.5. Antecedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2. Marco Teórico 6
2.1. Seguro de Aviación . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2. Modelos para el número de siniestros . . . . . . . . . . . . . . . . . . 8
2.2.1. Definición de frecuencia . . . . . . . . . . . . . . . . . . . . . 8
2.2.2. Método tradicional . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2.3. Ajuste de distribución por Máxima Verosimilitud . . . . . . . 8
2.2.4. Distribución binomial negativa . . . . . . . . . . . . . . . . . . 9
2.2.5. Distribución Poisson . . . . . . . . . . . . . . . . . . . . . . . 11
2.2.6. Regresión Binomial Negativa Inflada con Ceros . . . . . . . . 13
2.2.7. Regresión Poisson Inflada con Ceros . . . . . . . . . . . . . . . 16
2.3. Modelos para la severidad . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3.1. Distribución Emṕırica . . . . . . . . . . . . . . . . . . . . . . 182.3.2. Distribución Log-normal . . . . . . . . . . . . . . . . . . . . . 19
2.3.3. Distribución Exponencial . . . . . . . . . . . . . . . . . . . . . 20
2.3.4. Distribución Pareto . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3.5. Distribución Burr . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.6. Distribución Weibull . . . . . . . . . . . . . . . . . . . . . . . 22
2.3.7. Distribución Gamma . . . . . . . . . . . . . . . . . . . . . . . 22
2.4. Modelo de Riesgo Colectivo . . . . . . . . . . . . . . . . . . . . . . . 23
2.5. Contexto Bayesiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.5.1. Modelo inicial . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.5.2. Modelo Jerárquico . . . . . . . . . . . . . . . . . . . . . . . . 25
2.6. Modelos compuestos para la frecuencia . . . . . . . . . . . . . . . . . 26
2.6.1. Distribución Binomial Negativa con parámetro r conocido . . 27
VI
ÍNDICE GENERAL ÍNDICE GENERAL
2.6.2. Binomial Negativa con ambos parámetros desconocidos . . . . 28
2.6.3. Distribución Poisson con previa Gamma . . . . . . . . . . . . 30
2.7. Modelos compuestos para la severidad . . . . . . . . . . . . . . . . . 31
2.7.1. Lognormal con ambos parámetros desconocidos . . . . . . . . 31
2.7.2. Exponencial con previa Gamma . . . . . . . . . . . . . . . . . 32
2.7.3. Pareto con ambos parámetros desconocidos . . . . . . . . . . . 33
2.7.4. Weibull con parámetro de forma conocido . . . . . . . . . . . 34
2.7.5. Previas para la distribución Gamma . . . . . . . . . . . . . . 34
2.7.6. Algoritmo básico Metropolis-Hastings . . . . . . . . . . . . . . 35
2.7.7. Método de muestreo de Gibbs . . . . . . . . . . . . . . . . . . 36
2.7.8. Criterio de Información de Devianza (DIC) . . . . . . . . . . . 37
2.7.9. Medidas del error en cadenas de Markov . . . . . . . . . . . . 38
2.8. Cálculo de primas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3. Metodoloǵıa 41
4. Análisis Descriptivo 47
4.1. Base de Siniestros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.2. Frecuencia Observada . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.3. Severidad Observada . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.4. Método Frecuentista . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.4.1. Análisis Determińıstico . . . . . . . . . . . . . . . . . . . . . . 51
4.4.2. Ajuste de distribuciones . . . . . . . . . . . . . . . . . . . . . 52
5. Ajuste Modelos de Frecuencia 55
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.2. Modelo F1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
VII
ÍNDICE GENERAL ÍNDICE GENERAL
5.3. Modelo F2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
5.4. Modelo F3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
5.5. Modelo óptimo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
6. Ajuste Modelos de Severidad 63
6.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
6.2. Modelo S1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
6.3. Modelo S2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
6.4. Modelo S3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
6.5. Modelo S4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
6.6. Modelo S5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
6.7. Modelo S6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
6.8. Modelo S7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
6.9. Modelo S8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
6.10. Modelo S9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
6.11. Modelo S10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
6.12. Modelo óptimo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
7. Modelo y Tarifación 79
7.1. Modelo Seleccionado . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
7.2. Tarifación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
Bibliograf́ıa 93
VIII
Índice de figuras
4.1. Siniestros Pagados por Trimestre de Estudio . . . . . . . . . . . . . . 48
4.2. Histograma de la Cantidad de Siniestros Pagados por Trimestre . . . 48
4.3. Boxplot de Montos Pagados por Siniestros y sus Logaritmos . . . . . 50
4.4. Histogramas de los Montos Pagados por Siniestros y sus Logaritmos . 50
4.5. Comparación entre distribución de frecuencia emṕırica y ajustada . . 52
4.6. Gráfico cuantil-cuantil para distribuciones de severidad ajustadas . . 53
5.1. Traza de las realizaciones del parámetro λ, Modelo F2, CV=20 . . . . 60
5.2. Densidad posterior del parámetro λ, Modelo F2 CV=20 . . . . . . . . 60
5.3. Comportamiento de la autocorrelación, Modelo F2 CV=20 . . . . . . 61
5.4. Convergencia del diagnóstico Gelman-Rubin para λ, Modelo F2 CV=20 61
5.5. Histograma del parámetro λ del Modelo F2, CV=20 . . . . . . . . . . 62
6.1. Traza del parámetro α del modelo S10, CV=20 . . . . . . . . . . . . 71
6.2. Traza del parámetro R del modelo S10, CV=20 . . . . . . . . . . . . 71
6.3. Traza del hiperparámetro R del modelo S10, CV=20 . . . . . . . . . 72
6.4. Densidad posterior del parámetro α, Modelo S10 CV=20 . . . . . . . 72
6.5. Densidad posterior del parámetro R, Modelo S10 CV=20 . . . . . . . 73
IX
ÍNDICE DE FIGURAS ÍNDICE DE FIGURAS
6.6. Densidad posterior del hiperparámetro R, Modelo S10 CV=20 . . . . 73
6.7. Gráfico de autocorrelación del parámetro α, Modelo S10, CV=20 . . 74
6.8. Gráfico de autocorrelación del parámetro R, Modelo S10, CV=20 . . 74
6.9. Gráfico de autocorrelación del hiperparámetro R, Modelo S10 CV=20 75
6.10. Convergencia del diagnóstico Gelman-Rubin del parámetro α . . . . . 75
6.11. Convergencia del diagnóstico Gelman-Rubin del parámetro R . . . . . 76
6.12. Convergencia del diagnóstico Gelman-Rubin del hiperparámetro R . . 76
6.13. Histograma del parámetro α del modelo S10, CV=20 . . . . . . . . . 77
6.14. Histograma del parámetro R del modelo S10, CV=20 . . . . . . . . . 78
6.15. Histograma del hiperparámetro R del modelo S10, CV=20 . . . . . . 78
7.1. Histograma de la pérdida anual esperada del modelo de riesgo colectivo 80
8.1. Escenarios del modelo F1, definido con la libreŕıa R2OpenBUGS . . . 85
8.2. Escenarios del modelo F2, definido con la libreŕıa R2OpenBUGS . . . 85
8.3. Escenarios del modelo F3, definido con la libreŕıa R2OpenBUGS . . . 86
8.1. Modelos de Severidad S1 definidos con la libreŕıa R2OpenBUGS . . . 87
8.2. Modelos de Severidad S2 definidos con la libreŕıa R2OpenBUGS . . . 87
8.3. Modelos de Severidad S3 definidos con la libreŕıa R2OpenBUGS . . . 88
8.4. Modelos de Severidad S4 definidos con la libreŕıa R2OpenBUGS . . . 88
8.5. Modelos de Severidad S5 definidos con la libreŕıa R2OpenBUGS . . . 88
8.6. Modelos de Severidad S6 definidos con la libreŕıa R2OpenBUGS . . . 89
8.7. Modelos de Severidad S7 definidos con la libreŕıa R2OpenBUGS . . . 89
8.8. Modelos de Severidad S8 definidos con la libreŕıa R2OpenBUGS . . . 90
8.9. Modelos de Severidad S9 definidos con la libreŕıa R2OpenBUGS . . . 90
8.10. Modelos de Severidad S10 definidos con la libreŕıa R2OpenBUGS . . 91
8.1. Modelo de Riesgo Colectivo definido con la libreŕıa R2OpenBUGS . . 92
X
Índice de cuadros
3.1. Esquema de modelos para la frecuencia escritura amplia . . . . . . . 42
3.2. Esquema de modelos para la severidad (A) . . . . . . . . . . . . . . . 43
3.3. Esquema de modelos para la severidad (B) . . . . . . . . . . . . . . . 44
4.1. Resultados bondad de ajuste χ2 . . . . . . . . . . . . . . . . . . . . . 52
4.2. Resultados criterios de ajuste distribuciones de severidad . . . . . . . 54
4.3. Resultados del modelo de riesgo colectivo con tarifacióntradicional . 54
5.1. Estad́ısticos relacionados a cada modelo de frecuencia ajustado . . . . 59
5.2. Estad́ısticos relacionados a cada parámetro del modelo ajustado . . . 62
6.1. Estad́ısticos relacionados a cada modelo de severidad ajustado . . . . 70
6.2. Estad́ısticos relacionados a cada parámetro del modelo ajustado . . . 77
7.1. Escenarios de prima de riesgo para diferentes parámetros establecidos 81
CAPÍTULO 1
Introducción
1.1. Justificación
Las compañ́ıas de seguros están desarrollando constantemente nuevos productos
de seguros generales (daños), respondiendo a necesidades del mercado: intermedia-
rios, clientes externos, clientes internos o motivaciones poĺıticas o económicas.
Para inscribir el producto ante el regulador es necesario diseñar una nota técnica,
que en el caso de Costa Rica, corresponde a un documento formal solicitado por la
Superintendencia General de Seguros (SUGESE) de acuerdo con lo establecido en
el Reglamento sobre Autorizaciones, Registros y Requisitos de Funcionamiento [1].
La nota técnica contiene los modelo y parámetros técnicos para la definición de la
estructura tarifaria y de coberturas del producto, en términos generales, aśı como un
resumen de la documentación contractual sobre la cual se regulan las condiciones
generales con las cuales el asegurado tiene conocimiento del contrato de seguro
celebrado.
A nivel de nota técnica es necesario medir el nivel de riesgo asociado al producto,
aśı como las causas, las formas de clasificarlos y la manera en que pueden verse dis-
minuidos, con el fin de generar un menor impacto a los asegurados y a las compañ́ıas
de seguro, y con ello representar los números en una cantidad que deben cobrar las
aseguradoras para cubrir los riesgos asegurables de manera suficiente y estable a
lo largo del tiempo. En resumen, se debe determinar una prima pura asociada al
riesgo a la cual se le incorporan una serie de recargos para considerar los gastos de
administración, los gastos que se producen al generar los contratos, el margen de
utilidad esperado, y otros gastos que interfieren en el costo del seguro.
En el Instituto Nacional de Seguros existen ĺıneas de seguros en donde la in-
1
1.1. JUSTIFICACIÓN INTRODUCCIÓN
formación estad́ıstica de siniestros es escasa para poder determinar una función de
distribución que se pueda ajustar a la realidad, estos datos contienen información
valiosa sobre los eventos más probables y no reflejan los eventos catastróficos o de
mayor severidad, dado que corresponden a ĺıneas de seguro que potencialmente re-
presentan una elevada severidad, pero una baja frecuencia. Los seguros de aviación
contemplan coberturas de daño directo y de responsabilidad civil, en este tipo de
seguros se cuenta con información estad́ıstica, pero se considera insuficiente para
establecer la exposición real a la que puede verse enfrentada la compañ́ıa de seguros
por los eventos que puedan generarse.
En Costa Rica se han registrado casos importantes de cáıda de aeroplanos; entre
los eventos de mayor trascendencia se pueden mencionar las tragedias del Vuelo 9916
de Nature Air en 2017, y el Vuelo 32 de Sansa en 1990. Estos eventos potenciales que
podŕıan estar asociados a la cartera del Instituto pueden ser amparados por contratos
de reaseguro a nivel internacional o bien pueden asumidos en su totalidad por la
compañ́ıa aseguradora, en cualquier caso, es importante medir la vulnerabilidad
y el nivel de riesgo que existe, dentro del plan de sostenibilidad financiera de la
institución.
Tradicionalmente, las compañ́ıas de seguros miden los niveles de siniestros y
montos asegurados expuestos para establecer una prima de riesgo, cuando no existe
información generalmente se recurre a primas experimentales las cuales deben ser
ajustadas cada cierto peŕıodo midiendo la suficiencia de las primas cobradas.
Debido a que estos modelos de tarifación experimental no cuentan con suficiente
respaldo técnico, se expone a las aseguradoras y a los asegurados a un riesgo de insu-
ficiencia tarifaria o de sobreprecio. Sumado a estas preocupaciones, cabe mencionar
que en Costa Rica el mercado de seguros se aperturó en la última década, y las
exigencias del mercado no permiten tener movimientos abruptos en las cantidades
cobradas a los asegurados. Se busca entonces enfocar los esfuerzos a determinar tari-
fas que contemplen otro tipo de información disponible en adición a la de siniestros
y asi evitar el registro de seguros cuyas primas se definieron sin ninguna justificación
actuarial de fondo.
En el Instituto Nacional de Seguros, la aplicación de la teoŕıa bayesiana en los
procesos de tarifación no ha sido la práctica, esta rama de la estad́ıstica permite
incorporar información bajo criterio experto en un contexto de formalidad, dentro
de la cual existen múltiples modelos que pueden ser utilizados para atender este tipo
de circunstancias. Es necesario explorar otros mecanismos para medir el riesgo, en
donde se pueda considerar el criterio de profesionales que han trabajado ese tipo
de seguros durante varios años, buscando teoŕıa aplicable que permita ajustar la
distribución de la frecuencia de siniestros y de la severidad de los mismos, de una
manera más técnica.
2
1.2. PLANTEAMIENTO INTRODUCCIÓN
1.2. Planteamiento
Con este trabajo se pretende tarifar productos de ĺıneas de seguros con riesgos
potenciales, inicialmente con el estudio particular de la ĺınea de aviación que cuentan
con información histórica de siniestros muy escasa o insuficiente para la distribución
de siniestros que mejor se ajuste a la realidad, contemplando todos aquellos even-
tos posibles y que potencialmente pueden generar pérdidas económicas al Instituto
Nacional de Seguros.
1.3. Objetivo General
Desarrollar una nueva metodoloǵıa de tarifación para las coberturas del seguro
de aviación del Instituto Nacional de Seguros madiante la exploración y aplicación
de modelos bayesianos, utilizando información previa de profesionales expertos de
la institución, con el fin de brindar un enfoque técnico a ĺıneas de seguros generales
que presentan poca información estad́ıstica y cuyas tarifas deben ser suficientes para
cubrir todos los riesgos esperados.
1.4. Objetivos Espećıficos
1. Analizar los modelos de Bayes para la frecuencia de siniestros que se han utili-
zado en otras investigaciones y realizar un proceso de optimización, escogiendo
un modelo que permita contemplar la cantidad de riesgos que se presentaŕıan
en un umbral de tiempo definido, por eventos que afecten la ĺınea de Aviación
del INS.
2. Analizar los modelos de Bayes para la severidad como recopilación de varias
investigaciones y realizar un proceso de optimización, escogiendo el modelo
más adecuado para medir los montos de pérdidas individuales que se estaŕıan
presentando ante riesgos materializados y amparados bajo las coberturas del
producto de aviación del INS.
3. Conformar un modelo de riesgo colectivo y determinar la distribución de las
pérdidas acumuladas en un peŕıodo anual, e incorporar los componentes ac-
tuariales de la tarifación tradicional en seguros con el fin de obtener una tarifa
comercial para el producto con base en la distribución posterior del modelo
general.
3
1.5. ANTECEDENTES INTRODUCCIÓN
1.5. Antecedentes
El método clásico de tarifación, conocido por su nombre en inglés: “Burning Cost
Ratio”, determina la relación entre los siniestros acumulados incurridos y las sumas
aseguradas expuestas (base expuesta) en un peŕıodo de estudio[2], produciendo una
proporción de monto asegurado que se debe destinar para hacer frente a los siniestros
esperados en el futuro. La utilización del modelo tradicional es efectivo en ĺıneas de
seguro con una frecuencia de siniestros medible y estable a los largo del tiempo y
sobre las cuales no se esperan afectaciones por eventos catastróficos. A nivel regional,
las compañ́ıas de seguros deben desarrollar nuevas estrategiaspara medir su riesgo
y con ello tarifar adecuadamente los productos que ofrece.
A nivel internacional, desde el año 2012, las compañ́ıas de seguros se han tenido
que ir adaptando a un marco normativo a nivel internacional que regula los re-
querimientos de capital de las aseguradoras, conocido como Solvencia II (European
Comission 2009). Las empresas deben implementar modelos de provisiones técni-
cas que resulten más sensibles al riesgo. Bajo un enfoque más técnico se establecen
provisiones de siniestros principalmente, esto impacta directamente el proceso de
tarifación. En una publicación realizada por la reaseguradora Munich Re se indica
que en este proceso es dif́ıcil evaluar el impacto en la capacidad del mercado y los
precios, pero es probable que la mayor transparencia con respecto al costo total del
riesgo conduzca a que los precios y las reservas sean más proporcionales al riesgo[3].
Existen productos, coberturas o ĺıneas de Seguro en los cuales no se cuenta con
información estable, los riesgos asociados dependen de variables complejas, factores
ambientales, poĺıticos, entre otros, que dificultan el proceso de medición del riesgo y
ajuste de los precios. Un ejemplo práctico donde se presenta una situación particular
es el caso de seguros de aviación, en donde se aseguran las aeronaves para uso comer-
cial o privado. En un mercado pequeño, resulta dif́ıcil medir la prima que se debe
cobrar para este producto, dado que las afectaciones se dan por casos catastróficos,
presentándose muy pocos casos en un periodo determinado, pero con una severidad
(monto) bastante elavada.
En un periodo de 5 años, por ejemplo, podŕıa no haberse registrado ningún even-
to, y en el mejor de los escenarios, en cuanto a recopilación de datos, podŕıan tenerse
registros de algunos casos ocurridos, pero estos no permitiŕıan estimar cuánto se de-
beŕıa cobrar realmente, si se utilizara el método tradicional de tarifación. Utilizando
la metodoloǵıa bayesiana se puede romper esta brecha de información, en el proceso
se considera el criterio experto de varios profesionales de la compañ́ıa, principalmen-
te del área de suscripción, quienes pueden medir algunos factores importantes para
conocer el nivel de riesgo y sus cualidades.
Con base en los estudios realizados sobre la inferencia bayesiana en el mercado de
seguros se concluye que el marco bayesiano permite evaluar, de forma más prácti-
4
1.5. ANTECEDENTES INTRODUCCIÓN
ca, los parámetros y la incertidumbre de predicción utilizando las distribuciones
predictivas previa y posterior, respectivamente. Además, indican que los modelos
que utilizaron, ajustaron bien los datos históricos, capturando el efecto de cohorte
estocástico, siendo este parsimonioso y relativamente simple[4].
Se logró identificar un estudio realizado en el año 2008 para tarifar un nuevo
producto de viajes al espacio, dado que corresponde a un riesgo dif́ıcil de medir, fue
necesario realizar un modelo aplicable pero ajustado a la realidad, el autor concluye
que el método desarrollado fortalece la estabilidad de las estimaciones en los casos
que existe carencia de información [5]. El proceso incorpora la opinión de los expertos
en un marco bayesiano con datos de pérdida de niveles inferiores y superiores. La
aplicación a una compañ́ıa de seguros, es que se pueden explorar productos que
posean un mayor riesgo que el estudiado, aśı como productos con un riesgo menor a
éste. La prima de riesgo deseada se encontraŕıa entre las primas de riesgo calculadas
para estos productos, ya sea de forma general o a nivel de coberturas.
En la metodoloǵıa de este proyecto, se utilizan varios modelos bayesianos para
la frecuencia y severidad basados en varios estudios realizados en los últimos años,
entre los que se puede citar un estudio de estad́ıstica bayesiana y la distribución
Weibull realizado en el año 2016[6], otro realizado en 2017 con aplicación de la
teoŕıa bayesiana y la distribución Exponencial-Gamma [7] y un tercero más reciente
(año 2019) en donde se realiza un análisis bayesiano sobre la distribución lognormal
[8] como los más recientes. En los art́ıculos utilizados como referencia para este
estudio, se introducen modelos con diferentes niveles de jerarqúıas y se obtienen
conclusiones sobre cuales distribuciones previas se pueden implementar en conjunto
con cada distribución teórica de verosimilitud para frecuencia y severidad. Con base
en este marco de referencia se define una serie de modelos que se aplicarán a los
datos y la información obtenida de expertos en el seguro de aviación.
Los resultados obtenidos crean una base estad́ıstica con la cual obtener las primas
de riesgo y comerciales del producto analizado, que es el objetivo del proceso de
tarifación como tal. Existen estudios, que parten de la definición del modelo general
de riesgo colectivo e incorporan principios de estimación de pérdidas esperadas. En
el año 2008 se desarrolló una investigación que resume algunos principios para la
obtención de la prima de riesgo[9]. Todos estos enfoques de estimación sirven de
base para el cálculo de tarifas del producto, y por ende como insumos en los cálculos
de reservas posteriores y determinación de requerimientos de capital de la compañ́ıa
de seguros. Además, conforman una nueva metodoloǵıa de gran valor que servirá de
herramienta para losmprofesionales en actuaŕıa de la unidad de productos (pricing)
del Instituto, principalmente en el proceso de tarifación de la ĺınea de aviación.
5
CAPÍTULO 2
Marco Teórico
2.1. Seguro de Aviación
Las estad́ısticas mundiales señalan que, comparando la cantidad de accidentes
mortales contra la cantidad de viajes realizados, es más seguro viajar en avión que
en automóvil, sin embargo, los aviones no están exentos a una serie de riesgos de la
naturaleza y provocados por humanos, que en la mayoŕıa de ocasiones desencadenan
pérdidas humanas y económicas enormes, una vez que se presenta un evento.
Los seguros de aviación tradicionalmente han utilizado dos clasificaciones de
coberturas de seguro: Casco y responsabilidad civil [10]. En la primera se encuentran
todas aquellas coberturas que aseguran la estructura del avión, en la segunda, se
aborda la responsabilidad que tiene un tomador de la póliza ante las vidas humanas,
las mercanćıas o bienes de terceros que se vean afectados por la actividad comercial
que desempeña con el avión asegurado.
La historia del seguro de aviación se remonta a la primera década del siglo XX.
Existe una cierta controversia sobre cuándo fue suscrita la primera póliza de seguro
de aviación, sin embargo, hay dos detalles importantes como lo son: (1) La industria
de la aviación comercial y la industria de seguros de aviación obviamente están
relacionadas en el sentido de que la primera nunca habŕıa existido sin la segunda.
(2) El mercado de seguros en Londres pronto se convirtió en un centro de seguros
de aviación y es reconocido aśı hasta nuestros d́ıas [10].
La industria de seguros de aviación recibió un gran impulso después de la Se-
gunda Guerra Mundial, cuando los aviones de transporte militar revisados ingresa-
ron al mercado comercial y se formaron operadores de aviones comerciales a gran
escala[10]. Este escenario contribuyó a la mejora de la industria de las aeroĺıneas,
6
2.1. SEGURO DE AVIACIÓN MARCO TEÓRICO
aśı como su tráfico, tamaño y actualización de la flota. Este escenario también pro-
vocó un crecimiento acelerado de la demanda por capacidad de seguro para casco y
responsabilidad civil.
Las coberturas que cubren casco y responsabilidad civil incluyen las espećıficas a
riesgos relacionados con la guerra, inicialmente el mercado no estaba consolidado y
las tarifas para dichas coberturas se determinaban más por efecto oferta-demanda y
no por un análisis particular a la exposición de cada cartera asegurada. La década de
1980 se caracterizó por el desembolso de grandes pagospor parte de las aseguradoras
(debido a una combinación de pérdidas recurrentes de aviones a reacción de fuselaje
ancho y una alta tasa de pérdidas humanas), y fluctuaciones en las tarifas de las
primas que llevaron a aunar esfuerzos para crear compañ́ıas cautivas propias[10].
Los mercados comerciales de este tipo de seguros se ven enriquecidos con la
experiencia de eventos aislados, puesto que en esas situaciones es cuando se logra
medir realmente la suficiencia de primas en un programa de seguros, las provisiones
y las primas que se cobran a cada asegurado.
Después de los ataques terroristas del 11 de septiembre, las aeroĺıneas se vieron
afectadas por una cancelación mundial de coberturas de responsabilidad a terceros
relacionadas al riesgo de guerra, en el mercado comercial y aumentos significativos
en los costos de otros seguros de riesgo de guerra. El gobierno de EE. UU. intervino
y amplió un programa federal de seguros para el riesgo de guerra en aviación, para
garantizar que las compañ́ıas aéreas estadounidenses pudieran recibir una cobertura
de seguro que no era ofrecida en ese momento. El mercado de seguros comercia-
les, desde entonces se ha estabilizado, y varias compañ́ıas aéreas están comprando
nuevamente cobertura de riesgo de guerra de aseguradoras privadas[11].
Nos enfrentamos ante un mundo muy cambiante, por lo que es necesario conside-
rar toda la exposición de riesgo que se presenta en una cartera asegurada y modelar
con base en la historia y análisis profundos de las variables en juego, cuales podŕıan
ser las pérdidas que va a presentar la compañ́ıa de seguros a futuro por la suscripción
de dichos riesgos. En este punto juega un papel importante el reaseguro, mecanismo
mediante el cual las aseguradoras trasladan parte de su riesgo a un tercero con el
fin de diversificar el riesgo.
Los contratos de reaseguro no proporcional surgieron por la necesidad que teńıan
las compañ́ıas de seguros de protegerse frente a las consecuencias de aquellos sinies-
tros cuya cuant́ıa o amplitud podŕıan poner en peligro su capacidad financiera [12].
Para ciertas ĺıneas con posibilidad de siniestros con las caracteŕısticas anteriores, se
puede optar por contratos espećıficos como el exceso de pérdida. En este tipo de
contrato, se paga una prima espećıfica por las capas de protección recibidas, y esto
hace que en la práctica sea responsabilidad de la compañ́ıa aseguradora medir sus
riesgos y tarifar las primas adecuadas para pagar siniestros y los costos de las capas
de reaseguro.
7
2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO
2.2. Modelos para el número de siniestros
A manera de ilustración, se detallan los modelos de frecuencia clásicos, con los
cuales se realiza el ajuste del número de siniestros esperados.
2.2.1. Definición de frecuencia
La frecuencia de siniestros f se mide como el número de reclamaciones del se-
guro que se dan por cada unidad expuesta al riesgo y en un periodo de tiempo
determinado, se puede expresar mediante la fórmula:
f =
N
Unidades Expuestas al Riesgo
A lo largo de esta tesis, se entenderá por N la cantidad de reclamaciones de
un periodo determinado, de acuerdo con la experiencia del Instituto, se trabajan
periodos anuales.
Se detallan los modelos tradicionales y relacionados con estadistica bayesiana
con el fin de dar tratamiento a la variable aleatoria N .
2.2.2. Método tradicional
Se determina el número de siniestros N como un valor único, considerando el
número de observaciones de siniestros ocurridos en un periodo de t años. Se denota
por C la cantidad de siniestros registrados para definir la siguiente fórmula:
N =
C
t
2.2.3. Ajuste de distribución por Máxima Verosimilitud
Para definir el estimador de Máxima Verosimilitud, se considera una base de
datos que consiste en n eventos A1, ..., An donde Aj corresponde al valor de la j −
esima observación. Por ejemplo, Aj puede ser un punto cualquiera o un intervalo.
Se asumen que el evento Aj procede de la observación de la variable aleato-
ria Xj. Las variables aleatorias X1, ..., Xn no necesitan tener la misma función de
8
2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO
probabilidad asociada pero si depender de un mismo vector de parámetros θ.
Bajo el supuesto de que X1, ..., Xn son variables aleatorias independientes, la
función de verosimilitud se define como:
L(θ) =
n∏
j=1
P (Xj ∈ Aj|θ)
El estimador de máxima verosimilitud corresponde al vector θ que maximiza la
función L(θ).
No hay garant́ıa de que la función definida tenga un máximo en su dominio. Es
posible que mientras los parámetros tiendan al valor cero o a infinito, la función de
verosimilitud continúe aumentando. Se debe tener mucho cuidado al maximizar esta
función tomando encuenta los máximos locales que la función pudiese presentar. No
siempre será posible expresar la función L(θ) de forma anaĺıtica, sin embargo existen
métodos numéricos de aproximación incorporados en este marco teórico[13].
Cuando se realizan observaciones de una variable aleatoria se pueden tener mues-
tras censuradas o truncadas según la limitación de información que presente el análi-
sis. Cuando no existe información alguna para un subconjunto de la población total
se habla de una muestra truncada, si para ese subconjunto se redefinen los valores
de las observaciones, se habla de una muestra censurada.
Cuando no existe truncamiento ni censura, y el valor de cada observación se
registra, se puede ver la función de verosimilitud de la siguiente manera:
L(θ) =
n∏
j=1
fXj(xj|θ)
Y su logaritmo como:
l(θ) =
n∑
j=1
ln
[
fXj(xj|θ)
]
2.2.4. Distribución binomial negativa
La función de probabilidad de una distribución binomial negativa está dada
por[13]:
9
2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO
Pr(N = k) = pk =
Γ(k + r)
Γ(r)Γ(k + 1)
(
1
1 + β
)r(
β
1 + β
)k
,
k = 0, 1, 2, ..., r > 0, β > 0.
Sea nk el número de peŕıodos en los cuales la frecuencia es de exactamente k
reclamos. La función logaritmo de la verosimilitud para esta distribución es:
l =
∞∑
k=0
nkln(pk)
=
∞∑
k=0
nk
[
ln
(
Γ(k + r)
Γ(r)Γ(k + 1)
)
− r ln(1 + β) + k ln(β)− k ln(1 + β)
]
Esta función depende de los parámetros r y β, para encontrar el máximo, es
necesario recurrir a las derivadas parciales e igualarlas a cero, para obtener las
soluciones de los parámetros. La derivada parcial respecto a β es:
∂l
∂β
=
∞∑
k=0
nk
(
k
β
−
r + k
1 + β
)
Por su parte, la derivada parcial respecto a r es:
∂l
∂r
= −
∞∑
k=0
nk ln(1 + β) +
∞∑
k=0
nk
∂
∂r
ln
(r + k − 1) · · · r
k!
= −n ln(1 + β) +
∞∑
k=0
nk
∂
∂r
ln
k−1∏
m=0
(r +m)
= −n ln(1 + β) +
∞∑
k=0
nk
∂
∂r
k−1∑
m=0
ln(r +m)
= −n ln(1 + β) +
∞∑
k=0
nk
k−1∑
m=0
1
r +m
10
2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO
Si se igualan estas ecuaciones a cero, se obtiene lo siguiente:
µ̂ = r̂β̂ =
∑∞
k=0 k nk
n
= x
Además:
n ln(1 + β̂) =
∞∑
k=1
nk
(
k−1∑
m=0
1
r̂ +m
)
Se observa que el estimador de máxima verosimilitud para la media es el promedio
muestral. Ambas ecuaciones se pueden resolver de forma numérica. Si se reemplaza
β̂ por µ̂/r̂ se obtiene la ecuación:
H(r̂) = n ln
(
1 +
x
r̂
)
−
∞∑
k=1
nk
(
k−1∑
m=0
1
r̂ +m
)
= 0
La función H(r̂)se puede maximizar numéricamente, utilizando para r̂ el método de
Newton-Raphson. La ecuación requerida para la k − esima interación es:
rk = rk−1 −
J(rk−1)
H ′(rk − 1)
2.2.5. Distribución Poisson
La forma de la función de probabilidad de una distribución Poisson es[13]:
pk =
e−λλk
k!
k = 0, 1, 2, ...
Sea N una variable aleatoria con distribución Poisson de parámetro λ, se cumple
lo siguiente:
E(N) = V ar(N) = λ
Sean N1, N2, ..., Nn variables aleatorias independientes con distribución Poisson
de parámetros λ1, λ2, ..., λn, para determinar la distribución asociada a la suma de
las variables anteriores, se calcula lo siguiente:
11
2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCOTEÓRICO
PN(z) =
n∏
j=1
PNj(z)
=
n∏
j=1
exp[λj(z − 1)]
= exp
[
n∑
j=1
λj(z − 1)
]
= eλ(z−1)
Se concluye entonces que la suma de dichas variables aleatorias Poisson tiene distri-
bución Poisson con parámetro λ1 + λ2 + ...+ λn.
Utilizando la notación de la sección anterior, se tiene la siguiente forma para la
verosimilitud del conjunto de observaciones completas:
L =
∞∏
K=0
pnkk
La función logaritmo respectiva se obtiene por:
l =
∞∑
k=0
nk ln(pk)
Dado que la distribución Poisson sólo tiene un parámetro, la busqueda del
parámetro óptimo se vuelve más sencilla.
La función logaritmo de la verosimilitud es la siguiente:
l =
∞∑
k=0
nk(−λ+ k ln(λ)− ln(k!))
= −λn+
∞∑
k=0
k nk ln(λ)−
∞∑
k=0
nk ln(k!)
Se deriva la expresión anterior y se iguala a cero para obtener el óptimo:
12
2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO
∂l
∂d
= −n+
∞∑
k=0
k nk
1
λ
λ̂ =
∑∞
k=0 k nk
n
= x
2.2.6. Regresión Binomial Negativa Inflada con Ceros
Cuando se cuenta con poca información estad́ıstica sobre siniestros pagados du-
rante un peŕıodo, es posible que en algunos registros mensuales no se visualicen casos,
ocasionando que la variable se distribuya de forma binomial negativa salvo por la
frecuencia que se presenta para el valor cero, que está por encima de la frecuencia
de acuerdo con la distribución ajustada.
Para cada observación se consideran 2 casos, si el caso 1 ocurre, con certeza
el conteo es cero. Si el caso dos sucede, el conteo está dado por una distribución
binomial negativa con los parámetros respectivos. Se expresa esta distribución de la
siguiente manera[14]:
Pr(yi = j) =
{
πi + (1− πi)g(yi = 0) si j = 0
(1− πi)g(yi) si j > 0
Donde πi es la función loǵıstica relacionada definida abajo y g(yi) es la distribución
binomial negativa dada por:
g(yi) = Pr(Y = yi|r, βi) =
Γ(yi + r)
Γ(r)Γ(yi + 1)
(
1
1 + βi
)r(
βi
1 + βi
)yi
En donde βi =
µi
r
.
El componente negativo binomial puede incluir un tiempo de exposición t y un
conjunto de k variables regresoras, la expresión relacionada es:
µi = exp(ln(ti) + αix1t + α2x2t + · · ·+ αkxkt)
La función loǵıstica relacionada se determina por:
πi =
λi
1 + λi
13
2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO
Donde:
λi = exp(ln(ti) + γ1z1i + γ2z2i + · · ·+ γmzmt)
El componente loǵıstico contiene una tiempo de exposición t y un conjunto de
m variables regresoras (z′s). Note que los z′s y los x′s pueden o no tener términos
en común.
El logaritmo de la función de verosimilitud está dada por:
l = l1 + l2 + l3
Donde:
l1 =
∑
{i:yi=0} ln
[
λi + (1 + βi)
−r]
l2 =
∑
{i:yi>0}
(
−ln(yi!)−(yi+r)ln(1+βi)−yiln(r)+yiln(rβi)−
∑yi−1
j=0 ln(j+r)
)
l3 =
∑n
i=1 ln(1 + λi)
El gradiente de l es:
∂l
∂αj
=
∑
{i:yi=0}
[ − rβi(1 + βi)−1−r
λi + (1 + βi)−r
]
xij +
∑
{i:yi>0}
[yi − βi
1 + βi
]
xij j = 1, 2, ..., k
∂l
∂γj
=
∑
{i:yi=0}
[ λi
λi + (1 + βi)−r
]
zij −
∑n
i=1
[ λi
1 + λi
]
zij j = 1, 2, ...,m
∂l
∂r
=
∑
{i:yi=0}
[βi − (1 + βi)ln(1 + βi)
(1 + βi)[λi(1βi)−r + 1]
]
zij −
∑
{t:yi>0}
{
ln(1 + βi) +
yi − rβ
r(1 + β)
−
∑yi−1
j=0
1
j + r
}
Las segundas derivadas son:
∂2l
∂αj∂βh
=
∑
{i:yi=0}
xijxihrβi[(rβi − 1)λi(1 + βi)r − 1]
(1 + βi)2[λi(1 + βi)r + 1]2
−
∑
{i:yi>0}
rβi(1 + βi)xijxih
(1 + βi)2
, i, h = 1, 2, ..., k
14
2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO
∂2l
∂γj∂γh
=
∑
{i:yi=0}
zijzihλi(1 + βi)
r
[λi(1 + βi)r + 1]2
−
∑n
i=1
zijzihλi
(1 + λi)2
, i, h = 1, 2, ...,m
∂2l
∂αj∂γh
=
∑
{i:yi=0}
xijzisrβiλi(1+βi)
r−1
[λi(1+βi)r−1+1]
j = 1, 2, ..., k; h = 1, 2, ...,m
∂2l
∂βj∂r
=
∑
{i:yi=0}
xijrβiλi(1 + βi)
1+rln(1 + βi)
(1 + βi)2
[
λi(1 + βi)r + 1
]2
−
∑
{i:yi=0}
xijrβ
2
i
r
[λi
r
(1 + βi)
r + λi(1 + βi)
r +
1
r
]
(1 + βi)2
[
λi(1 + βi)r + 1
]2
+
∑
i:y>0
xijrβi(rβi − yi)
r2(1 + βi)2
j = 1, 2, ..., k
∂2l
∂γh∂r
=
∑
{i:yi=0}
zihλi(1 + βi)
r−1[(1 + βi)ln(1 + βi)− βi][
λi(1 + βi)r + 1
] h = 1, 2, ...,m
∂2l
∂r2
=
∑
{i:yi=0}
F1 + F2 − F3
F4
+
∑
{i;yi>0}(F5 + F6)
Donde:
F1 = r
−1βi{2λi(1 + βi)r + r−1βiλi(1 + βi)r + 3βi[λi(1 + βi)r + 1] + 2}
F2 = r
2λi(1 + βi)
2+rln2(1 + βi)
F3 = 2r(1 + βi)ln(1 + βi){λi(1 + βi)r + r−1βiλi(1 + βi)r + βi[λi(1 + βi)r + 1] + 1}
F4 = (1 + βi)
2[λi(1 + βi)
r + 1]2
F5 =
r−2[2(r − yi)βi + 3rβ2i − yi]− 2(1 + βi)2ln(1 + βi)
(1 + βi)2
F6 =
∑y1−1
j=0
2rj + r2
(j + r)2
Los estimadores de máxima verosimilitud presentan una distribución asintótica
es una normal multivariada[14], como se oberva en la siguiente expresión:
15
2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO
β̂γ̂
r̂
 = N
βγ
r


−
∂2l
∂βj∂βh
−
∂2l
∂βj∂γh
−
∂2l
∂βj∂r
−
∂2l
∂βj∂γh
−
∂2l
∂γj∂γh
−
∂2l
∂γj∂r
−
∂2l
∂βj∂r
−
∂2l
∂γj∂r
−
∂2l
∂r2

−1
2.2.7. Regresión Poisson Inflada con Ceros
En este modelo de regresión, el vector de respuestas Y = (Y1, ..., Yn)
′ contiene
variables independientes y se cumple lo siguiente:
Yi ∼ 0 con probabilidad pi
Yi ∼ Poisson(λi) con probabilidad 1− pi
De esta manera:
Pr(Yi = j) =
 pi + (1− pi)e
−λi si j = 0
(1− pi)e−λi
λki
k!
si j > 0
Los parámetros λ = (λ1, ..., λn)
′ y p = (p1, ..., pn)
′ satisfacen:
log(λ) = Bβ
log(p′(1− p)) = Gγ
Para matrices covariadas B y G, y β el vector de coeficientes.
El número de parámetros por ser estimados dependerá del número de covariables
presentes en el modelo. Si existen pocos conteos y λ y p no están relacionadas,
entonces sólo se pueden considerar modelos simples para la variable λ[15].
Cuando λ y p no están relacionados por ninguna función, la función de verosi-
militud con la parametrización estándar resulta en:
16
2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO
l(γ, β; y) =
∑
yi=0
ln(eGiy + exp(−eBiβ))
+
∑
yi>0
(yiBiβ − eBiβ)
−
∑n
i=1 ln(1 + e
Giγ)
−
∑
yi>0
ln(yi!)
Los términos Gi y Bi corresponden a las i-ésimas filas de las matrices G y B
respectivamente.
La suma de exponenciales en el primer término complica la maximización de
l(γ, β; y)[15]. Se supone que se conoce la cantidad de ceros que proviene del estado
perfecto y de la distribución Poisson por separado. Se observa Zi = 1 cuando Yi
proviene del estado perfecto de ceros y Zi = 0 cuando Yi proviene de la distribución
Poisson.
La función de máxima verosimilitud con la información completa es:
lc(γ, β; y, z) =
n∑
i=1
ln(f(zi|γ))
+
n∑
i=1
ln(f(yi|zi, β))
lc(γ, β; y, z) =
n∑
i=1
(ziGiγ − ln(1 + eGiγ))
+
n∑
i=1
(1− zi)(yiBiβ − eBiβ)
−
n∑
i=1
(1− zi)ln(yi!)
lc(γ, β; y, z) = lc(γ; y, z) + lc(β, y, z)
−
n∑
i=1
(1− zi)ln(yi!)
Esta última expresión es más fácil de maximizar, dado que sus términos se pueden
maximizar por separado.
17
2.3. MODELOS PARA LA SEVERIDAD MARCO TEÓRICO
2.3. Modelos para la severidad
En esta sección nos interesa conocer la distribución del monto de pérdida liga-
do a la ocurrencia de un siniestro, es decir, la pérdida económica que presentó la
Compañ́ıa ante un evento siniestral amparado por la póliza del producto en estu-
dio. Estos valores son positivos y tiende a existir una acumulación de siniestros con
un promedio determinado y casos puntuales de siniestros que generan montos de
pago bastante elevados, alcanzando inclusive un monto cercano o igual a la suma
asegurada para cada aeronave. Existe una relación directa entre el monto asegurado
y el monto de la reclamación, ante la ocurrencia de un siniestro se estima un daño
directo parcial de la aeronave para la cual se definió, en la emisión de la póliza, un
valor monetario estimado sobre el cual se ajustaŕıan las pérdidas a futuro.
A menudo es deseable encontrar una expresión anaĺıtica expĺıcita para una dis-
tribución de pérdidas, más cuando las estad́ısticas con las que se cuenta son de-
masiado escasas como para utilizar la distribución emṕırica como primera opción
de ajuste[16]. Cabe destacar que no siempre es adecuado utilizar distribuciones de
pérdida teóricas debido a su naturaleza fuertemente sesgada, sin embargo cuando setrata de este análisis, existen distribuciones candidatas como la log-normal, exponen-
cial, Pareto, Burr, Weibull y gamma, que son candidatos t́ıpicos para distribuciones
de severidad de las pérdidas.
2.3.1. Distribución Emṕırica
Una estimación natural para ajustar la distribución de las pérdidas por siniestros
es la distribución de severidad emṕırica (observada), para un conjunto de observa-
ciones xi, ..., xn dicha distribución es definida por[16]:
Fn(x) =
1
n
#{i : xi ≤ x}
Esto es la función constante a trozos con saltos de tamaño 1/n en los puntos xi.
Cuando se tiene un gran cantidad de datos, se puede aproximar con alguna función
continua, en donde los puntos de saltos se ven conectados por funciones lineales.
La aplicación de la distribución emṕırica resulta adecuada cuando existe una can-
tidad suficientemente grande de observaciones de montos de siniestros. Casi nunca
se puede aplican en la cola de una distribución, especialmente en caso con posibi-
lidad de grandes pérdidas como es el caso de estudio para Aviación. Una forma de
trabajar estos casos es ajustar la distribución emṕırica hasta un ĺımite definido, y
los montos de gran tamaño ajustarlos con alguna función análitica conocida para
colas pesadas.
18
2.3. MODELOS PARA LA SEVERIDAD MARCO TEÓRICO
2.3.2. Distribución Log-normal
Se considera una variable aleatoria X que presenta una distribución normal con
densidad definida por:
fX(x) =
1
σ
√
2π
exp
{
−
(x− µ)2
2σ2
}
, −∞ < x <∞
Sea Y = eX tal que X = log(Y ), la función de densidad de la probabilidad
llamada log-normal y está dada por:
fY (y) = fX(log(y))
1
y
=
1
yσ
√
2π
exp
{
−
(log(y)− µ)2
2σ2
}
, y > 0
Para esta variable aleatoria se tiene los siguientes resultados:
E(Y ) = exp
(
µ+
σ2
2
)
V ar(Y ) = {exp(σ2)− 1}exp(2µ+ σ2)
Utilizando la metodoloǵıa definida en apartados anteriores, se obtiene la función
de verosimilitud asociada, con los siguientes estimadores respectivos:
µ̂ =
1
n
n∑
i=1
log(yi)
σ̂2 =
1
n
n∑
i=1
{log(yi)− µ̂}2
La distribución log-normal es muy útil en este tipo de modelación, debido a que es
una distribución sesgada por la derecha, tiene una cola gruesa y se ajusta bien en la
mayoŕıa de ocasiones. Además, es infinitamente divisible y cerrada bajo transforma-
ciones de escala y exponencial. Sin embargo, también sufre algunos inconvenientes,
en particular, que la transformación de Laplace no tiene una representación de forma
cerrada y la función generadora de momentos no existe [16].
19
2.3. MODELOS PARA LA SEVERIDAD MARCO TEÓRICO
2.3.3. Distribución Exponencial
Se considera una variable aleatoria con la siguientes funciones de densidad y
distribución, respectivamente:
f(x) = βe−βx, x > 0
F (x) = 1− e−βx, x > 0
Dicha distribución se conoce como Exponencial de parámetros (intensidad) β > 0,
realizando los cálculos respectivos, se tiene que la distribución posee media β−1 y
varianza β−2. El estimador de máxima verosimilitud asociado resulta en:
β̂ =
n∑n
i=1 xi
La distribución exponencial a menudo se utiliza en la modelación de riesgos de
seguros, debido a sus muchas y variadas propiedades matemáticas de fácil mane-
jo. Sin embargo, una desventaja de la distribución exponencial es que su densidad
disminuye monótonamente, una situación que puede no ser apropiada en algunas
situaciones prácticas [16].
2.3.4. Distribución Pareto
Se supone que una variable aleatoria X tiene una distribución exponencial con
media β−1, condicionada sobre β. Por su parte el parámetro β tiene por śı misma
una distribución Gamma (ver apartado 2.3.6). La distribución no condicional de X
es una mezcla y se le conoce como distribución Pareto. Se puede mostrar que si X
es una variable aleatoria exponencial y Y una variable aleatoria gamma, entonces
la variable X/Y tiene distribución Pareto [16].
La función de densidad y de distribución de una Pareto están dadas por:
f(x) =
αλα
(λ+ x)α+1
, x > 0
F (x) = 1−
(
λ
λ+ x
)α
, x > 0
20
2.3. MODELOS PARA LA SEVERIDAD MARCO TEÓRICO
La esperanza y varianza de dicha distribución, respectivamente, resultan en:
E(X) =
λ
α− 1
,
V ar(X) =
αλ2
(α− 1)2(α− 2)
Para esta distribución no existe una forma cerrada para expresar los estimadores
de máxima verosimilitud asociados, y solamente pueden ser evaluados de forma
numérica.
La ley de Pareto es muy útil para modelar la severidad de reclamos en segu-
ros, debido en gran parte a su cola extremadamente pesada, comparada con las
otras distribucines de esta sección. Su principal inconveniente radica en su falta
de trazabilidad matemática en algunas situaciones. Al igual que para la distribu-
ción log-normal, la transformación de Laplace no tiene una representación de forma
cerrada y la función generadora de momentos no existe. Además, al igual que la
exponencial, su densidad disminuye monótonamente, lo que puede no ser adecuado
en algunas situaciones prácticas [16].
2.3.5. Distribución Burr
La experiencia ha demostrado que la fórmula de la distribución Pareto es a me-
nudo apropiada para modelar la severidad de siniestros, particularmente cuando se
prevé que siniestros con una afectación económica grande puedan ocurrir. En al-
gunas ocasiones existe la necesidad de encontrar una distribución de cola pesada
con mayor flexibilidad que la de la ley de Pareto, incluyendo una función de densi-
dad no monótona[16]. Esa flexibilidad ya viene dada por la distribución Burr y su
parámetro adicional r > 0. Si Y sigue una distribución Pareto entonces la función
de distribución de X = Y 1/r se conoce como una distribución Burr.
Las funciones de densidad y de distribución respectivas son:
f(x) = rαλα
xr−1
(λ+ xr)α+1
, x > 0
F (x) = 1−
(
λ
λ+ xr
)α
, x > 0
21
2.3. MODELOS PARA LA SEVERIDAD MARCO TEÓRICO
Los estimadores de máxima verosimilitud sólo pueden ser evaluados de forma
numérica. Una variable Burr se puede generar usando el método de transformación
inversa. La función de distribución acumulada inversa tiene una forma anaĺıtica
F−1(x) =
[
λ{(1 − x)−1/α − 1}
]1/r.
. Se puede entonces establecer X =
{
λ(U−1/α −
1)
}1/r
, donde U sigue una distribución uniforme estándar[16].
Para esta distribución existe la media, pero la cola derecha es demasiado pesada,
la media muestral estará casi siempre por debajo de E(X).
2.3.6. Distribución Weibull
Si V es una variable aleatoria con distribución exponencial, la distribución de la
variable X = V 1/τ , τ > 0 se le conoce como distribución Weibull (o Frechet). Las
funciones de densidad y de distribución respectivas son:
f(x) = τβxτ−1e−βx
τ
, x > 0
F (x) = 1− e−βxτ , x > 0
El estimador de máxima verosimilitud sólo se puede evaluar de forma numérica
y al igual que la distribución Burr, se pueden generar observaciones de la variable
utilizando el método de la transformación inversa [16].
2.3.7. Distribución Gamma
Se tiene una distribución aleatoria X, con distribución gamma (o Pearson tipo
III) cuyas funciones de densidad y distribución respectivas son:
f(x) = β(βx)α−1
e−βx
Γ(α)
, x > 0
F (x) =
∫ x
0
β(βs)α−1
e−βs
Γ(α)
ds
Para β = 1, se conoce como función gamma incompleta, la integral a continuación:
Γ(α, x) =
1
Γ(α)
∫ x
0
sα−1e−sds
Si el parámetro α = 1 resulta en una distribución exponencial. Si α > 0, la dis-
tribución se cataloga como ley de Erlang. Si β = 1/2 y α = v/2 se habla de una
distribución chi-cuadrada (χ2) con v grados de libertad [16].
22
2.4. MODELO DE RIESGO COLECTIVO MARCO TEÓRICO
La media y la varianza resultan en:
E(X) =
α
β
V ar(X) =
α
β2
Sus estimadores de máxima verosimilitud sólo pueden evaluarse bajo métodos
numéricos. La distribución gamma es una de las más importantes para modelaciones
debido a sus propiedades matemáticas de fácil manejo. Es una distribución que se
utiliza bastante para formar otras distribuciones, sin embargo por śı sola no es una
fórmula razonable para modelar la severidad de reclamos[16].2.4. Modelo de Riesgo Colectivo
El modelo de riesgo colectivo es bien conocido en al área de las ciencias actua-
riales y se utiliza para ajustar la frecuencia y la severidad de forma independiente
y posteriormente obtener las pérdidas totales bajo un modelo agregado. Para este
modelo se considera un portafolio de pólizas de un mismo tipo.
Se denota por N el número total de reclamos que pueden generarse de un de-
terminado riesgo en un cierto peŕıodo de tiempo, y Zj, denota el monto de pérdida
producto de la ocurrencia del j-ésimo evento[?]. El monto de pérdida total bajo el
modelo agregado está dada por:
X =
N∑
j=1
Zj
Siendo X = 0 cuando N = 0. Los dos principales supuestos que se emplean en
este modelo son:
1. Los montos de pérdida Zj’s son variables aleatorias positivas independientes e
idénticamente distribuidas.
2. El número total de reclamos del peŕıodo es una variable aleatoria y es inde-
pendiente de los montos de las pérdidas Zj’s.
23
2.5. CONTEXTO BAYESIANO MARCO TEÓRICO
Bajo los supuestos definidos, la esperanza y la varianza del modelo agregado se
pueden descomponer en términos de las esperanzas y varianzas de los modelos indi-
viduales de frecuencia y severidad:
E(X) = E(E[X|N ]) = E(N)E(Z)
V ar(X) = E(V [X|N ]) + V (E[X|N ]) = E(N)V (Z) + [E(Z)]2V (N)
2.5. Contexto Bayesiano
El objetivo de este estudio, es utilizar la teoŕıa bayesiana con el fin de que, a
partir de la experiencia y supuestos sobre los parámetros involucrados, se puedan
desarrollar modelos que logren ajustar la natulareza de los datos con el panorama
que se cree que va a seguir la misma. Este análisis no comprende la forma tradi-
cional de ajustar una distribución de manera directa y tomarla como cierta para la
información.
La idea básica de las técnicas bayesianas, es que los parámetros desconocidos, de
las distribuciones involucradas en el modelo de ajuste, sean tratados como variables
aleatorias[5]. Una distribución de probabilidad provee la verosimilitud de que varios
posibles valores de dichos parámetros sean tomados como ciertos.
2.5.1. Modelo inicial
En el paradigma bayesiano, el interés es modelar tanto la distribución de los
datos X, aśı como la del parámetro desconocido θ, pues ambos se consideran como
variables aleatorias[17].
Supongamos que π(θ) contiene la información sobre el parámetro θ. Suponga que
tenemos un vector de n observaciones x̂ = (x1, x2, · · · , xn)T .
La verosimilitud se denota como f(x̂|θ) y describe la probabilidad de obtener
los valores de x̂ dado que θ es el parámetro verdadero. Por el teorema de Bayes, la
distribución posterior de θ es:
π(θ|x̂) = f(x̂|θ)π(θ)
f(x̂)
24
2.5. CONTEXTO BAYESIANO MARCO TEÓRICO
Donde π(θ) es la distribución previa y π(θ|x̂) es la distribución posterior del paráme-
tro θ
Observe que la distribución de θ se actualiza con la información que se va obte-
niendo según los datos que se recolectan, y tal proceso se ve reflejado en la distri-
bución posterior del parámetro.
Como f(x̂) no depende de θ, es suficiente considerar la forma funcional de:
π(θ|x̂) ∝ f(x̂|θ)π(θ)
Una vez con la distribución posterior, es posible hacer inferencia puntual sobre el
parámetro mediante alguna medida de tendencia central como la media o la moda,
o bien considerar intervalos de confianza.
Mediante la distribución previa π(θ) se pretende capturar el criterio experto y el
conocimiento previo que tenga la compañ́ıa aseguradora respecto al riesgo a tarifar.
Este proceso de actualización de la información por el método de Bayes se puede
repetir de manera continua, en cuyo caso la distribución posterior se convierte en la
distribución previa del nuevo modelo[5].
2.5.2. Modelo Jerárquico
Al modelo general detallado anteriormente, se le puede añadir un nivel interno de
análisis, produciendo lo que se conoce como un modelo jerárquico, una vez definida
la distribución previa del modelo básico, a los parámetros de dicha distribución se
les aplica el mismo procedimiento para conocer una previa nuevamente. Se detalla
la teoŕıa para el modelo de no regresión que comprende este estudio.
Se puede partir del modelo base[18]:
p(θ|datos) ∝ p(datos|θ)× p(θ)
La ecuación por śı misma revela una estructura jerárquica simple en los parámetros,
dado que indica que la distribución posterior para un parámetro es igual a una
probabilidad condicional de los datos bajo un parámetro (primer nivel) multiplicado
por la probabilidad marginal (previa) del parámetro (segundo nivel).
La estructura jerárquica definida para los parámetros no necesariamente debe
detenerse en ese modelo, sino que podŕıa continuar hasta niveles infinitos. Se supone
en este caso, que se tiene un modelo con una estructura jerárquica adicionando un
25
2.6. MODELOS COMPUESTOS PARA LA FRECUENCIA MARCO TEÓRICO
nivel superior. Se tienen J observaciones y1, ..., yJ y se asume que los datos están
distribuidos de acuerdo con una distribución Q con parámetro θ. Entonces:
yi ∼ Q(θ)
Se asume que los parámetros θ siguen una distribución común W con parámetro
γ (hiperparámetro), es decir:
θ ∼ W (γ)
La distribución posterior de todos los parámetros sigue la siguiente fórmula:
p(γ, θ|y) ∝ p(y|θ, γ)p(θ|γ)p(γ)
Para entender como trabaja esta estructura jerárquica, se nota que los últimos
dos términos [p(θ|γ)p(γ)], al multiplicarse, resultan en una distribución conjunta
para γ y θ: [p(θ, γ)]. Nos queda entonces una distribución marginal conjunta para
los dos parámetros, la cual se multiplica por la densidad de muestreo para los da-
tos [p(y|θ, γ)]. El teorema de Bayes indica que al multiplicar la densidad marginal
conjunta de los parámetros (θ) por la densidad de muestreo de los datos dados los
parámetros, se obtiene la densidad posterior de todos los parámetros[18].
La distribución marginal de γ, sobre la cual se enfoca este modelo, resulta en:
p(γ|y) ∝
∫
p(y|θ, γ)p(θ, γ)p(γ)dθ
La integral anterior se estima normalmente implementando los métodos MonteCarlo
(MCMC), los cuales son descritos más adelante.
2.6. Modelos compuestos para la frecuencia
En esta sección se documentan los modelos de distribución que se utilizarán
para ajustar la frecuencia de siniestros, aśı como los parámetros que deberán ser
analizados para incorporar el criterio experto en el desarrollo de la metodoloǵıa.
26
2.6. MODELOS COMPUESTOS PARA LA FRECUENCIA MARCO TEÓRICO
2.6.1. Distribución Binomial Negativa con parámetro r co-
nocido
Se define la distribución binomial negativa bajo los parámetros r y p =
β
1 + β
,
como sigue:
Pr(N = k) = pk =
Γ(k + r)
Γ(r)Γ(k + 1)
(
1
1 + β
)r(
β
1 + β
)k
,
= pk =
Γ(k + r)
Γ(r)Γ(k + 1)
(1− p)rpk,
Asumiento que se tiene un valor definido para r se procede a establecer como
previa para el parámetro p una distribución Beta con parámetros b y c, es decir:
f(p) =
pb−1(1− p)c−1
B(b, c)
, 0 < p < 1
Donde, B(α, β) =
∫ 1
0
xα−1(1− x)β−1dx =
Γ(α)Γ(β)
Γ(α + β)
es la función beta[19].
Para derivar la distribución posterior de p, se debe calcular primero la distribu-
ción conjunta de p y la muestra observada[19]. Entonces:
P (k1, ..., kT , p) =
T∏
i=1
Γ(ki + r)
Γ(ki + 1)Γr
pr(1− p)ni
=
pTr(1− p)
∑
ki
Γ(r)T
T∏
i=1
Γ(ki + r)
Γ(ki + 1)
Donde T es el número de peŕıodos de pérdida registrados en la muestra. Se multiplica
lo anterior por la distribución previa para p, y se obtiene la distribución conjunta
de la muestra observada y P :
P (k1, ..., kT , p) =
prT+b−1(1− p)
∑
ki+c−1
B(b, c)Γ(r)T
T∏
i=1
Γ(ki + r)
Γ(ki + 1)
27
2.6. MODELOS COMPUESTOS PARA LA FRECUENCIA MARCO TEÓRICO
La distribución de probabilidad para la muestra observada se obtiene integrando
el resultado anterior sobre el intervalo 0 < p < 1. Cuando la distribución conjunta
de las observaciones de la muestra y p se divide por la distribución marginal de la
muestra, se obtiene la distribución condicional de p dada la muestra observada[19].
Para este modelo se obtiene la siguiente distribución,que corresponde a la defi-
nida para una distribución posterior beta:
f(p|ki, ..., kT ) =
prT+b−1(1− p)
∑
ki+c−1∫ 1
0
prT+b−1(1− p)
∑
ki+c−1dp
=
prT+b−1(1− p)
∑
ki+c−1
B(rT + b,
∑
ki + c)
El estimador de Bayes para p es la media de la distribución posterior:
E(p|k1, ..., kT ) =
∫ 1
0
prT+b(1− p)
∑
ki+c−1dp
B(rT + b,
∑
ki + c)
=
B(rt+ b+ 1,
∑
ki + c)
B(rT + b.
∑
ki + c)
=
rT + b
rT + b+ c+
∑
ki
2.6.2. Binomial Negativa con ambos parámetros desconoci-
dos
La utilización de este modelo supone la obtención de las expresiones para E(rm|x)
y E(βm|x) bajo formas cerradas, lo cual es algo poco estudiado respecto a los paráme-
tros de la distribución binomial negativa.
Se considera una previa para el parámero β que cumpla lo siguiente:
p(β|δ1, δ2) ∝
(
β
β + 1
)δ1−1(
1
β + 1
)δ2−1
Si se toma la expresión 1/B(δi, δ2), se está ante una previa con distribución Beta
Prima[20]:
28
2.6. MODELOS COMPUESTOS PARA LA FRECUENCIA MARCO TEÓRICO
p(β|δ1, δ2) =
1
B(δi, δ2)
(
β
β + 1
)δ1−1(
1
β + 1
)δ2−1
, δ1, δ2 > 0
La media y la varianza de esta distribución son:
E(β) =
δ1
δ2 − 1
V ar(β) =
δ1(δ1 + δ2 − 1)
(δ2 − 1)2(δ2 − 2)
Se considera una previa para el parámetro r con la forma:
p(r|a, b, z1, z2) ∝
(r − z1)a
r − z2
b
La constante de proporcionalidad se toma como L1 =
Γ(b)(z1 − z2)b−a−1
Γ(b− a− 1)Γ(a+ 1)
, para
obtener una distribución previa Pearson 6[20]:
p(r|a, b, z1, z2) = L1
(r − z1)a
(r − z2)b
, b > a > 1, y r ≥ z1 ≥ z2
La media y la varianza de esta distribución son:
E(r) = z1 +
(z1 − z2)(a+ 1)
b− a− 2
V ar(r) =
(z1 − z2)2(a+ 1)(b− 1)
(b− a− 2)2(b− a− 3)
Definiendo por C1 =
∑n
i=1 xi + δ2 + 1, K1 = (δ1 + C1)/n y los coeficientes
polimoniales U1, ..., Um de la aproximación a la expresión del enésimo momento de
la posterior para r, se tiene:
E(rm|x) ≈
∑h
j=0 ajQj+m∑h
j=0 ajQj
29
2.6. MODELOS COMPUESTOS PARA LA FRECUENCIA MARCO TEÓRICO
Donde:
Qj =
f∑
l=0
Γ(C1 − j + l − 2)Γ(j + 1)Ul
Γ(C1 + l − 1)KC1−j+l−2)1 nl
Se tiene también que:
E(βm|x) ≈
nm∏m
l=1(Cl − l − 1)
∑h
j=0 ajR
m
j∑h
j=0 ajQj
Rmj =
f∑
l=0
Γ(C1 + l − j −m− 2)Γ(j + 1)V ml
Γ(C1 + l − k − 1)KC1+l−j−m−21 nl
Donde V k0 = 1 y V
m
1 , ..., V
m
f es un conjunto separado de coeficientes polinomiales
para cada uno de los k momentos de la distribución posterior de β.
Dado que la distribución del parámetro β toma una forma definida (no estándar)
se decide tomar la distribución de la sección anterior para el parámetro p =
1
1 + β
para temas de programación.
2.6.3. Distribución Poisson con previa Gamma
Con este modelo, se supone una distribución Gamma para el parámetro λ, es
decir:
p(λ|α, β) = β(βλ)α−1
e−βλ
Γ(α)
Realizando algunos cálculos, bajo el teorema de Bayes, se obtiene lo siguiente
para la distribución posterior:
p(λ|α, β, k) ∝
n∏
i=1
e−λλki
ki!
β(βλ)α−1
e−βλ
Γ(α)
Luego:
30
2.7. MODELOS COMPUESTOS PARA LA SEVERIDAD MARCO TEÓRICO
p(λ|α, β, k) ∝ λ
∑
ki+α−1e−(β+n)λ
Excepto por el factor proporcional, la distribución anterior es una Gamma con
parámetros α +
∑
ki y β + n.
2.7. Modelos compuestos para la severidad
En esta sección se documentan los modelos de distribución que se utilizarán para
ajustar la severidad de siniestros, aśı como los parámetros que deberán ser analizados
para incorporar el criterio experto en el desarrollo de la metodoloǵıa.
2.7.1. Lognormal con ambos parámetros desconocidos
Se parte de la definición que tenemos para la distribución lognormal con paráme-
tros µ y σ, como sigue:
fX(x) =
1
σ
√
2π
exp
{
−
(x− µ)2
2σ2
}
, −∞ < x <∞
Para este análisis consideremos una reparametrización de la distribución log-
normal, se define τ = σ2, donde σ es la desviación estándar en la parametrización
tradicional. Se tiene entonces una distribución lognormal LN(µ, τ), donde:
fX(x) =
1
√
2πτ
exp
{
−
(x− µ)2
2τ
}
, −∞ < x <∞
Se define una previa condicional bivariada para (µ, τ) como sigue[8]:
πln(µ, τ) = π(τ)π(µ|τ)
Donde π(τ) y π(µ/τ), son respectivamente, distribuciones denotadas por InvG(p, q/2)
y N(a, τ/b).
La densidad posterior para este caso resulta en:
πln ∝ A ·B · C
31
2.7. MODELOS COMPUESTOS PARA LA SEVERIDAD MARCO TEÓRICO
Donde:
A = InvGτ
(
m
2
+ p,
1
2
{
m∑
i=1
(ln(xi))
2 + a2b+ q −
(
∑m
i=1 ln(xi) + ab)
2
m+ b
})
B = Nµ|τ
(∑m
i=1 ln(xi) + ab
m+ b
,
τ
m+ b
)
C =
m∏
i=1
[
1− Φ
(
ln(xi)− µ√
τ
)]n
2.7.2. Exponencial con previa Gamma
Se parte de la distribución exponencial (con parámetro lambda):
f(x) = λe−λx, x > 0
Para la cual se supone una distribución Gamma para el parámetro λ, es decir:
f(λ|α, β, ) = β(βλ)α−1
e−βλ
Γ(α)
, λ > 0
La distribución posterior se puede ver como una función condicional sobre los
datos x:
p(λ|x) ∝
( βα
Γ(α)
λα−1e−βλ
)
(λne−λ
∑n
i=1 xi)
Realizando algunos cálculos se tiene:
p(λ|x) ∝ λn+α−1e−λ(
∑n
i=1 xi+β)
Del resultado anterior se concluye que la distribución posterior se puede expresar
como una distribución Gamma(n+ α,
∑n
i=1 +β)[7].
32
2.7. MODELOS COMPUESTOS PARA LA SEVERIDAD MARCO TEÓRICO
2.7.3. Pareto con ambos parámetros desconocidos
Se parte de la definición de la distribución Pareto realizada anteriormente, donde:
f(x) =
αλα
(λ+ x)α+1
, x > 0
Se realiza la siguiente reparametrización α =
1
ξ
y λ =
1
ξτ
, de modo que:
f(x|ξ, τ) =< τ(1 + τξ)−(1/ξ+1), x > 0
Para ξ > 0, se supone que los parámetros ξ y τ son independientes y siguen las
siguientes distribuciones[21]:
ξ ∼ Pareto I(a, c), a > 0, c > 0
τ ∼ Gamma(a1, b1), a1 > 0, b1 > 0
En donde la distribución Pareto I, utilizada como previa, tiene densidad:
p(ξ|a, c) = acaξ−(a+1), ξ > c, a > 0, c > 0
La ventaja de trabajar con estas previas es que el parámetro ξ tiene un ĺımi-
te inferior positivo c, esto evita el problema en las simulaciones cuando se tienen
muestras pequeñas con parámetros relativamente cercanos a cero[21].
Para la distribución posterior se tiene:
p(ξ, τ |x) ∝ l(x|ξ, τ)p(ξ)p(τ)
p(ξ, τ |x) ∝ τn+a1−1ξ−(a+1)exp
[
−
(
1 +
1
ξ
)
n∑
i=1
ln(1 + τξxi)− b1τ
]
I(τ > 0)I(ξ > 0)
Esto indica que no se puede obtener la posterior mediante una forma cerrada, el
método de muestreo de Gibbs es utilizado para obtener muestras de la distribución
posterior[21].
33
2.7. MODELOS COMPUESTOS PARA LA SEVERIDAD MARCO TEÓRICO
2.7.4. Weibull con parámetro de forma conocido
Cuando el parámetro de forma τ es conocido, el parámetro de escala β tiene una
previa conjugada Gamma[6], es decir:
π(β|a, b) =
ba
Γ(a)
βa−1e−bβ β > 0
Para la distribución posterior se tiene:
π(β|τ, x) ∝ βa+n−1e−β(
∑n
i=1 x
τ
i +b)
La distribución posterior corresponde a una Gamma, el estimador respectivo es:
β̂ =
a+ n∑n
i=1 x
τ
i + b
2.7.5. Previas para la distribución Gamma
Una previa conjugada bastante conocida para el parámetro R = 1/β, es una
distribución Gamma usando los parámetros d y e[22]. Es decir:
p(R|d, e) = e(eR)d−1
e−eR
Γ(d)
Dado el vector de observaciones k, y multiplicando la verosimilitud Gamma por
la previa definida en el paso anterior, se obtiene la distribución posterior, q(β) ∼
Gamma(d̂, ê), donde:
d̂ = d+ nα, ê = e+
n∑
i=1
ki
La esperanza posterior resulta entonces en:
R̂ = d̂ · ê
La previa no normalizada que se utiliza para el parámetro α de la distribución
Gamma tiene la forma[22]:
34
2.7. MODELOS COMPUESTOS PARA LA SEVERIDAD MARCO TEÓRICO
p(α|a, b, c) ∝
aα−1Rac
Γ(α)b
En este caso existen tres hiperparámetros a, b, c ∈ R+.
Dado el vector de observaciones y, se multiplica la función de verosimilitud Gam-
ma por la previa para obtener una expresión para q(α):
q(α) ∝
âα−1Raĉ
Γ(α)b̂
Donde:
â = a
n∏
i=1
yi
b̂ = b+ n
ĉ = c+ n
Para efectos de los modelos definidos para frecuencia y severidad en este es-
tudio se utilizará una distribución previa exponencial para el parámetro α de las
distribuciones Gamma presentadas, ambas distribuciones suelen combinarse dado
que pertenecen a la familia exponencial.
2.7.6. Algoritmo básico Metropolis-Hastings
Dada una función dedensidad objetivo f , se construye un núcleo de Markov
K con distribución estacionaria f y luego se genera una cadena de Markov (X(t))
usando ese núcleo de forma que la distribución ĺımite de X(t) es f y las integrales
pueden ser aproximadas de acuerdo con el teorema ergódico[23].
La función f se asocia con una densidad condicional funcional q(y|x), los únicos
requerimientos sobre esta densidad son que la razón f(y)/q(y|x) es conocida hasta
una constante independiente de x y que q(·|x) tiene suficiente dispersión para llevar
a una exploración de todo el soporte de la función f .
35
2.7. MODELOS COMPUESTOS PARA LA SEVERIDAD MARCO TEÓRICO
El algoritmo Metropolis-Hastings asociado a la función de densidad objetivo f
y a la función de densidad condicional q produce una cadena de Markov (X(t)) bajo
el siguiente núcleo de trancisión[23]:
Algoritmo 1: Metropolis-Hastings
Dado x(t),
1. Genere Yt ∼ q(y|x(t)).
2. Tome
X(t+1) = Yt con probabilidad ρ(x
(t), Yt)
X(t+1) = x(t) con probabilidad 1− ρ(x(t), Yt)
Donde:
ρ(x, y) = min
{
f(y)
f(x)
q(x|y)
q(y|x)
, 1
}
2.7.7. Método de muestreo de Gibbs
Los métodos de muestreo basados en las técnicas Markov Chain Monte Carlo
(MCMC) son una v́ıa posible para hacer inferencia respecto a este tipo de modelos[24].
De esta manera se puede estimar la esperanza de la posterior aplicando un promedio
simple sobre las muestras, se puede calcular cualquier estad́ıstico de la distribución
posterior conforme al número de muestras:
E[f(s)]p ≈
1
N
N∑
i=1
f(s(i))
Donde P es la distribución posterior respectiva, f(s) es la esperanza deseada, y
f(s(i)) es la i− esima simulación de P [24].
Se supone que, para algún valor p > 1, se tiene la variable aleatoria X =
(X1, ..., Xp) y las densidades condicionales asociadas f1, ..., fp, de forma que se puede
simular:
Xi|x1, x2, ..., xi−1, xi+1, ..., xp ∼ fi(xi|x1, x2, ..., xi−1, xi+1, ..., xp) para i = 1, 2, ..., p
Las densidades f1, ..., fp se denominan como condicionales completas y una carac-
teŕıstica particular del muestreo de Gibbs es que solo estas densidades son utilizadas
en el proceso de simulación[23].
El algoritmo de muestreo de Gibbs relacionado con el modelo se muestra en la
siguiente trancisión de X(t) a X(t+1)[23]:
36
2.7. MODELOS COMPUESTOS PARA LA SEVERIDAD MARCO TEÓRICO
Algoritmo 2: Muestreo de Gibbs
En cada iteración t = 1, 2, ..., dado x(t) = (x
(t)
1 , ..., x
(t)
p ), se genera,
1. X
(t+1)
1 ∼ f1(x1|x
(t)
2 , ..., x
(t)
p );
2. X
(t+1)
2 ∼ f2(x2|x
(t)
1 , x
(t)
3 , ..., x
(t)
p );
...
3. X
(t+1)
p ∼ fp(xp|x(t)1 , ..., x
(t)
p−1);
2.7.8. Criterio de Información de Devianza (DIC)
Se considera un modelo de probabilidad p(y|θ) con una muestra de observacio-
nes y = (y1, ..., yn) y unos parámetros desconocidos denotados por θ, el criterio de
información de devianza se define como[26]:
DIC := E[D(y, θ|y)] + pD
En este modelo se tiene que p(y, θ) = −2log(p(y|θ)) y la media de la distribución
posterior D(y, θ), E[D(y, θ|y)] se obtiene como:
D̂avg(y) =
1
L
L∑
l=1
D(y, θ)
Además, pD es el número efectivo de parámetros, el cual mide la complejidad del
modelo, y se estima como sigue:
pD := D̂avg −Dθ̂(y)
Donde:
Dθ̂(y) = −2log{p(y|θ)}+ 2log{f(y)}
El número efectivo de parámetros contempla la precisión entre la probabilidad
y la precisión en la parte posterior y solo puede considerarse una medida apropiada
de la complejidad de un modelo que describe razonablemente los datos[25].
En temas de comparación se prefiere utilizar el modelo que minimice el valor del
criterio DIC.
37
2.8. CÁLCULO DE PRIMAS MARCO TEÓRICO
2.7.9. Medidas del error en cadenas de Markov
Al utilizar el paquete coda en RStudio, se obtienen una serie de estimadores,
para cada ajuste de modelo de Bayes a realizar, respecto al error computacional en
la cadena de Markov para la estimación de la distribución posterior en el modelo de
Bayes. Entre los resultados obtenidos se tienen dos estimadores del error estandar,
cuyos nombres en inglés son Naive Standard Error (SENaive) y Time-Series Standard
Error (SEts). Revisando la documentación de la funciones del paquete Coda[27] se
define el primer estimador como:
SENaive =
√
V ar(X)
C · S
En donde C es el número de cadenas que se ejecutan, X = {Xc} es el vector de las
muestras de la distribución posterior para un determinado parámetro (concatenación
de todas las cadenas, c ∈ 1, ..., C) y S es el número de iteraciones de cada cadena.
También se define el error estandar de serie de tiempo como:
SEts =
√
V arts(X)
C · S
En donde V arts(X) es el promedio de los V arts(X
(c))(c) para cada ser de muestras
X(c) y cada V arts(X
(c))(c) es obtenida al aplicar la función ar para obtener un
modelo autoregresivo sobre X(c).
2.8. Cálculo de primas
A partir del modelo de riesgo colectivo definido anteriormente, en donde el monto
de la pérdida total bajo el modelo agregado está dada por:
X =
N∑
j=1
Zj
Donde Zj denota el monto de pérdida debido a la ocurrencia del j-ésimo evento.
Se pueden implementar diferentes modelos de cálculo de prima, cada uno con un
enfoque diferente sobre el monto de prima que se debe destinar a cubrir el monto
agregado de las reclamaciones[9].
38
2.8. CÁLCULO DE PRIMAS MARCO TEÓRICO
• Prima Neta:
H1(θ) = EθX = EθN · EZ1 = θµ,
Donde µ = EZ1 y θ = EθN .
• Prima bajo el principio de varianza con coeficiente η > 0
H2(θ) = EθX + ηV arθX
= θ(µ+ η(σ2 + µ2))
Donde σ2 = V arZ1 y µ = EZ1
• Prima de Esscher con coeficiente ν > 0, se utilizan las igualdades siguientes:
Eθ(e
νX) = Eθ
[(
EeνZ1
)N]
= eθ(MZ1 (ν)−1)
y
Eθ(Xe
νX) = E
(
Z1e
νZ1
)
Eθ
[
N ·
(
EeνZ1)N−1
]
= E
(
Z1e
νZ1
)
θeθ(MZ1 (ν)−1)
En donde MZ(ν) denota la función generadora de momentos para la variable
aleatoria Z en un punto ν, luego la prima de Esscher se calcula como sigue[9]:
H3(θ) =
Eθ
(
XeνX
)
Eθ
(
eνX
)
= E
(
Z1e
νZ1
)
θ
• Prima exponencial con coeficiente ζ > 0:
H4(θ) =
1
ζ
lnEθe
ζX
=
1
ζ
θ(MZ1(ζ)− 1)
39
2.8. CÁLCULO DE PRIMAS MARCO TEÓRICO
En donde MZ1 en la función generadora de momentos de la variable aleatoria
Z1.
En todos los casos se obtiene una prima que es una función lineal del parámetro
desconocido θ[9].
40
CAPÍTULO 3
Metodoloǵıa
Se adoptará la siguiente estructura metodológica para el ajuste del modelo. Los
datos correponden a las bases de siniestros pagados entre los años 2010 y 2019,
y amparados por el seguro de Aviación del Instituto. Se considera una ĺınea de
seguro objetivo en este estudio dado que el producto de aviación en el INS presenta
coberturas y/o clases tarifarias para las cuales no se tienen datos de siniestralidad
y por consiguiente es necesario establecer un modelo que permita incorporar esta
incertidumbre.
Para el modelo general se tomarán los datos de siniestros pagados ligados a
coberturas de daño directo en el seguro de aviación. Como un primer acercamiento
es necesario estudiar la cantidad de siniestros ocurridos por trimestre y por año,
para efectos de medir y establecer modelos de frecuencia con una mayor cantidad de
observaciones, aśı como los montos totales de pérdida para los modelos de severidad.
En cuanto al criterio experto para establecer las distribuciones previas, el Insti-
tuto cuenta con un gran profesional en la materia del seguro de aviación, el señor
Mario Jiménez, evaluador experto en los riesgos de la ĺınea de aviación. Se reali-
zaron entrevistas v́ıa correo con el fin de obtener valores estad́ısticos y percentiles
sobre la distribución de frecuencia anual de siniestros y la distribución de los montos
individuales de siniestros, de acuerdo con su visión del riesgo analizado.
La definición de todos los modelos, y la obtención de datos puntuales y simula-
ciones de resultados se implemantaron en la herramienta libre RStudio utilizando
los paquetes R2Openbugs[28] y Coda [29]para hacer un enlace con la herramienta
OpenBugs, en la cual se definen directamente las distribuciones en cada escenario

Continuar navegando