Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Universidad de Costa Rica Facultad de Ciencias Escuela de Matemática Trabajo final de graduación para optar por el grado de licenciatura en Ciencias Actuariales APLICACIÓN DE LA TEORÍA BAYESIANA EN LA TARIFACIÓN DEL SEGURO DE AVIACIÓN Siviany Gerardo Araya Vargas San José, Costa Rica. 2021 Aplicación de la teoría bayesiana en la tarifación del seguro de aviación. Trabajo final de graduación sometido y aceptado por el Tribunal del trabajo final de graduación como requisito para optar por el grado de licenciatura en Ciencias Actuariales. Tribunal Examinador Dr. Álvaro Guevara Villalobos Presidente del Tribunal Director del Trabajo Lector M.Sc. Rodrigo Arias López Lector Miembro del Tribunal, Lector externo Siviany Gerardo Araya Vargas Candidato El presente trabajo de investigación lo dedico al Ser Supremo que gobierna todo lo que existe, quien me ha brindado sabiduŕıa para desarrollar nuevos conocimientos, enerǵıa para vivir y amar la ciencia. A mi madre y a mi padre, por su ejemplo y entrega en cada etapa de mi vida, a mi t́ıa por darme un horizonte, a toda mi familia por su apoyo incondicional. A mi compañero de aventuras, quien me dio palabras de aliento en cada momento de frustración, quien sonrió a mi lado en cada momento de aciertos. A la vida misma. I Agradecimientos Deseo brindar un agradecimiento profundo a mi tutor PhD. Luis Barboza, profe- sor e investigador de la Universidad de Costa Rica, quien con su amplio conocimiento en la estad́ıstica bayesiana se dedicó a conducir mi proyecto para lograr los objetivos planteados en cada etapa del mismo. Un agradecimiento especial a mi Alma Mater, la Universidad de Costa Rica, a todos los profesores que me transmitieron sus conocimientos y en general, al sistema de Educación Pública de Costa Rica que permitió que este sueño de vida fuera posible desde sus ráıces. Agradezco a las jefaturas y colaboradores del Instituto Nacional de Seguros, que permitieron desarrollar mi proyecto con la información y herramientas que fueron necesarias. Un agradecimiento fraterno a toda mi familia, en especial a mi madre, por ser mi motor de vida. II Resumen El proceso de tarifación en las compañ́ıas de seguros, se basa generalmente en los datos de las pérdidas para medir su cuant́ıa y relación existente con los montos expuestos de la cartera del seguro espećıfico. Esto no es posible para nuevos riesgos o productos de seguros donde los datos de pérdidas son escasos o no están disponibles. En el marco de la normativa creada por la Superintendencia General de Seguros en Costa Rica, las compañ́ıas deben investigar y/o desarrollar teoŕıa para incorpo- rarla dentro de la nota técnica, creando sustento técnico para utilizar correctamente la poca información existente y permitiendo, bajo un análisis de sensibilidad, regis- trar bajo una base sólida y en un contexto realista, tarifas que se catalogan como experimentales. Las tarifas experimentales se establecen subjetivamente con poca o ninguna justificación actuarial y se ajustan con la experiencia de años posterio- res, que podŕıa representar inadecuadamente la distribución natural de los siniestros asociados al producto. En el contexto de la estad́ıstica bayesiana, podemos encontrar una gran cantidad de modelos que permiten obtener una prima de riesgo con base en el conocimiento de expertos del área de suscripción y otras dependencias que manejan información del seguro de aviación. Por lo tanto, en la presente tesis se propone incorporar la opinión de los profesionales en materia del seguro de aviación del Instituto Nacional de Seguros dada la escasez de información relevante para medir todos y cada uno de los eventos que generen una pérdida para la compañ́ıa, asociados a los riesgos asumidos por la misma en esa ĺınea de seguros con un riesgo potencial elevado. Un enfoque bayesiano permite añadir complejidad a la forma de tarifar estos seguros, generando primas de riesgo con una base más solida y en un contexto más realista. Estos modelos podŕıan ser incorporados en las notas técnicas, apoyando no solo a la aseguradora, sino también al regulador en su gestión de asegurar la estabilidad de las compañ́ıas y su responsabilidad frente a los asegurados que están expuestos a riesgos y esperan ser indemnizados ante los eventos que puedan acaecer. III Abstract The pricing process in the Insurance Companies, is mainly based on loss data to measure their amount and relationship with respect to the exposed amounts of the specific insurance portfolio. This aproach is not possible for new risks or insurance products where loss data is scarce or unavailable. In the regulation created by the Superintendencia General de Seguros in Costa Rica, the companies must investigate and develop sustainable theory to incorporate it into the technical note, creating technical support for correctly utilize the little existing information and allowing, under a sensitivity analysis, to register on a solid basis and in a realistic context, quotes that are classified as experimental. Expe- rimental quotes are subjectively established with little or no actuarial justification and adjust with the experience of later years, even the latter being, possibly not representative of the distribution of the associated claims to the product. In the context of bayesian statistics, we can find a wide range of models to be used for obtaining a risk premium based on the knowledge of expert underwriters and other technicians who study day-to-day aviation insurance. It is proposed to incorporate the opinion of the professionals in the aviation insurance at Instituto Nacional de Seguros, given the lack of relevant information to measure each and every one of the events that can trigger a loss for the company, associated with the risks assumed by it in this insurance line with a high potential risk. A bayesian approach allows to add a special complexity to the way in which these insurances are priced, generating risk premiums with a more solid base and in a more realistic context. These could be incorporated in the technical notes of the products under study, giving a technical support not only the insurer, but also the regulator that helps it in its function of taking care of the stability of the companies and their responsibility to the insured people who are exposed to risks and who expect to be compensated for the events that may occur. IV Índice general Agradecimientos II Resumen III Abstract IV Índice general V Lista de figuras IX Índice de figuras IX Lista de tablas XI Índice de cuadros XI 1. Introducción 1 1.1. Justificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2. Planteamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3. Objetivo General . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.4. Objetivos Espećıficos . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 V ÍNDICE GENERAL ÍNDICE GENERAL 1.5. Antecedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 2. Marco Teórico 6 2.1. Seguro de Aviación . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2.2. Modelos para el número de siniestros . . . . . . . . . . . . . . . . . . 8 2.2.1. Definición de frecuencia . . . . . . . . . . . . . . . . . . . . . 8 2.2.2. Método tradicional . . . . . . . . . . . . . . . . . . . . . . . . 8 2.2.3. Ajuste de distribución por Máxima Verosimilitud . . . . . . . 8 2.2.4. Distribución binomial negativa . . . . . . . . . . . . . . . . . . 9 2.2.5. Distribución Poisson . . . . . . . . . . . . . . . . . . . . . . . 11 2.2.6. Regresión Binomial Negativa Inflada con Ceros . . . . . . . . 13 2.2.7. Regresión Poisson Inflada con Ceros . . . . . . . . . . . . . . . 16 2.3. Modelos para la severidad . . . . . . . . . . . . . . . . . . . . . . . . 18 2.3.1. Distribución Emṕırica . . . . . . . . . . . . . . . . . . . . . . 182.3.2. Distribución Log-normal . . . . . . . . . . . . . . . . . . . . . 19 2.3.3. Distribución Exponencial . . . . . . . . . . . . . . . . . . . . . 20 2.3.4. Distribución Pareto . . . . . . . . . . . . . . . . . . . . . . . . 20 2.3.5. Distribución Burr . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.3.6. Distribución Weibull . . . . . . . . . . . . . . . . . . . . . . . 22 2.3.7. Distribución Gamma . . . . . . . . . . . . . . . . . . . . . . . 22 2.4. Modelo de Riesgo Colectivo . . . . . . . . . . . . . . . . . . . . . . . 23 2.5. Contexto Bayesiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 2.5.1. Modelo inicial . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 2.5.2. Modelo Jerárquico . . . . . . . . . . . . . . . . . . . . . . . . 25 2.6. Modelos compuestos para la frecuencia . . . . . . . . . . . . . . . . . 26 2.6.1. Distribución Binomial Negativa con parámetro r conocido . . 27 VI ÍNDICE GENERAL ÍNDICE GENERAL 2.6.2. Binomial Negativa con ambos parámetros desconocidos . . . . 28 2.6.3. Distribución Poisson con previa Gamma . . . . . . . . . . . . 30 2.7. Modelos compuestos para la severidad . . . . . . . . . . . . . . . . . 31 2.7.1. Lognormal con ambos parámetros desconocidos . . . . . . . . 31 2.7.2. Exponencial con previa Gamma . . . . . . . . . . . . . . . . . 32 2.7.3. Pareto con ambos parámetros desconocidos . . . . . . . . . . . 33 2.7.4. Weibull con parámetro de forma conocido . . . . . . . . . . . 34 2.7.5. Previas para la distribución Gamma . . . . . . . . . . . . . . 34 2.7.6. Algoritmo básico Metropolis-Hastings . . . . . . . . . . . . . . 35 2.7.7. Método de muestreo de Gibbs . . . . . . . . . . . . . . . . . . 36 2.7.8. Criterio de Información de Devianza (DIC) . . . . . . . . . . . 37 2.7.9. Medidas del error en cadenas de Markov . . . . . . . . . . . . 38 2.8. Cálculo de primas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3. Metodoloǵıa 41 4. Análisis Descriptivo 47 4.1. Base de Siniestros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 4.2. Frecuencia Observada . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 4.3. Severidad Observada . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 4.4. Método Frecuentista . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 4.4.1. Análisis Determińıstico . . . . . . . . . . . . . . . . . . . . . . 51 4.4.2. Ajuste de distribuciones . . . . . . . . . . . . . . . . . . . . . 52 5. Ajuste Modelos de Frecuencia 55 5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 5.2. Modelo F1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 VII ÍNDICE GENERAL ÍNDICE GENERAL 5.3. Modelo F2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 5.4. Modelo F3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 5.5. Modelo óptimo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 6. Ajuste Modelos de Severidad 63 6.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 6.2. Modelo S1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 6.3. Modelo S2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 6.4. Modelo S3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 6.5. Modelo S4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 6.6. Modelo S5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 6.7. Modelo S6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 6.8. Modelo S7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 6.9. Modelo S8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 6.10. Modelo S9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 6.11. Modelo S10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 6.12. Modelo óptimo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 7. Modelo y Tarifación 79 7.1. Modelo Seleccionado . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 7.2. Tarifación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 Bibliograf́ıa 93 VIII Índice de figuras 4.1. Siniestros Pagados por Trimestre de Estudio . . . . . . . . . . . . . . 48 4.2. Histograma de la Cantidad de Siniestros Pagados por Trimestre . . . 48 4.3. Boxplot de Montos Pagados por Siniestros y sus Logaritmos . . . . . 50 4.4. Histogramas de los Montos Pagados por Siniestros y sus Logaritmos . 50 4.5. Comparación entre distribución de frecuencia emṕırica y ajustada . . 52 4.6. Gráfico cuantil-cuantil para distribuciones de severidad ajustadas . . 53 5.1. Traza de las realizaciones del parámetro λ, Modelo F2, CV=20 . . . . 60 5.2. Densidad posterior del parámetro λ, Modelo F2 CV=20 . . . . . . . . 60 5.3. Comportamiento de la autocorrelación, Modelo F2 CV=20 . . . . . . 61 5.4. Convergencia del diagnóstico Gelman-Rubin para λ, Modelo F2 CV=20 61 5.5. Histograma del parámetro λ del Modelo F2, CV=20 . . . . . . . . . . 62 6.1. Traza del parámetro α del modelo S10, CV=20 . . . . . . . . . . . . 71 6.2. Traza del parámetro R del modelo S10, CV=20 . . . . . . . . . . . . 71 6.3. Traza del hiperparámetro R del modelo S10, CV=20 . . . . . . . . . 72 6.4. Densidad posterior del parámetro α, Modelo S10 CV=20 . . . . . . . 72 6.5. Densidad posterior del parámetro R, Modelo S10 CV=20 . . . . . . . 73 IX ÍNDICE DE FIGURAS ÍNDICE DE FIGURAS 6.6. Densidad posterior del hiperparámetro R, Modelo S10 CV=20 . . . . 73 6.7. Gráfico de autocorrelación del parámetro α, Modelo S10, CV=20 . . 74 6.8. Gráfico de autocorrelación del parámetro R, Modelo S10, CV=20 . . 74 6.9. Gráfico de autocorrelación del hiperparámetro R, Modelo S10 CV=20 75 6.10. Convergencia del diagnóstico Gelman-Rubin del parámetro α . . . . . 75 6.11. Convergencia del diagnóstico Gelman-Rubin del parámetro R . . . . . 76 6.12. Convergencia del diagnóstico Gelman-Rubin del hiperparámetro R . . 76 6.13. Histograma del parámetro α del modelo S10, CV=20 . . . . . . . . . 77 6.14. Histograma del parámetro R del modelo S10, CV=20 . . . . . . . . . 78 6.15. Histograma del hiperparámetro R del modelo S10, CV=20 . . . . . . 78 7.1. Histograma de la pérdida anual esperada del modelo de riesgo colectivo 80 8.1. Escenarios del modelo F1, definido con la libreŕıa R2OpenBUGS . . . 85 8.2. Escenarios del modelo F2, definido con la libreŕıa R2OpenBUGS . . . 85 8.3. Escenarios del modelo F3, definido con la libreŕıa R2OpenBUGS . . . 86 8.1. Modelos de Severidad S1 definidos con la libreŕıa R2OpenBUGS . . . 87 8.2. Modelos de Severidad S2 definidos con la libreŕıa R2OpenBUGS . . . 87 8.3. Modelos de Severidad S3 definidos con la libreŕıa R2OpenBUGS . . . 88 8.4. Modelos de Severidad S4 definidos con la libreŕıa R2OpenBUGS . . . 88 8.5. Modelos de Severidad S5 definidos con la libreŕıa R2OpenBUGS . . . 88 8.6. Modelos de Severidad S6 definidos con la libreŕıa R2OpenBUGS . . . 89 8.7. Modelos de Severidad S7 definidos con la libreŕıa R2OpenBUGS . . . 89 8.8. Modelos de Severidad S8 definidos con la libreŕıa R2OpenBUGS . . . 90 8.9. Modelos de Severidad S9 definidos con la libreŕıa R2OpenBUGS . . . 90 8.10. Modelos de Severidad S10 definidos con la libreŕıa R2OpenBUGS . . 91 8.1. Modelo de Riesgo Colectivo definido con la libreŕıa R2OpenBUGS . . 92 X Índice de cuadros 3.1. Esquema de modelos para la frecuencia escritura amplia . . . . . . . 42 3.2. Esquema de modelos para la severidad (A) . . . . . . . . . . . . . . . 43 3.3. Esquema de modelos para la severidad (B) . . . . . . . . . . . . . . . 44 4.1. Resultados bondad de ajuste χ2 . . . . . . . . . . . . . . . . . . . . . 52 4.2. Resultados criterios de ajuste distribuciones de severidad . . . . . . . 54 4.3. Resultados del modelo de riesgo colectivo con tarifacióntradicional . 54 5.1. Estad́ısticos relacionados a cada modelo de frecuencia ajustado . . . . 59 5.2. Estad́ısticos relacionados a cada parámetro del modelo ajustado . . . 62 6.1. Estad́ısticos relacionados a cada modelo de severidad ajustado . . . . 70 6.2. Estad́ısticos relacionados a cada parámetro del modelo ajustado . . . 77 7.1. Escenarios de prima de riesgo para diferentes parámetros establecidos 81 CAPÍTULO 1 Introducción 1.1. Justificación Las compañ́ıas de seguros están desarrollando constantemente nuevos productos de seguros generales (daños), respondiendo a necesidades del mercado: intermedia- rios, clientes externos, clientes internos o motivaciones poĺıticas o económicas. Para inscribir el producto ante el regulador es necesario diseñar una nota técnica, que en el caso de Costa Rica, corresponde a un documento formal solicitado por la Superintendencia General de Seguros (SUGESE) de acuerdo con lo establecido en el Reglamento sobre Autorizaciones, Registros y Requisitos de Funcionamiento [1]. La nota técnica contiene los modelo y parámetros técnicos para la definición de la estructura tarifaria y de coberturas del producto, en términos generales, aśı como un resumen de la documentación contractual sobre la cual se regulan las condiciones generales con las cuales el asegurado tiene conocimiento del contrato de seguro celebrado. A nivel de nota técnica es necesario medir el nivel de riesgo asociado al producto, aśı como las causas, las formas de clasificarlos y la manera en que pueden verse dis- minuidos, con el fin de generar un menor impacto a los asegurados y a las compañ́ıas de seguro, y con ello representar los números en una cantidad que deben cobrar las aseguradoras para cubrir los riesgos asegurables de manera suficiente y estable a lo largo del tiempo. En resumen, se debe determinar una prima pura asociada al riesgo a la cual se le incorporan una serie de recargos para considerar los gastos de administración, los gastos que se producen al generar los contratos, el margen de utilidad esperado, y otros gastos que interfieren en el costo del seguro. En el Instituto Nacional de Seguros existen ĺıneas de seguros en donde la in- 1 1.1. JUSTIFICACIÓN INTRODUCCIÓN formación estad́ıstica de siniestros es escasa para poder determinar una función de distribución que se pueda ajustar a la realidad, estos datos contienen información valiosa sobre los eventos más probables y no reflejan los eventos catastróficos o de mayor severidad, dado que corresponden a ĺıneas de seguro que potencialmente re- presentan una elevada severidad, pero una baja frecuencia. Los seguros de aviación contemplan coberturas de daño directo y de responsabilidad civil, en este tipo de seguros se cuenta con información estad́ıstica, pero se considera insuficiente para establecer la exposición real a la que puede verse enfrentada la compañ́ıa de seguros por los eventos que puedan generarse. En Costa Rica se han registrado casos importantes de cáıda de aeroplanos; entre los eventos de mayor trascendencia se pueden mencionar las tragedias del Vuelo 9916 de Nature Air en 2017, y el Vuelo 32 de Sansa en 1990. Estos eventos potenciales que podŕıan estar asociados a la cartera del Instituto pueden ser amparados por contratos de reaseguro a nivel internacional o bien pueden asumidos en su totalidad por la compañ́ıa aseguradora, en cualquier caso, es importante medir la vulnerabilidad y el nivel de riesgo que existe, dentro del plan de sostenibilidad financiera de la institución. Tradicionalmente, las compañ́ıas de seguros miden los niveles de siniestros y montos asegurados expuestos para establecer una prima de riesgo, cuando no existe información generalmente se recurre a primas experimentales las cuales deben ser ajustadas cada cierto peŕıodo midiendo la suficiencia de las primas cobradas. Debido a que estos modelos de tarifación experimental no cuentan con suficiente respaldo técnico, se expone a las aseguradoras y a los asegurados a un riesgo de insu- ficiencia tarifaria o de sobreprecio. Sumado a estas preocupaciones, cabe mencionar que en Costa Rica el mercado de seguros se aperturó en la última década, y las exigencias del mercado no permiten tener movimientos abruptos en las cantidades cobradas a los asegurados. Se busca entonces enfocar los esfuerzos a determinar tari- fas que contemplen otro tipo de información disponible en adición a la de siniestros y asi evitar el registro de seguros cuyas primas se definieron sin ninguna justificación actuarial de fondo. En el Instituto Nacional de Seguros, la aplicación de la teoŕıa bayesiana en los procesos de tarifación no ha sido la práctica, esta rama de la estad́ıstica permite incorporar información bajo criterio experto en un contexto de formalidad, dentro de la cual existen múltiples modelos que pueden ser utilizados para atender este tipo de circunstancias. Es necesario explorar otros mecanismos para medir el riesgo, en donde se pueda considerar el criterio de profesionales que han trabajado ese tipo de seguros durante varios años, buscando teoŕıa aplicable que permita ajustar la distribución de la frecuencia de siniestros y de la severidad de los mismos, de una manera más técnica. 2 1.2. PLANTEAMIENTO INTRODUCCIÓN 1.2. Planteamiento Con este trabajo se pretende tarifar productos de ĺıneas de seguros con riesgos potenciales, inicialmente con el estudio particular de la ĺınea de aviación que cuentan con información histórica de siniestros muy escasa o insuficiente para la distribución de siniestros que mejor se ajuste a la realidad, contemplando todos aquellos even- tos posibles y que potencialmente pueden generar pérdidas económicas al Instituto Nacional de Seguros. 1.3. Objetivo General Desarrollar una nueva metodoloǵıa de tarifación para las coberturas del seguro de aviación del Instituto Nacional de Seguros madiante la exploración y aplicación de modelos bayesianos, utilizando información previa de profesionales expertos de la institución, con el fin de brindar un enfoque técnico a ĺıneas de seguros generales que presentan poca información estad́ıstica y cuyas tarifas deben ser suficientes para cubrir todos los riesgos esperados. 1.4. Objetivos Espećıficos 1. Analizar los modelos de Bayes para la frecuencia de siniestros que se han utili- zado en otras investigaciones y realizar un proceso de optimización, escogiendo un modelo que permita contemplar la cantidad de riesgos que se presentaŕıan en un umbral de tiempo definido, por eventos que afecten la ĺınea de Aviación del INS. 2. Analizar los modelos de Bayes para la severidad como recopilación de varias investigaciones y realizar un proceso de optimización, escogiendo el modelo más adecuado para medir los montos de pérdidas individuales que se estaŕıan presentando ante riesgos materializados y amparados bajo las coberturas del producto de aviación del INS. 3. Conformar un modelo de riesgo colectivo y determinar la distribución de las pérdidas acumuladas en un peŕıodo anual, e incorporar los componentes ac- tuariales de la tarifación tradicional en seguros con el fin de obtener una tarifa comercial para el producto con base en la distribución posterior del modelo general. 3 1.5. ANTECEDENTES INTRODUCCIÓN 1.5. Antecedentes El método clásico de tarifación, conocido por su nombre en inglés: “Burning Cost Ratio”, determina la relación entre los siniestros acumulados incurridos y las sumas aseguradas expuestas (base expuesta) en un peŕıodo de estudio[2], produciendo una proporción de monto asegurado que se debe destinar para hacer frente a los siniestros esperados en el futuro. La utilización del modelo tradicional es efectivo en ĺıneas de seguro con una frecuencia de siniestros medible y estable a los largo del tiempo y sobre las cuales no se esperan afectaciones por eventos catastróficos. A nivel regional, las compañ́ıas de seguros deben desarrollar nuevas estrategiaspara medir su riesgo y con ello tarifar adecuadamente los productos que ofrece. A nivel internacional, desde el año 2012, las compañ́ıas de seguros se han tenido que ir adaptando a un marco normativo a nivel internacional que regula los re- querimientos de capital de las aseguradoras, conocido como Solvencia II (European Comission 2009). Las empresas deben implementar modelos de provisiones técni- cas que resulten más sensibles al riesgo. Bajo un enfoque más técnico se establecen provisiones de siniestros principalmente, esto impacta directamente el proceso de tarifación. En una publicación realizada por la reaseguradora Munich Re se indica que en este proceso es dif́ıcil evaluar el impacto en la capacidad del mercado y los precios, pero es probable que la mayor transparencia con respecto al costo total del riesgo conduzca a que los precios y las reservas sean más proporcionales al riesgo[3]. Existen productos, coberturas o ĺıneas de Seguro en los cuales no se cuenta con información estable, los riesgos asociados dependen de variables complejas, factores ambientales, poĺıticos, entre otros, que dificultan el proceso de medición del riesgo y ajuste de los precios. Un ejemplo práctico donde se presenta una situación particular es el caso de seguros de aviación, en donde se aseguran las aeronaves para uso comer- cial o privado. En un mercado pequeño, resulta dif́ıcil medir la prima que se debe cobrar para este producto, dado que las afectaciones se dan por casos catastróficos, presentándose muy pocos casos en un periodo determinado, pero con una severidad (monto) bastante elavada. En un periodo de 5 años, por ejemplo, podŕıa no haberse registrado ningún even- to, y en el mejor de los escenarios, en cuanto a recopilación de datos, podŕıan tenerse registros de algunos casos ocurridos, pero estos no permitiŕıan estimar cuánto se de- beŕıa cobrar realmente, si se utilizara el método tradicional de tarifación. Utilizando la metodoloǵıa bayesiana se puede romper esta brecha de información, en el proceso se considera el criterio experto de varios profesionales de la compañ́ıa, principalmen- te del área de suscripción, quienes pueden medir algunos factores importantes para conocer el nivel de riesgo y sus cualidades. Con base en los estudios realizados sobre la inferencia bayesiana en el mercado de seguros se concluye que el marco bayesiano permite evaluar, de forma más prácti- 4 1.5. ANTECEDENTES INTRODUCCIÓN ca, los parámetros y la incertidumbre de predicción utilizando las distribuciones predictivas previa y posterior, respectivamente. Además, indican que los modelos que utilizaron, ajustaron bien los datos históricos, capturando el efecto de cohorte estocástico, siendo este parsimonioso y relativamente simple[4]. Se logró identificar un estudio realizado en el año 2008 para tarifar un nuevo producto de viajes al espacio, dado que corresponde a un riesgo dif́ıcil de medir, fue necesario realizar un modelo aplicable pero ajustado a la realidad, el autor concluye que el método desarrollado fortalece la estabilidad de las estimaciones en los casos que existe carencia de información [5]. El proceso incorpora la opinión de los expertos en un marco bayesiano con datos de pérdida de niveles inferiores y superiores. La aplicación a una compañ́ıa de seguros, es que se pueden explorar productos que posean un mayor riesgo que el estudiado, aśı como productos con un riesgo menor a éste. La prima de riesgo deseada se encontraŕıa entre las primas de riesgo calculadas para estos productos, ya sea de forma general o a nivel de coberturas. En la metodoloǵıa de este proyecto, se utilizan varios modelos bayesianos para la frecuencia y severidad basados en varios estudios realizados en los últimos años, entre los que se puede citar un estudio de estad́ıstica bayesiana y la distribución Weibull realizado en el año 2016[6], otro realizado en 2017 con aplicación de la teoŕıa bayesiana y la distribución Exponencial-Gamma [7] y un tercero más reciente (año 2019) en donde se realiza un análisis bayesiano sobre la distribución lognormal [8] como los más recientes. En los art́ıculos utilizados como referencia para este estudio, se introducen modelos con diferentes niveles de jerarqúıas y se obtienen conclusiones sobre cuales distribuciones previas se pueden implementar en conjunto con cada distribución teórica de verosimilitud para frecuencia y severidad. Con base en este marco de referencia se define una serie de modelos que se aplicarán a los datos y la información obtenida de expertos en el seguro de aviación. Los resultados obtenidos crean una base estad́ıstica con la cual obtener las primas de riesgo y comerciales del producto analizado, que es el objetivo del proceso de tarifación como tal. Existen estudios, que parten de la definición del modelo general de riesgo colectivo e incorporan principios de estimación de pérdidas esperadas. En el año 2008 se desarrolló una investigación que resume algunos principios para la obtención de la prima de riesgo[9]. Todos estos enfoques de estimación sirven de base para el cálculo de tarifas del producto, y por ende como insumos en los cálculos de reservas posteriores y determinación de requerimientos de capital de la compañ́ıa de seguros. Además, conforman una nueva metodoloǵıa de gran valor que servirá de herramienta para losmprofesionales en actuaŕıa de la unidad de productos (pricing) del Instituto, principalmente en el proceso de tarifación de la ĺınea de aviación. 5 CAPÍTULO 2 Marco Teórico 2.1. Seguro de Aviación Las estad́ısticas mundiales señalan que, comparando la cantidad de accidentes mortales contra la cantidad de viajes realizados, es más seguro viajar en avión que en automóvil, sin embargo, los aviones no están exentos a una serie de riesgos de la naturaleza y provocados por humanos, que en la mayoŕıa de ocasiones desencadenan pérdidas humanas y económicas enormes, una vez que se presenta un evento. Los seguros de aviación tradicionalmente han utilizado dos clasificaciones de coberturas de seguro: Casco y responsabilidad civil [10]. En la primera se encuentran todas aquellas coberturas que aseguran la estructura del avión, en la segunda, se aborda la responsabilidad que tiene un tomador de la póliza ante las vidas humanas, las mercanćıas o bienes de terceros que se vean afectados por la actividad comercial que desempeña con el avión asegurado. La historia del seguro de aviación se remonta a la primera década del siglo XX. Existe una cierta controversia sobre cuándo fue suscrita la primera póliza de seguro de aviación, sin embargo, hay dos detalles importantes como lo son: (1) La industria de la aviación comercial y la industria de seguros de aviación obviamente están relacionadas en el sentido de que la primera nunca habŕıa existido sin la segunda. (2) El mercado de seguros en Londres pronto se convirtió en un centro de seguros de aviación y es reconocido aśı hasta nuestros d́ıas [10]. La industria de seguros de aviación recibió un gran impulso después de la Se- gunda Guerra Mundial, cuando los aviones de transporte militar revisados ingresa- ron al mercado comercial y se formaron operadores de aviones comerciales a gran escala[10]. Este escenario contribuyó a la mejora de la industria de las aeroĺıneas, 6 2.1. SEGURO DE AVIACIÓN MARCO TEÓRICO aśı como su tráfico, tamaño y actualización de la flota. Este escenario también pro- vocó un crecimiento acelerado de la demanda por capacidad de seguro para casco y responsabilidad civil. Las coberturas que cubren casco y responsabilidad civil incluyen las espećıficas a riesgos relacionados con la guerra, inicialmente el mercado no estaba consolidado y las tarifas para dichas coberturas se determinaban más por efecto oferta-demanda y no por un análisis particular a la exposición de cada cartera asegurada. La década de 1980 se caracterizó por el desembolso de grandes pagospor parte de las aseguradoras (debido a una combinación de pérdidas recurrentes de aviones a reacción de fuselaje ancho y una alta tasa de pérdidas humanas), y fluctuaciones en las tarifas de las primas que llevaron a aunar esfuerzos para crear compañ́ıas cautivas propias[10]. Los mercados comerciales de este tipo de seguros se ven enriquecidos con la experiencia de eventos aislados, puesto que en esas situaciones es cuando se logra medir realmente la suficiencia de primas en un programa de seguros, las provisiones y las primas que se cobran a cada asegurado. Después de los ataques terroristas del 11 de septiembre, las aeroĺıneas se vieron afectadas por una cancelación mundial de coberturas de responsabilidad a terceros relacionadas al riesgo de guerra, en el mercado comercial y aumentos significativos en los costos de otros seguros de riesgo de guerra. El gobierno de EE. UU. intervino y amplió un programa federal de seguros para el riesgo de guerra en aviación, para garantizar que las compañ́ıas aéreas estadounidenses pudieran recibir una cobertura de seguro que no era ofrecida en ese momento. El mercado de seguros comercia- les, desde entonces se ha estabilizado, y varias compañ́ıas aéreas están comprando nuevamente cobertura de riesgo de guerra de aseguradoras privadas[11]. Nos enfrentamos ante un mundo muy cambiante, por lo que es necesario conside- rar toda la exposición de riesgo que se presenta en una cartera asegurada y modelar con base en la historia y análisis profundos de las variables en juego, cuales podŕıan ser las pérdidas que va a presentar la compañ́ıa de seguros a futuro por la suscripción de dichos riesgos. En este punto juega un papel importante el reaseguro, mecanismo mediante el cual las aseguradoras trasladan parte de su riesgo a un tercero con el fin de diversificar el riesgo. Los contratos de reaseguro no proporcional surgieron por la necesidad que teńıan las compañ́ıas de seguros de protegerse frente a las consecuencias de aquellos sinies- tros cuya cuant́ıa o amplitud podŕıan poner en peligro su capacidad financiera [12]. Para ciertas ĺıneas con posibilidad de siniestros con las caracteŕısticas anteriores, se puede optar por contratos espećıficos como el exceso de pérdida. En este tipo de contrato, se paga una prima espećıfica por las capas de protección recibidas, y esto hace que en la práctica sea responsabilidad de la compañ́ıa aseguradora medir sus riesgos y tarifar las primas adecuadas para pagar siniestros y los costos de las capas de reaseguro. 7 2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO 2.2. Modelos para el número de siniestros A manera de ilustración, se detallan los modelos de frecuencia clásicos, con los cuales se realiza el ajuste del número de siniestros esperados. 2.2.1. Definición de frecuencia La frecuencia de siniestros f se mide como el número de reclamaciones del se- guro que se dan por cada unidad expuesta al riesgo y en un periodo de tiempo determinado, se puede expresar mediante la fórmula: f = N Unidades Expuestas al Riesgo A lo largo de esta tesis, se entenderá por N la cantidad de reclamaciones de un periodo determinado, de acuerdo con la experiencia del Instituto, se trabajan periodos anuales. Se detallan los modelos tradicionales y relacionados con estadistica bayesiana con el fin de dar tratamiento a la variable aleatoria N . 2.2.2. Método tradicional Se determina el número de siniestros N como un valor único, considerando el número de observaciones de siniestros ocurridos en un periodo de t años. Se denota por C la cantidad de siniestros registrados para definir la siguiente fórmula: N = C t 2.2.3. Ajuste de distribución por Máxima Verosimilitud Para definir el estimador de Máxima Verosimilitud, se considera una base de datos que consiste en n eventos A1, ..., An donde Aj corresponde al valor de la j − esima observación. Por ejemplo, Aj puede ser un punto cualquiera o un intervalo. Se asumen que el evento Aj procede de la observación de la variable aleato- ria Xj. Las variables aleatorias X1, ..., Xn no necesitan tener la misma función de 8 2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO probabilidad asociada pero si depender de un mismo vector de parámetros θ. Bajo el supuesto de que X1, ..., Xn son variables aleatorias independientes, la función de verosimilitud se define como: L(θ) = n∏ j=1 P (Xj ∈ Aj|θ) El estimador de máxima verosimilitud corresponde al vector θ que maximiza la función L(θ). No hay garant́ıa de que la función definida tenga un máximo en su dominio. Es posible que mientras los parámetros tiendan al valor cero o a infinito, la función de verosimilitud continúe aumentando. Se debe tener mucho cuidado al maximizar esta función tomando encuenta los máximos locales que la función pudiese presentar. No siempre será posible expresar la función L(θ) de forma anaĺıtica, sin embargo existen métodos numéricos de aproximación incorporados en este marco teórico[13]. Cuando se realizan observaciones de una variable aleatoria se pueden tener mues- tras censuradas o truncadas según la limitación de información que presente el análi- sis. Cuando no existe información alguna para un subconjunto de la población total se habla de una muestra truncada, si para ese subconjunto se redefinen los valores de las observaciones, se habla de una muestra censurada. Cuando no existe truncamiento ni censura, y el valor de cada observación se registra, se puede ver la función de verosimilitud de la siguiente manera: L(θ) = n∏ j=1 fXj(xj|θ) Y su logaritmo como: l(θ) = n∑ j=1 ln [ fXj(xj|θ) ] 2.2.4. Distribución binomial negativa La función de probabilidad de una distribución binomial negativa está dada por[13]: 9 2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO Pr(N = k) = pk = Γ(k + r) Γ(r)Γ(k + 1) ( 1 1 + β )r( β 1 + β )k , k = 0, 1, 2, ..., r > 0, β > 0. Sea nk el número de peŕıodos en los cuales la frecuencia es de exactamente k reclamos. La función logaritmo de la verosimilitud para esta distribución es: l = ∞∑ k=0 nkln(pk) = ∞∑ k=0 nk [ ln ( Γ(k + r) Γ(r)Γ(k + 1) ) − r ln(1 + β) + k ln(β)− k ln(1 + β) ] Esta función depende de los parámetros r y β, para encontrar el máximo, es necesario recurrir a las derivadas parciales e igualarlas a cero, para obtener las soluciones de los parámetros. La derivada parcial respecto a β es: ∂l ∂β = ∞∑ k=0 nk ( k β − r + k 1 + β ) Por su parte, la derivada parcial respecto a r es: ∂l ∂r = − ∞∑ k=0 nk ln(1 + β) + ∞∑ k=0 nk ∂ ∂r ln (r + k − 1) · · · r k! = −n ln(1 + β) + ∞∑ k=0 nk ∂ ∂r ln k−1∏ m=0 (r +m) = −n ln(1 + β) + ∞∑ k=0 nk ∂ ∂r k−1∑ m=0 ln(r +m) = −n ln(1 + β) + ∞∑ k=0 nk k−1∑ m=0 1 r +m 10 2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO Si se igualan estas ecuaciones a cero, se obtiene lo siguiente: µ̂ = r̂β̂ = ∑∞ k=0 k nk n = x Además: n ln(1 + β̂) = ∞∑ k=1 nk ( k−1∑ m=0 1 r̂ +m ) Se observa que el estimador de máxima verosimilitud para la media es el promedio muestral. Ambas ecuaciones se pueden resolver de forma numérica. Si se reemplaza β̂ por µ̂/r̂ se obtiene la ecuación: H(r̂) = n ln ( 1 + x r̂ ) − ∞∑ k=1 nk ( k−1∑ m=0 1 r̂ +m ) = 0 La función H(r̂)se puede maximizar numéricamente, utilizando para r̂ el método de Newton-Raphson. La ecuación requerida para la k − esima interación es: rk = rk−1 − J(rk−1) H ′(rk − 1) 2.2.5. Distribución Poisson La forma de la función de probabilidad de una distribución Poisson es[13]: pk = e−λλk k! k = 0, 1, 2, ... Sea N una variable aleatoria con distribución Poisson de parámetro λ, se cumple lo siguiente: E(N) = V ar(N) = λ Sean N1, N2, ..., Nn variables aleatorias independientes con distribución Poisson de parámetros λ1, λ2, ..., λn, para determinar la distribución asociada a la suma de las variables anteriores, se calcula lo siguiente: 11 2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCOTEÓRICO PN(z) = n∏ j=1 PNj(z) = n∏ j=1 exp[λj(z − 1)] = exp [ n∑ j=1 λj(z − 1) ] = eλ(z−1) Se concluye entonces que la suma de dichas variables aleatorias Poisson tiene distri- bución Poisson con parámetro λ1 + λ2 + ...+ λn. Utilizando la notación de la sección anterior, se tiene la siguiente forma para la verosimilitud del conjunto de observaciones completas: L = ∞∏ K=0 pnkk La función logaritmo respectiva se obtiene por: l = ∞∑ k=0 nk ln(pk) Dado que la distribución Poisson sólo tiene un parámetro, la busqueda del parámetro óptimo se vuelve más sencilla. La función logaritmo de la verosimilitud es la siguiente: l = ∞∑ k=0 nk(−λ+ k ln(λ)− ln(k!)) = −λn+ ∞∑ k=0 k nk ln(λ)− ∞∑ k=0 nk ln(k!) Se deriva la expresión anterior y se iguala a cero para obtener el óptimo: 12 2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO ∂l ∂d = −n+ ∞∑ k=0 k nk 1 λ λ̂ = ∑∞ k=0 k nk n = x 2.2.6. Regresión Binomial Negativa Inflada con Ceros Cuando se cuenta con poca información estad́ıstica sobre siniestros pagados du- rante un peŕıodo, es posible que en algunos registros mensuales no se visualicen casos, ocasionando que la variable se distribuya de forma binomial negativa salvo por la frecuencia que se presenta para el valor cero, que está por encima de la frecuencia de acuerdo con la distribución ajustada. Para cada observación se consideran 2 casos, si el caso 1 ocurre, con certeza el conteo es cero. Si el caso dos sucede, el conteo está dado por una distribución binomial negativa con los parámetros respectivos. Se expresa esta distribución de la siguiente manera[14]: Pr(yi = j) = { πi + (1− πi)g(yi = 0) si j = 0 (1− πi)g(yi) si j > 0 Donde πi es la función loǵıstica relacionada definida abajo y g(yi) es la distribución binomial negativa dada por: g(yi) = Pr(Y = yi|r, βi) = Γ(yi + r) Γ(r)Γ(yi + 1) ( 1 1 + βi )r( βi 1 + βi )yi En donde βi = µi r . El componente negativo binomial puede incluir un tiempo de exposición t y un conjunto de k variables regresoras, la expresión relacionada es: µi = exp(ln(ti) + αix1t + α2x2t + · · ·+ αkxkt) La función loǵıstica relacionada se determina por: πi = λi 1 + λi 13 2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO Donde: λi = exp(ln(ti) + γ1z1i + γ2z2i + · · ·+ γmzmt) El componente loǵıstico contiene una tiempo de exposición t y un conjunto de m variables regresoras (z′s). Note que los z′s y los x′s pueden o no tener términos en común. El logaritmo de la función de verosimilitud está dada por: l = l1 + l2 + l3 Donde: l1 = ∑ {i:yi=0} ln [ λi + (1 + βi) −r] l2 = ∑ {i:yi>0} ( −ln(yi!)−(yi+r)ln(1+βi)−yiln(r)+yiln(rβi)− ∑yi−1 j=0 ln(j+r) ) l3 = ∑n i=1 ln(1 + λi) El gradiente de l es: ∂l ∂αj = ∑ {i:yi=0} [ − rβi(1 + βi)−1−r λi + (1 + βi)−r ] xij + ∑ {i:yi>0} [yi − βi 1 + βi ] xij j = 1, 2, ..., k ∂l ∂γj = ∑ {i:yi=0} [ λi λi + (1 + βi)−r ] zij − ∑n i=1 [ λi 1 + λi ] zij j = 1, 2, ...,m ∂l ∂r = ∑ {i:yi=0} [βi − (1 + βi)ln(1 + βi) (1 + βi)[λi(1βi)−r + 1] ] zij − ∑ {t:yi>0} { ln(1 + βi) + yi − rβ r(1 + β) − ∑yi−1 j=0 1 j + r } Las segundas derivadas son: ∂2l ∂αj∂βh = ∑ {i:yi=0} xijxihrβi[(rβi − 1)λi(1 + βi)r − 1] (1 + βi)2[λi(1 + βi)r + 1]2 − ∑ {i:yi>0} rβi(1 + βi)xijxih (1 + βi)2 , i, h = 1, 2, ..., k 14 2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO ∂2l ∂γj∂γh = ∑ {i:yi=0} zijzihλi(1 + βi) r [λi(1 + βi)r + 1]2 − ∑n i=1 zijzihλi (1 + λi)2 , i, h = 1, 2, ...,m ∂2l ∂αj∂γh = ∑ {i:yi=0} xijzisrβiλi(1+βi) r−1 [λi(1+βi)r−1+1] j = 1, 2, ..., k; h = 1, 2, ...,m ∂2l ∂βj∂r = ∑ {i:yi=0} xijrβiλi(1 + βi) 1+rln(1 + βi) (1 + βi)2 [ λi(1 + βi)r + 1 ]2 − ∑ {i:yi=0} xijrβ 2 i r [λi r (1 + βi) r + λi(1 + βi) r + 1 r ] (1 + βi)2 [ λi(1 + βi)r + 1 ]2 + ∑ i:y>0 xijrβi(rβi − yi) r2(1 + βi)2 j = 1, 2, ..., k ∂2l ∂γh∂r = ∑ {i:yi=0} zihλi(1 + βi) r−1[(1 + βi)ln(1 + βi)− βi][ λi(1 + βi)r + 1 ] h = 1, 2, ...,m ∂2l ∂r2 = ∑ {i:yi=0} F1 + F2 − F3 F4 + ∑ {i;yi>0}(F5 + F6) Donde: F1 = r −1βi{2λi(1 + βi)r + r−1βiλi(1 + βi)r + 3βi[λi(1 + βi)r + 1] + 2} F2 = r 2λi(1 + βi) 2+rln2(1 + βi) F3 = 2r(1 + βi)ln(1 + βi){λi(1 + βi)r + r−1βiλi(1 + βi)r + βi[λi(1 + βi)r + 1] + 1} F4 = (1 + βi) 2[λi(1 + βi) r + 1]2 F5 = r−2[2(r − yi)βi + 3rβ2i − yi]− 2(1 + βi)2ln(1 + βi) (1 + βi)2 F6 = ∑y1−1 j=0 2rj + r2 (j + r)2 Los estimadores de máxima verosimilitud presentan una distribución asintótica es una normal multivariada[14], como se oberva en la siguiente expresión: 15 2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO β̂γ̂ r̂ = N βγ r − ∂2l ∂βj∂βh − ∂2l ∂βj∂γh − ∂2l ∂βj∂r − ∂2l ∂βj∂γh − ∂2l ∂γj∂γh − ∂2l ∂γj∂r − ∂2l ∂βj∂r − ∂2l ∂γj∂r − ∂2l ∂r2 −1 2.2.7. Regresión Poisson Inflada con Ceros En este modelo de regresión, el vector de respuestas Y = (Y1, ..., Yn) ′ contiene variables independientes y se cumple lo siguiente: Yi ∼ 0 con probabilidad pi Yi ∼ Poisson(λi) con probabilidad 1− pi De esta manera: Pr(Yi = j) = pi + (1− pi)e −λi si j = 0 (1− pi)e−λi λki k! si j > 0 Los parámetros λ = (λ1, ..., λn) ′ y p = (p1, ..., pn) ′ satisfacen: log(λ) = Bβ log(p′(1− p)) = Gγ Para matrices covariadas B y G, y β el vector de coeficientes. El número de parámetros por ser estimados dependerá del número de covariables presentes en el modelo. Si existen pocos conteos y λ y p no están relacionadas, entonces sólo se pueden considerar modelos simples para la variable λ[15]. Cuando λ y p no están relacionados por ninguna función, la función de verosi- militud con la parametrización estándar resulta en: 16 2.2. MODELOS PARA EL NÚMERO DE SINIESTROS MARCO TEÓRICO l(γ, β; y) = ∑ yi=0 ln(eGiy + exp(−eBiβ)) + ∑ yi>0 (yiBiβ − eBiβ) − ∑n i=1 ln(1 + e Giγ) − ∑ yi>0 ln(yi!) Los términos Gi y Bi corresponden a las i-ésimas filas de las matrices G y B respectivamente. La suma de exponenciales en el primer término complica la maximización de l(γ, β; y)[15]. Se supone que se conoce la cantidad de ceros que proviene del estado perfecto y de la distribución Poisson por separado. Se observa Zi = 1 cuando Yi proviene del estado perfecto de ceros y Zi = 0 cuando Yi proviene de la distribución Poisson. La función de máxima verosimilitud con la información completa es: lc(γ, β; y, z) = n∑ i=1 ln(f(zi|γ)) + n∑ i=1 ln(f(yi|zi, β)) lc(γ, β; y, z) = n∑ i=1 (ziGiγ − ln(1 + eGiγ)) + n∑ i=1 (1− zi)(yiBiβ − eBiβ) − n∑ i=1 (1− zi)ln(yi!) lc(γ, β; y, z) = lc(γ; y, z) + lc(β, y, z) − n∑ i=1 (1− zi)ln(yi!) Esta última expresión es más fácil de maximizar, dado que sus términos se pueden maximizar por separado. 17 2.3. MODELOS PARA LA SEVERIDAD MARCO TEÓRICO 2.3. Modelos para la severidad En esta sección nos interesa conocer la distribución del monto de pérdida liga- do a la ocurrencia de un siniestro, es decir, la pérdida económica que presentó la Compañ́ıa ante un evento siniestral amparado por la póliza del producto en estu- dio. Estos valores son positivos y tiende a existir una acumulación de siniestros con un promedio determinado y casos puntuales de siniestros que generan montos de pago bastante elevados, alcanzando inclusive un monto cercano o igual a la suma asegurada para cada aeronave. Existe una relación directa entre el monto asegurado y el monto de la reclamación, ante la ocurrencia de un siniestro se estima un daño directo parcial de la aeronave para la cual se definió, en la emisión de la póliza, un valor monetario estimado sobre el cual se ajustaŕıan las pérdidas a futuro. A menudo es deseable encontrar una expresión anaĺıtica expĺıcita para una dis- tribución de pérdidas, más cuando las estad́ısticas con las que se cuenta son de- masiado escasas como para utilizar la distribución emṕırica como primera opción de ajuste[16]. Cabe destacar que no siempre es adecuado utilizar distribuciones de pérdida teóricas debido a su naturaleza fuertemente sesgada, sin embargo cuando setrata de este análisis, existen distribuciones candidatas como la log-normal, exponen- cial, Pareto, Burr, Weibull y gamma, que son candidatos t́ıpicos para distribuciones de severidad de las pérdidas. 2.3.1. Distribución Emṕırica Una estimación natural para ajustar la distribución de las pérdidas por siniestros es la distribución de severidad emṕırica (observada), para un conjunto de observa- ciones xi, ..., xn dicha distribución es definida por[16]: Fn(x) = 1 n #{i : xi ≤ x} Esto es la función constante a trozos con saltos de tamaño 1/n en los puntos xi. Cuando se tiene un gran cantidad de datos, se puede aproximar con alguna función continua, en donde los puntos de saltos se ven conectados por funciones lineales. La aplicación de la distribución emṕırica resulta adecuada cuando existe una can- tidad suficientemente grande de observaciones de montos de siniestros. Casi nunca se puede aplican en la cola de una distribución, especialmente en caso con posibi- lidad de grandes pérdidas como es el caso de estudio para Aviación. Una forma de trabajar estos casos es ajustar la distribución emṕırica hasta un ĺımite definido, y los montos de gran tamaño ajustarlos con alguna función análitica conocida para colas pesadas. 18 2.3. MODELOS PARA LA SEVERIDAD MARCO TEÓRICO 2.3.2. Distribución Log-normal Se considera una variable aleatoria X que presenta una distribución normal con densidad definida por: fX(x) = 1 σ √ 2π exp { − (x− µ)2 2σ2 } , −∞ < x <∞ Sea Y = eX tal que X = log(Y ), la función de densidad de la probabilidad llamada log-normal y está dada por: fY (y) = fX(log(y)) 1 y = 1 yσ √ 2π exp { − (log(y)− µ)2 2σ2 } , y > 0 Para esta variable aleatoria se tiene los siguientes resultados: E(Y ) = exp ( µ+ σ2 2 ) V ar(Y ) = {exp(σ2)− 1}exp(2µ+ σ2) Utilizando la metodoloǵıa definida en apartados anteriores, se obtiene la función de verosimilitud asociada, con los siguientes estimadores respectivos: µ̂ = 1 n n∑ i=1 log(yi) σ̂2 = 1 n n∑ i=1 {log(yi)− µ̂}2 La distribución log-normal es muy útil en este tipo de modelación, debido a que es una distribución sesgada por la derecha, tiene una cola gruesa y se ajusta bien en la mayoŕıa de ocasiones. Además, es infinitamente divisible y cerrada bajo transforma- ciones de escala y exponencial. Sin embargo, también sufre algunos inconvenientes, en particular, que la transformación de Laplace no tiene una representación de forma cerrada y la función generadora de momentos no existe [16]. 19 2.3. MODELOS PARA LA SEVERIDAD MARCO TEÓRICO 2.3.3. Distribución Exponencial Se considera una variable aleatoria con la siguientes funciones de densidad y distribución, respectivamente: f(x) = βe−βx, x > 0 F (x) = 1− e−βx, x > 0 Dicha distribución se conoce como Exponencial de parámetros (intensidad) β > 0, realizando los cálculos respectivos, se tiene que la distribución posee media β−1 y varianza β−2. El estimador de máxima verosimilitud asociado resulta en: β̂ = n∑n i=1 xi La distribución exponencial a menudo se utiliza en la modelación de riesgos de seguros, debido a sus muchas y variadas propiedades matemáticas de fácil mane- jo. Sin embargo, una desventaja de la distribución exponencial es que su densidad disminuye monótonamente, una situación que puede no ser apropiada en algunas situaciones prácticas [16]. 2.3.4. Distribución Pareto Se supone que una variable aleatoria X tiene una distribución exponencial con media β−1, condicionada sobre β. Por su parte el parámetro β tiene por śı misma una distribución Gamma (ver apartado 2.3.6). La distribución no condicional de X es una mezcla y se le conoce como distribución Pareto. Se puede mostrar que si X es una variable aleatoria exponencial y Y una variable aleatoria gamma, entonces la variable X/Y tiene distribución Pareto [16]. La función de densidad y de distribución de una Pareto están dadas por: f(x) = αλα (λ+ x)α+1 , x > 0 F (x) = 1− ( λ λ+ x )α , x > 0 20 2.3. MODELOS PARA LA SEVERIDAD MARCO TEÓRICO La esperanza y varianza de dicha distribución, respectivamente, resultan en: E(X) = λ α− 1 , V ar(X) = αλ2 (α− 1)2(α− 2) Para esta distribución no existe una forma cerrada para expresar los estimadores de máxima verosimilitud asociados, y solamente pueden ser evaluados de forma numérica. La ley de Pareto es muy útil para modelar la severidad de reclamos en segu- ros, debido en gran parte a su cola extremadamente pesada, comparada con las otras distribucines de esta sección. Su principal inconveniente radica en su falta de trazabilidad matemática en algunas situaciones. Al igual que para la distribu- ción log-normal, la transformación de Laplace no tiene una representación de forma cerrada y la función generadora de momentos no existe. Además, al igual que la exponencial, su densidad disminuye monótonamente, lo que puede no ser adecuado en algunas situaciones prácticas [16]. 2.3.5. Distribución Burr La experiencia ha demostrado que la fórmula de la distribución Pareto es a me- nudo apropiada para modelar la severidad de siniestros, particularmente cuando se prevé que siniestros con una afectación económica grande puedan ocurrir. En al- gunas ocasiones existe la necesidad de encontrar una distribución de cola pesada con mayor flexibilidad que la de la ley de Pareto, incluyendo una función de densi- dad no monótona[16]. Esa flexibilidad ya viene dada por la distribución Burr y su parámetro adicional r > 0. Si Y sigue una distribución Pareto entonces la función de distribución de X = Y 1/r se conoce como una distribución Burr. Las funciones de densidad y de distribución respectivas son: f(x) = rαλα xr−1 (λ+ xr)α+1 , x > 0 F (x) = 1− ( λ λ+ xr )α , x > 0 21 2.3. MODELOS PARA LA SEVERIDAD MARCO TEÓRICO Los estimadores de máxima verosimilitud sólo pueden ser evaluados de forma numérica. Una variable Burr se puede generar usando el método de transformación inversa. La función de distribución acumulada inversa tiene una forma anaĺıtica F−1(x) = [ λ{(1 − x)−1/α − 1} ]1/r. . Se puede entonces establecer X = { λ(U−1/α − 1) }1/r , donde U sigue una distribución uniforme estándar[16]. Para esta distribución existe la media, pero la cola derecha es demasiado pesada, la media muestral estará casi siempre por debajo de E(X). 2.3.6. Distribución Weibull Si V es una variable aleatoria con distribución exponencial, la distribución de la variable X = V 1/τ , τ > 0 se le conoce como distribución Weibull (o Frechet). Las funciones de densidad y de distribución respectivas son: f(x) = τβxτ−1e−βx τ , x > 0 F (x) = 1− e−βxτ , x > 0 El estimador de máxima verosimilitud sólo se puede evaluar de forma numérica y al igual que la distribución Burr, se pueden generar observaciones de la variable utilizando el método de la transformación inversa [16]. 2.3.7. Distribución Gamma Se tiene una distribución aleatoria X, con distribución gamma (o Pearson tipo III) cuyas funciones de densidad y distribución respectivas son: f(x) = β(βx)α−1 e−βx Γ(α) , x > 0 F (x) = ∫ x 0 β(βs)α−1 e−βs Γ(α) ds Para β = 1, se conoce como función gamma incompleta, la integral a continuación: Γ(α, x) = 1 Γ(α) ∫ x 0 sα−1e−sds Si el parámetro α = 1 resulta en una distribución exponencial. Si α > 0, la dis- tribución se cataloga como ley de Erlang. Si β = 1/2 y α = v/2 se habla de una distribución chi-cuadrada (χ2) con v grados de libertad [16]. 22 2.4. MODELO DE RIESGO COLECTIVO MARCO TEÓRICO La media y la varianza resultan en: E(X) = α β V ar(X) = α β2 Sus estimadores de máxima verosimilitud sólo pueden evaluarse bajo métodos numéricos. La distribución gamma es una de las más importantes para modelaciones debido a sus propiedades matemáticas de fácil manejo. Es una distribución que se utiliza bastante para formar otras distribuciones, sin embargo por śı sola no es una fórmula razonable para modelar la severidad de reclamos[16].2.4. Modelo de Riesgo Colectivo El modelo de riesgo colectivo es bien conocido en al área de las ciencias actua- riales y se utiliza para ajustar la frecuencia y la severidad de forma independiente y posteriormente obtener las pérdidas totales bajo un modelo agregado. Para este modelo se considera un portafolio de pólizas de un mismo tipo. Se denota por N el número total de reclamos que pueden generarse de un de- terminado riesgo en un cierto peŕıodo de tiempo, y Zj, denota el monto de pérdida producto de la ocurrencia del j-ésimo evento[?]. El monto de pérdida total bajo el modelo agregado está dada por: X = N∑ j=1 Zj Siendo X = 0 cuando N = 0. Los dos principales supuestos que se emplean en este modelo son: 1. Los montos de pérdida Zj’s son variables aleatorias positivas independientes e idénticamente distribuidas. 2. El número total de reclamos del peŕıodo es una variable aleatoria y es inde- pendiente de los montos de las pérdidas Zj’s. 23 2.5. CONTEXTO BAYESIANO MARCO TEÓRICO Bajo los supuestos definidos, la esperanza y la varianza del modelo agregado se pueden descomponer en términos de las esperanzas y varianzas de los modelos indi- viduales de frecuencia y severidad: E(X) = E(E[X|N ]) = E(N)E(Z) V ar(X) = E(V [X|N ]) + V (E[X|N ]) = E(N)V (Z) + [E(Z)]2V (N) 2.5. Contexto Bayesiano El objetivo de este estudio, es utilizar la teoŕıa bayesiana con el fin de que, a partir de la experiencia y supuestos sobre los parámetros involucrados, se puedan desarrollar modelos que logren ajustar la natulareza de los datos con el panorama que se cree que va a seguir la misma. Este análisis no comprende la forma tradi- cional de ajustar una distribución de manera directa y tomarla como cierta para la información. La idea básica de las técnicas bayesianas, es que los parámetros desconocidos, de las distribuciones involucradas en el modelo de ajuste, sean tratados como variables aleatorias[5]. Una distribución de probabilidad provee la verosimilitud de que varios posibles valores de dichos parámetros sean tomados como ciertos. 2.5.1. Modelo inicial En el paradigma bayesiano, el interés es modelar tanto la distribución de los datos X, aśı como la del parámetro desconocido θ, pues ambos se consideran como variables aleatorias[17]. Supongamos que π(θ) contiene la información sobre el parámetro θ. Suponga que tenemos un vector de n observaciones x̂ = (x1, x2, · · · , xn)T . La verosimilitud se denota como f(x̂|θ) y describe la probabilidad de obtener los valores de x̂ dado que θ es el parámetro verdadero. Por el teorema de Bayes, la distribución posterior de θ es: π(θ|x̂) = f(x̂|θ)π(θ) f(x̂) 24 2.5. CONTEXTO BAYESIANO MARCO TEÓRICO Donde π(θ) es la distribución previa y π(θ|x̂) es la distribución posterior del paráme- tro θ Observe que la distribución de θ se actualiza con la información que se va obte- niendo según los datos que se recolectan, y tal proceso se ve reflejado en la distri- bución posterior del parámetro. Como f(x̂) no depende de θ, es suficiente considerar la forma funcional de: π(θ|x̂) ∝ f(x̂|θ)π(θ) Una vez con la distribución posterior, es posible hacer inferencia puntual sobre el parámetro mediante alguna medida de tendencia central como la media o la moda, o bien considerar intervalos de confianza. Mediante la distribución previa π(θ) se pretende capturar el criterio experto y el conocimiento previo que tenga la compañ́ıa aseguradora respecto al riesgo a tarifar. Este proceso de actualización de la información por el método de Bayes se puede repetir de manera continua, en cuyo caso la distribución posterior se convierte en la distribución previa del nuevo modelo[5]. 2.5.2. Modelo Jerárquico Al modelo general detallado anteriormente, se le puede añadir un nivel interno de análisis, produciendo lo que se conoce como un modelo jerárquico, una vez definida la distribución previa del modelo básico, a los parámetros de dicha distribución se les aplica el mismo procedimiento para conocer una previa nuevamente. Se detalla la teoŕıa para el modelo de no regresión que comprende este estudio. Se puede partir del modelo base[18]: p(θ|datos) ∝ p(datos|θ)× p(θ) La ecuación por śı misma revela una estructura jerárquica simple en los parámetros, dado que indica que la distribución posterior para un parámetro es igual a una probabilidad condicional de los datos bajo un parámetro (primer nivel) multiplicado por la probabilidad marginal (previa) del parámetro (segundo nivel). La estructura jerárquica definida para los parámetros no necesariamente debe detenerse en ese modelo, sino que podŕıa continuar hasta niveles infinitos. Se supone en este caso, que se tiene un modelo con una estructura jerárquica adicionando un 25 2.6. MODELOS COMPUESTOS PARA LA FRECUENCIA MARCO TEÓRICO nivel superior. Se tienen J observaciones y1, ..., yJ y se asume que los datos están distribuidos de acuerdo con una distribución Q con parámetro θ. Entonces: yi ∼ Q(θ) Se asume que los parámetros θ siguen una distribución común W con parámetro γ (hiperparámetro), es decir: θ ∼ W (γ) La distribución posterior de todos los parámetros sigue la siguiente fórmula: p(γ, θ|y) ∝ p(y|θ, γ)p(θ|γ)p(γ) Para entender como trabaja esta estructura jerárquica, se nota que los últimos dos términos [p(θ|γ)p(γ)], al multiplicarse, resultan en una distribución conjunta para γ y θ: [p(θ, γ)]. Nos queda entonces una distribución marginal conjunta para los dos parámetros, la cual se multiplica por la densidad de muestreo para los da- tos [p(y|θ, γ)]. El teorema de Bayes indica que al multiplicar la densidad marginal conjunta de los parámetros (θ) por la densidad de muestreo de los datos dados los parámetros, se obtiene la densidad posterior de todos los parámetros[18]. La distribución marginal de γ, sobre la cual se enfoca este modelo, resulta en: p(γ|y) ∝ ∫ p(y|θ, γ)p(θ, γ)p(γ)dθ La integral anterior se estima normalmente implementando los métodos MonteCarlo (MCMC), los cuales son descritos más adelante. 2.6. Modelos compuestos para la frecuencia En esta sección se documentan los modelos de distribución que se utilizarán para ajustar la frecuencia de siniestros, aśı como los parámetros que deberán ser analizados para incorporar el criterio experto en el desarrollo de la metodoloǵıa. 26 2.6. MODELOS COMPUESTOS PARA LA FRECUENCIA MARCO TEÓRICO 2.6.1. Distribución Binomial Negativa con parámetro r co- nocido Se define la distribución binomial negativa bajo los parámetros r y p = β 1 + β , como sigue: Pr(N = k) = pk = Γ(k + r) Γ(r)Γ(k + 1) ( 1 1 + β )r( β 1 + β )k , = pk = Γ(k + r) Γ(r)Γ(k + 1) (1− p)rpk, Asumiento que se tiene un valor definido para r se procede a establecer como previa para el parámetro p una distribución Beta con parámetros b y c, es decir: f(p) = pb−1(1− p)c−1 B(b, c) , 0 < p < 1 Donde, B(α, β) = ∫ 1 0 xα−1(1− x)β−1dx = Γ(α)Γ(β) Γ(α + β) es la función beta[19]. Para derivar la distribución posterior de p, se debe calcular primero la distribu- ción conjunta de p y la muestra observada[19]. Entonces: P (k1, ..., kT , p) = T∏ i=1 Γ(ki + r) Γ(ki + 1)Γr pr(1− p)ni = pTr(1− p) ∑ ki Γ(r)T T∏ i=1 Γ(ki + r) Γ(ki + 1) Donde T es el número de peŕıodos de pérdida registrados en la muestra. Se multiplica lo anterior por la distribución previa para p, y se obtiene la distribución conjunta de la muestra observada y P : P (k1, ..., kT , p) = prT+b−1(1− p) ∑ ki+c−1 B(b, c)Γ(r)T T∏ i=1 Γ(ki + r) Γ(ki + 1) 27 2.6. MODELOS COMPUESTOS PARA LA FRECUENCIA MARCO TEÓRICO La distribución de probabilidad para la muestra observada se obtiene integrando el resultado anterior sobre el intervalo 0 < p < 1. Cuando la distribución conjunta de las observaciones de la muestra y p se divide por la distribución marginal de la muestra, se obtiene la distribución condicional de p dada la muestra observada[19]. Para este modelo se obtiene la siguiente distribución,que corresponde a la defi- nida para una distribución posterior beta: f(p|ki, ..., kT ) = prT+b−1(1− p) ∑ ki+c−1∫ 1 0 prT+b−1(1− p) ∑ ki+c−1dp = prT+b−1(1− p) ∑ ki+c−1 B(rT + b, ∑ ki + c) El estimador de Bayes para p es la media de la distribución posterior: E(p|k1, ..., kT ) = ∫ 1 0 prT+b(1− p) ∑ ki+c−1dp B(rT + b, ∑ ki + c) = B(rt+ b+ 1, ∑ ki + c) B(rT + b. ∑ ki + c) = rT + b rT + b+ c+ ∑ ki 2.6.2. Binomial Negativa con ambos parámetros desconoci- dos La utilización de este modelo supone la obtención de las expresiones para E(rm|x) y E(βm|x) bajo formas cerradas, lo cual es algo poco estudiado respecto a los paráme- tros de la distribución binomial negativa. Se considera una previa para el parámero β que cumpla lo siguiente: p(β|δ1, δ2) ∝ ( β β + 1 )δ1−1( 1 β + 1 )δ2−1 Si se toma la expresión 1/B(δi, δ2), se está ante una previa con distribución Beta Prima[20]: 28 2.6. MODELOS COMPUESTOS PARA LA FRECUENCIA MARCO TEÓRICO p(β|δ1, δ2) = 1 B(δi, δ2) ( β β + 1 )δ1−1( 1 β + 1 )δ2−1 , δ1, δ2 > 0 La media y la varianza de esta distribución son: E(β) = δ1 δ2 − 1 V ar(β) = δ1(δ1 + δ2 − 1) (δ2 − 1)2(δ2 − 2) Se considera una previa para el parámetro r con la forma: p(r|a, b, z1, z2) ∝ (r − z1)a r − z2 b La constante de proporcionalidad se toma como L1 = Γ(b)(z1 − z2)b−a−1 Γ(b− a− 1)Γ(a+ 1) , para obtener una distribución previa Pearson 6[20]: p(r|a, b, z1, z2) = L1 (r − z1)a (r − z2)b , b > a > 1, y r ≥ z1 ≥ z2 La media y la varianza de esta distribución son: E(r) = z1 + (z1 − z2)(a+ 1) b− a− 2 V ar(r) = (z1 − z2)2(a+ 1)(b− 1) (b− a− 2)2(b− a− 3) Definiendo por C1 = ∑n i=1 xi + δ2 + 1, K1 = (δ1 + C1)/n y los coeficientes polimoniales U1, ..., Um de la aproximación a la expresión del enésimo momento de la posterior para r, se tiene: E(rm|x) ≈ ∑h j=0 ajQj+m∑h j=0 ajQj 29 2.6. MODELOS COMPUESTOS PARA LA FRECUENCIA MARCO TEÓRICO Donde: Qj = f∑ l=0 Γ(C1 − j + l − 2)Γ(j + 1)Ul Γ(C1 + l − 1)KC1−j+l−2)1 nl Se tiene también que: E(βm|x) ≈ nm∏m l=1(Cl − l − 1) ∑h j=0 ajR m j∑h j=0 ajQj Rmj = f∑ l=0 Γ(C1 + l − j −m− 2)Γ(j + 1)V ml Γ(C1 + l − k − 1)KC1+l−j−m−21 nl Donde V k0 = 1 y V m 1 , ..., V m f es un conjunto separado de coeficientes polinomiales para cada uno de los k momentos de la distribución posterior de β. Dado que la distribución del parámetro β toma una forma definida (no estándar) se decide tomar la distribución de la sección anterior para el parámetro p = 1 1 + β para temas de programación. 2.6.3. Distribución Poisson con previa Gamma Con este modelo, se supone una distribución Gamma para el parámetro λ, es decir: p(λ|α, β) = β(βλ)α−1 e−βλ Γ(α) Realizando algunos cálculos, bajo el teorema de Bayes, se obtiene lo siguiente para la distribución posterior: p(λ|α, β, k) ∝ n∏ i=1 e−λλki ki! β(βλ)α−1 e−βλ Γ(α) Luego: 30 2.7. MODELOS COMPUESTOS PARA LA SEVERIDAD MARCO TEÓRICO p(λ|α, β, k) ∝ λ ∑ ki+α−1e−(β+n)λ Excepto por el factor proporcional, la distribución anterior es una Gamma con parámetros α + ∑ ki y β + n. 2.7. Modelos compuestos para la severidad En esta sección se documentan los modelos de distribución que se utilizarán para ajustar la severidad de siniestros, aśı como los parámetros que deberán ser analizados para incorporar el criterio experto en el desarrollo de la metodoloǵıa. 2.7.1. Lognormal con ambos parámetros desconocidos Se parte de la definición que tenemos para la distribución lognormal con paráme- tros µ y σ, como sigue: fX(x) = 1 σ √ 2π exp { − (x− µ)2 2σ2 } , −∞ < x <∞ Para este análisis consideremos una reparametrización de la distribución log- normal, se define τ = σ2, donde σ es la desviación estándar en la parametrización tradicional. Se tiene entonces una distribución lognormal LN(µ, τ), donde: fX(x) = 1 √ 2πτ exp { − (x− µ)2 2τ } , −∞ < x <∞ Se define una previa condicional bivariada para (µ, τ) como sigue[8]: πln(µ, τ) = π(τ)π(µ|τ) Donde π(τ) y π(µ/τ), son respectivamente, distribuciones denotadas por InvG(p, q/2) y N(a, τ/b). La densidad posterior para este caso resulta en: πln ∝ A ·B · C 31 2.7. MODELOS COMPUESTOS PARA LA SEVERIDAD MARCO TEÓRICO Donde: A = InvGτ ( m 2 + p, 1 2 { m∑ i=1 (ln(xi)) 2 + a2b+ q − ( ∑m i=1 ln(xi) + ab) 2 m+ b }) B = Nµ|τ (∑m i=1 ln(xi) + ab m+ b , τ m+ b ) C = m∏ i=1 [ 1− Φ ( ln(xi)− µ√ τ )]n 2.7.2. Exponencial con previa Gamma Se parte de la distribución exponencial (con parámetro lambda): f(x) = λe−λx, x > 0 Para la cual se supone una distribución Gamma para el parámetro λ, es decir: f(λ|α, β, ) = β(βλ)α−1 e−βλ Γ(α) , λ > 0 La distribución posterior se puede ver como una función condicional sobre los datos x: p(λ|x) ∝ ( βα Γ(α) λα−1e−βλ ) (λne−λ ∑n i=1 xi) Realizando algunos cálculos se tiene: p(λ|x) ∝ λn+α−1e−λ( ∑n i=1 xi+β) Del resultado anterior se concluye que la distribución posterior se puede expresar como una distribución Gamma(n+ α, ∑n i=1 +β)[7]. 32 2.7. MODELOS COMPUESTOS PARA LA SEVERIDAD MARCO TEÓRICO 2.7.3. Pareto con ambos parámetros desconocidos Se parte de la definición de la distribución Pareto realizada anteriormente, donde: f(x) = αλα (λ+ x)α+1 , x > 0 Se realiza la siguiente reparametrización α = 1 ξ y λ = 1 ξτ , de modo que: f(x|ξ, τ) =< τ(1 + τξ)−(1/ξ+1), x > 0 Para ξ > 0, se supone que los parámetros ξ y τ son independientes y siguen las siguientes distribuciones[21]: ξ ∼ Pareto I(a, c), a > 0, c > 0 τ ∼ Gamma(a1, b1), a1 > 0, b1 > 0 En donde la distribución Pareto I, utilizada como previa, tiene densidad: p(ξ|a, c) = acaξ−(a+1), ξ > c, a > 0, c > 0 La ventaja de trabajar con estas previas es que el parámetro ξ tiene un ĺımi- te inferior positivo c, esto evita el problema en las simulaciones cuando se tienen muestras pequeñas con parámetros relativamente cercanos a cero[21]. Para la distribución posterior se tiene: p(ξ, τ |x) ∝ l(x|ξ, τ)p(ξ)p(τ) p(ξ, τ |x) ∝ τn+a1−1ξ−(a+1)exp [ − ( 1 + 1 ξ ) n∑ i=1 ln(1 + τξxi)− b1τ ] I(τ > 0)I(ξ > 0) Esto indica que no se puede obtener la posterior mediante una forma cerrada, el método de muestreo de Gibbs es utilizado para obtener muestras de la distribución posterior[21]. 33 2.7. MODELOS COMPUESTOS PARA LA SEVERIDAD MARCO TEÓRICO 2.7.4. Weibull con parámetro de forma conocido Cuando el parámetro de forma τ es conocido, el parámetro de escala β tiene una previa conjugada Gamma[6], es decir: π(β|a, b) = ba Γ(a) βa−1e−bβ β > 0 Para la distribución posterior se tiene: π(β|τ, x) ∝ βa+n−1e−β( ∑n i=1 x τ i +b) La distribución posterior corresponde a una Gamma, el estimador respectivo es: β̂ = a+ n∑n i=1 x τ i + b 2.7.5. Previas para la distribución Gamma Una previa conjugada bastante conocida para el parámetro R = 1/β, es una distribución Gamma usando los parámetros d y e[22]. Es decir: p(R|d, e) = e(eR)d−1 e−eR Γ(d) Dado el vector de observaciones k, y multiplicando la verosimilitud Gamma por la previa definida en el paso anterior, se obtiene la distribución posterior, q(β) ∼ Gamma(d̂, ê), donde: d̂ = d+ nα, ê = e+ n∑ i=1 ki La esperanza posterior resulta entonces en: R̂ = d̂ · ê La previa no normalizada que se utiliza para el parámetro α de la distribución Gamma tiene la forma[22]: 34 2.7. MODELOS COMPUESTOS PARA LA SEVERIDAD MARCO TEÓRICO p(α|a, b, c) ∝ aα−1Rac Γ(α)b En este caso existen tres hiperparámetros a, b, c ∈ R+. Dado el vector de observaciones y, se multiplica la función de verosimilitud Gam- ma por la previa para obtener una expresión para q(α): q(α) ∝ âα−1Raĉ Γ(α)b̂ Donde: â = a n∏ i=1 yi b̂ = b+ n ĉ = c+ n Para efectos de los modelos definidos para frecuencia y severidad en este es- tudio se utilizará una distribución previa exponencial para el parámetro α de las distribuciones Gamma presentadas, ambas distribuciones suelen combinarse dado que pertenecen a la familia exponencial. 2.7.6. Algoritmo básico Metropolis-Hastings Dada una función dedensidad objetivo f , se construye un núcleo de Markov K con distribución estacionaria f y luego se genera una cadena de Markov (X(t)) usando ese núcleo de forma que la distribución ĺımite de X(t) es f y las integrales pueden ser aproximadas de acuerdo con el teorema ergódico[23]. La función f se asocia con una densidad condicional funcional q(y|x), los únicos requerimientos sobre esta densidad son que la razón f(y)/q(y|x) es conocida hasta una constante independiente de x y que q(·|x) tiene suficiente dispersión para llevar a una exploración de todo el soporte de la función f . 35 2.7. MODELOS COMPUESTOS PARA LA SEVERIDAD MARCO TEÓRICO El algoritmo Metropolis-Hastings asociado a la función de densidad objetivo f y a la función de densidad condicional q produce una cadena de Markov (X(t)) bajo el siguiente núcleo de trancisión[23]: Algoritmo 1: Metropolis-Hastings Dado x(t), 1. Genere Yt ∼ q(y|x(t)). 2. Tome X(t+1) = Yt con probabilidad ρ(x (t), Yt) X(t+1) = x(t) con probabilidad 1− ρ(x(t), Yt) Donde: ρ(x, y) = min { f(y) f(x) q(x|y) q(y|x) , 1 } 2.7.7. Método de muestreo de Gibbs Los métodos de muestreo basados en las técnicas Markov Chain Monte Carlo (MCMC) son una v́ıa posible para hacer inferencia respecto a este tipo de modelos[24]. De esta manera se puede estimar la esperanza de la posterior aplicando un promedio simple sobre las muestras, se puede calcular cualquier estad́ıstico de la distribución posterior conforme al número de muestras: E[f(s)]p ≈ 1 N N∑ i=1 f(s(i)) Donde P es la distribución posterior respectiva, f(s) es la esperanza deseada, y f(s(i)) es la i− esima simulación de P [24]. Se supone que, para algún valor p > 1, se tiene la variable aleatoria X = (X1, ..., Xp) y las densidades condicionales asociadas f1, ..., fp, de forma que se puede simular: Xi|x1, x2, ..., xi−1, xi+1, ..., xp ∼ fi(xi|x1, x2, ..., xi−1, xi+1, ..., xp) para i = 1, 2, ..., p Las densidades f1, ..., fp se denominan como condicionales completas y una carac- teŕıstica particular del muestreo de Gibbs es que solo estas densidades son utilizadas en el proceso de simulación[23]. El algoritmo de muestreo de Gibbs relacionado con el modelo se muestra en la siguiente trancisión de X(t) a X(t+1)[23]: 36 2.7. MODELOS COMPUESTOS PARA LA SEVERIDAD MARCO TEÓRICO Algoritmo 2: Muestreo de Gibbs En cada iteración t = 1, 2, ..., dado x(t) = (x (t) 1 , ..., x (t) p ), se genera, 1. X (t+1) 1 ∼ f1(x1|x (t) 2 , ..., x (t) p ); 2. X (t+1) 2 ∼ f2(x2|x (t) 1 , x (t) 3 , ..., x (t) p ); ... 3. X (t+1) p ∼ fp(xp|x(t)1 , ..., x (t) p−1); 2.7.8. Criterio de Información de Devianza (DIC) Se considera un modelo de probabilidad p(y|θ) con una muestra de observacio- nes y = (y1, ..., yn) y unos parámetros desconocidos denotados por θ, el criterio de información de devianza se define como[26]: DIC := E[D(y, θ|y)] + pD En este modelo se tiene que p(y, θ) = −2log(p(y|θ)) y la media de la distribución posterior D(y, θ), E[D(y, θ|y)] se obtiene como: D̂avg(y) = 1 L L∑ l=1 D(y, θ) Además, pD es el número efectivo de parámetros, el cual mide la complejidad del modelo, y se estima como sigue: pD := D̂avg −Dθ̂(y) Donde: Dθ̂(y) = −2log{p(y|θ)}+ 2log{f(y)} El número efectivo de parámetros contempla la precisión entre la probabilidad y la precisión en la parte posterior y solo puede considerarse una medida apropiada de la complejidad de un modelo que describe razonablemente los datos[25]. En temas de comparación se prefiere utilizar el modelo que minimice el valor del criterio DIC. 37 2.8. CÁLCULO DE PRIMAS MARCO TEÓRICO 2.7.9. Medidas del error en cadenas de Markov Al utilizar el paquete coda en RStudio, se obtienen una serie de estimadores, para cada ajuste de modelo de Bayes a realizar, respecto al error computacional en la cadena de Markov para la estimación de la distribución posterior en el modelo de Bayes. Entre los resultados obtenidos se tienen dos estimadores del error estandar, cuyos nombres en inglés son Naive Standard Error (SENaive) y Time-Series Standard Error (SEts). Revisando la documentación de la funciones del paquete Coda[27] se define el primer estimador como: SENaive = √ V ar(X) C · S En donde C es el número de cadenas que se ejecutan, X = {Xc} es el vector de las muestras de la distribución posterior para un determinado parámetro (concatenación de todas las cadenas, c ∈ 1, ..., C) y S es el número de iteraciones de cada cadena. También se define el error estandar de serie de tiempo como: SEts = √ V arts(X) C · S En donde V arts(X) es el promedio de los V arts(X (c))(c) para cada ser de muestras X(c) y cada V arts(X (c))(c) es obtenida al aplicar la función ar para obtener un modelo autoregresivo sobre X(c). 2.8. Cálculo de primas A partir del modelo de riesgo colectivo definido anteriormente, en donde el monto de la pérdida total bajo el modelo agregado está dada por: X = N∑ j=1 Zj Donde Zj denota el monto de pérdida debido a la ocurrencia del j-ésimo evento. Se pueden implementar diferentes modelos de cálculo de prima, cada uno con un enfoque diferente sobre el monto de prima que se debe destinar a cubrir el monto agregado de las reclamaciones[9]. 38 2.8. CÁLCULO DE PRIMAS MARCO TEÓRICO • Prima Neta: H1(θ) = EθX = EθN · EZ1 = θµ, Donde µ = EZ1 y θ = EθN . • Prima bajo el principio de varianza con coeficiente η > 0 H2(θ) = EθX + ηV arθX = θ(µ+ η(σ2 + µ2)) Donde σ2 = V arZ1 y µ = EZ1 • Prima de Esscher con coeficiente ν > 0, se utilizan las igualdades siguientes: Eθ(e νX) = Eθ [( EeνZ1 )N] = eθ(MZ1 (ν)−1) y Eθ(Xe νX) = E ( Z1e νZ1 ) Eθ [ N · ( EeνZ1)N−1 ] = E ( Z1e νZ1 ) θeθ(MZ1 (ν)−1) En donde MZ(ν) denota la función generadora de momentos para la variable aleatoria Z en un punto ν, luego la prima de Esscher se calcula como sigue[9]: H3(θ) = Eθ ( XeνX ) Eθ ( eνX ) = E ( Z1e νZ1 ) θ • Prima exponencial con coeficiente ζ > 0: H4(θ) = 1 ζ lnEθe ζX = 1 ζ θ(MZ1(ζ)− 1) 39 2.8. CÁLCULO DE PRIMAS MARCO TEÓRICO En donde MZ1 en la función generadora de momentos de la variable aleatoria Z1. En todos los casos se obtiene una prima que es una función lineal del parámetro desconocido θ[9]. 40 CAPÍTULO 3 Metodoloǵıa Se adoptará la siguiente estructura metodológica para el ajuste del modelo. Los datos correponden a las bases de siniestros pagados entre los años 2010 y 2019, y amparados por el seguro de Aviación del Instituto. Se considera una ĺınea de seguro objetivo en este estudio dado que el producto de aviación en el INS presenta coberturas y/o clases tarifarias para las cuales no se tienen datos de siniestralidad y por consiguiente es necesario establecer un modelo que permita incorporar esta incertidumbre. Para el modelo general se tomarán los datos de siniestros pagados ligados a coberturas de daño directo en el seguro de aviación. Como un primer acercamiento es necesario estudiar la cantidad de siniestros ocurridos por trimestre y por año, para efectos de medir y establecer modelos de frecuencia con una mayor cantidad de observaciones, aśı como los montos totales de pérdida para los modelos de severidad. En cuanto al criterio experto para establecer las distribuciones previas, el Insti- tuto cuenta con un gran profesional en la materia del seguro de aviación, el señor Mario Jiménez, evaluador experto en los riesgos de la ĺınea de aviación. Se reali- zaron entrevistas v́ıa correo con el fin de obtener valores estad́ısticos y percentiles sobre la distribución de frecuencia anual de siniestros y la distribución de los montos individuales de siniestros, de acuerdo con su visión del riesgo analizado. La definición de todos los modelos, y la obtención de datos puntuales y simula- ciones de resultados se implemantaron en la herramienta libre RStudio utilizando los paquetes R2Openbugs[28] y Coda [29]para hacer un enlace con la herramienta OpenBugs, en la cual se definen directamente las distribuciones en cada escenario
Compartir