Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Universidad Nacional Autónoma de México FACULTAD DE CIENCIAS Cálculo de la Reserva de Siniestros Ocurridos No Reportados (IBNR) utilizando remuestreo por Boostrap T E S I S QUE PARA OBTENER EL TITULO DE: Actuario PRESENTA: Jorge Hilario Guzmán Ruiz DIRECTOR DE TESIS: M.C. Irma Roćıo Zavala Sierra Ciudad Universitaria, CDMX Noviembre, 2017 ´ UNAM – Dirección General de Bibliotecas Tesis Digitales Restricciones de uso DERECHOS RESERVADOS © PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL Todo el material contenido en esta tesis esta protegido por la Ley Federal del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). El uso de imágenes, fragmentos de videos, y demás material que sea objeto de protección de los derechos de autor, será exclusivamente para fines educativos e informativos y deberá citar la fuente donde la obtuvo mencionando el autor o autores. Cualquier uso distinto como el lucro, reproducción, edición o modificación, será perseguido y sancionado por el respectivo titular de los Derechos de Autor. Cálculo de la Reserva de Siniestros Ocurridos No Reportados (IBNR) utilizando remuestreo por Boostrap por Jorge Hilario Guzmán Ruiz Tesis presentada para obtener el titulo de Actuario en la FACULTAD DE CIENCIAS Universidad Nacional Autónoma de México Ciudad Universitaria, CDMX. Noviembre, 2017 ´ Datos del Jurado Datos del Alumno: Nombre: Guzmán Ruiz Jorge Hilario. Universidad Nacional Autónoma de México. Facultad de Ciencias. Carrera: Actuaŕıa. Número de Cuenta: 30608500-6. Datos del tutor: M. en C. Irma Roćıo Zavala Sierra. Datos de los sinodales: Act. Maŕıa Patricia Luna Dı́az. Act. Viviana Dı́az Magallanes. Act. Alfonso Parrao Guzmán. Act. Silvia Leticia Malpica Flores. Datos del trabajo escrito: T́ıtulo: Cálculo de la Reserva de Siniestros Ocurridos No Reportados (IBNR) utilizando remuestreo por Boostrap. Número de páginas: 104 p. Año: 2017. A pesar del tiempo perdido ..., sólo puedo pedir: una disculpa. Jorge Hilario Guzmán Rúız Agradecimientos Agradezco a Dios por permitirme llegar hasta donde estoy, terminando una etapa más de mi vida. Porque me ha cuidado durante el camino que he seguido, me ha permitido tener a mi familia conmigo, me ha dado buenos amigos y principalmente buena salud. A mi familia, porque me acompañan en cada momento, porque cuando tropiezo no me dejan caer. A mis padres, porque no tengo manera de agradecerles lo que me han brindado: A ti mamá por todos tus sacrificios y cariño. A ti papá por tu gran apoyo. A mi hermana que a pesar de la gran diferencia en personalidades siempre contaras conmigo. A mis abuelitos, que representan las personas más bondadosas, son mi ejemplo que aún en la vida se puede conjugar la humildad y la lealtad. A mis t́ıos por el aprendizaje a cada momento. A mis primos, por los buenos momentos y por la infancia. A mis amigos por las risas y alegŕıas. Le agradezco profundamente a la M.C. Irma Rocio Zavala Sierra porque sin ella y todo su apoyo y paciencia esta tesis no se hubiera podido realizar, pero sobre todo porque me enseño que la experiencia no depende de la edad. Gracias por tu amistad. Gracias M.F. Luis Enrique Nava Rugerio por el apoyo en la realización de esta tesis y por demostrarme que de las cáıdas de la vida se toma lo mejor, y que en el ámbito laboral aún se puede encontrar amistades para toda la vida. A mis sinodales, les agradezco su gúıa, expertise y el tiempo que invirtieron en la revisión del presente trabajo. Por último, agradecerle a la Universidad Nacional Autónoma de México, por la formación concedida y por permitirme ser un integrante más de todos los que estamos eternamente orgu- llosos de poder expresar: mi casa de estudios es la UNAM. A la Facultad de Ciencias, porque dentro de ella experimente toda clase de vivencias que jamás olvidare pues marcaron mi vida. ”Por mi raza, hablará mi esṕıritu” v vi Índice general 1. Introducción 2 1.1. Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2. Metodoloǵıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 2. Reserva de siniestros ocurridos no reportados (IBNR) 6 2.1. Reserva Técnica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.2. Definición de IBNR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 2.3. Caracteŕısticas Generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.4. Triángulo de Siniestros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 2.5. Métodos Clásicos de estimación de la IBNR . . . . . . . . . . . . . . . . . . . . . 12 2.5.1. Grossing-up . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.5.2. Link ratio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.5.3. Mı́nimos cuadrados de De Vylder . . . . . . . . . . . . . . . . . . . . . . . 14 2.6. Métodos Estocásticos de estimación de la IBNR . . . . . . . . . . . . . . . . . . . 15 2.6.1. Bornhuetter-Ferguson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3. Técnica Bootstrap 17 3.1. Introducción al Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 3.2. Bootstrap no paramétrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 3.2.1. Teorema de Glivenko-Cantelli . . . . . . . . . . . . . . . . . . . . . . . . . 21 3.3. Técnicas de simulación en el cálculo de probabilidades . . . . . . . . . . . . . . . 23 3.4. Métodos de remuestreo Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 3.4.1. Remuestreo por partes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 vii ÍNDICE GENERAL 3.4.2. Remuestreo por partes: Parámetros β′s . . . . . . . . . . . . . . . . . . . 27 3.4.3. Remuestreo residual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 3.4.4. Remuestreo residual: Chain-Ladder Estocástico con Boostrap . . . . . . . 29 3.4.5. Diferencia entre métodos . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 4. Cálculo de la Reserva de IBNR usando Boostrap 32 4.1. Chain-Ladder clásico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 4.1.1. Variantes de Chain-Ladder . . . . . . . . . . . . . . . . . . . . . . . . . . 35 4.1.2. Algoritmo para estimación: Chain-Ladder Clásico . . . . . . . . . . . . . . 36 4.1.3. Desarrollo de una Aplicación (interacción entre R y Excel) . . . . . . . . 37 4.2. El método Chain-Ladder estocástico de Mack . . . . . . . . . . . . . . . . . . . . 38 4.2.1. Factores de desarrollo para el estimador Chain-Ladder . . . . . . . . . . . 39 4.2.2. Predicciones en el Modelo de Mack . . . . . . . . . . . . . . . . . . . . . . 40 4.2.3. Error Cuadrático Medio de Mack . . . . . . . . . . . . . . . . . . . . . . . 41 4.2.4. Algoritmo para estimación: Chain-Ladder Estocástico . . . . . . . . . . . 42 4.2.5. Desarrollo de una Aplicación (interacción entre R y Excel) . . . . . . . . 43 4.3. Chain-Ladder con Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 4.3.1. Algoritmo para estimación: Chain-Ladder Estocástico con Bootstrap . . . 45 4.3.2. Desarrollo de una Aplicación (interacción entre R y Excel) . . . . . . . . 46 4.4. Regresión Lineal Múltiple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 4.4.1. Algoritmo para estimación: Regresión Múltiple con Bootstrap . . . . . . . 47 4.4.2. Desarrollo de una Aplicación (interacción entre R y Excel) . . . . . . . . 49 5. Resultados del Cálculo de la Reserva de IBNR usando Boostrap 51 5.1. Chain-Ladder con Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 5.1.1. Chain-Ladder Clásico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 5.1.2. Chain-Ladder Estocástico . . . . . . . . . . . . . . . . . . .. . . . . . . . 54 5.1.3. Chain-Ladder Estocástico con Bootstrap . . . . . . . . . . . . . . . . . . . 56 5.2. Regresión Múltiple con Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 5.3. Cuadro comparativo de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . 60 viii ÍNDICE GENERAL 6. Conclusiones 61 A. Códigos en R 65 B. Modelo de Regresión 76 B.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 B.2. Regresión Múltiple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 B.3. Estimación de los parámetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 B.4. Regresión Múltiple con Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 C. Gráficos 82 D. Enlaces de Descarga 85 E. Ejemplos 86 Bibliograf́ıa 93 ix Nomenclatura IBNR Incurred But Not Reported (Incurrido Pero No Reportado). SONOR Siniestros Ocurridos No Reportados. IBNR Real Siniestros Ocurridos No Reportados Reales de la Compañ́ıa de Seguros. ci,j Monto pagado en el año de ocurrencia j, respecto al año de vigencia i. Ci,j Monto acumulado en el año de ocurrencia j, respecto al año de vigencia i. i Años de vigencia o de origen. j Años de ocurrencia o de pago. j∗ Último año de ocurrencia sobre el cual se tiene información para todos los años - de vigencia, es decir los siniestros que se encuentran en la diagonal del triángulo. I Año máximo de vigencia o de origen. J Año máximo de ocurrencia o de pago. Bootstrap To Pull Oneself Up By One’s Bootstraps (Levantarse mediante el propio esfuerzo). BEL Best Estimate Liabilities (Mejor Estimación de Pasivos). 1 Caṕıtulo 1 Introducción Hoy en d́ıa la estimación de las provisiones técnicas se llevan a cabo de forma muy mecánica, con el objetivo de obtener el nivel esperado de reservas para hacer frente a los pagos futuros, asociados a siniestros que se hubieran producido durante el ejercicio de cálculo y en los anterio- res. Por lo tanto, en este nuevo contexto denominado Solvencia II, es importante la proyección de siniestros que puedan acontecer y relacionarlo con el nivel de reservas estimado previamente. Durante los últimos años, han sido muchos los autores que han tratado los métodos de cálculo de las provisiones técnicas o también conocidas como reservas técnicas. La abundante bibliograf́ıa generada, junto a la importancia suscitada en la actualidad dentro del marco nor- mativo de Solvencia II, ha provocado que esta metodoloǵıa sea uno de los temas de investigación más importantes en el sector asegurador. Aśı pues, la necesidad de lograr que las instituciones cumplan con las obligaciones que han contráıdo con sus asegurados, ha provocado que se plantee la incorporación de elementos es- tocásticos en los cálculos de las reservas que, por un lado, justifiquen la metodoloǵıa de cálculo del nivel de reservas y, por el otro, permitan valorar cuantitativamente la incertidumbre aso- ciada a estos mecanismos. El nuevo contexto normativo sobre el cálculo de las reservas técnicas invita a la aplicación de métodos estocásticos para su estimación. Actualmente, se dispone de múltiples posibilidades 2 1.1. OBJETIVO todas ellas igualmente válidas siempre que se lleven a cabo de forma correcta. Debido a que, la metodoloǵıa más popular en el sector asegurador seguramente sea la de Chain-Ladder, esto debido a su fácil aplicación; en el presente trabajo se explicará y se implementará en conjunto con la metodoloǵıa del bootstrap. Todo lo antes mencionado motiva la elaboración de este trabajo, el cual tiene como base en estudiar la metodoloǵıa bootstrap, bajo una perspectiva estocástica y centrado en el cálculo de las provisiones técnicas (IBNR), cabe mencionar que esta metodoloǵıa puede ser aplicada a todos los ramos de corto plazo, para llevar a cabo la ejemplificación se eligió el ramo de Gastos Médicos Mayores debido a las facilidades de proveer la información real por parte de la compañ́ıa aseguradora. 1.1. Objetivo En la tesis presente se plantea un problema real al que tienen que hacer frente las compañ́ıas de seguros el cual es realizar el cálculo de la reserva siniestros ocurridos no reportados, se propone resolver este problema mediante la generación de una aplicación que conjugue por una parte las ventajas del lenguaje estad́ıstico R y por otra la facilidad de la interfaz gráfica del programa Excel. Un objetivo del presente trabajo es aplicar los métodos Clásicos y Estocásticos para la estimación requerida de la reserva por las compañ́ıas aseguradoras, haciendo notar la ventaja que tienen los métodos con una base estad́ıstica sobre los métodos clásicos. Desde un punto de vista pedagógico, esta aplicación buscará ser de gran utilidad puesto que: Facilitará a los estudiantes de Actuaŕıa la compresión por una parte de los métodos para la obtención de la reserva, y por otra el poder de la simulación Bootstrap, un método muy utilizado en el cálculo de la reserva de IBNR. Facilitará también el seguimiento, paso a paso, de todo el proceso que es necesario realizar para dar respuesta al problema planteado. El cálculo de la reserva de siniestros ocurridos no reportados (IBNR), se realizará la esti- mación de la reserva v́ıa el método Chain-Ladder extendido con la metodoloǵıa Bootstrap, la 3 1.2. METODOLOGÍA cual será aplicada a un triángulo de siniestralidad del ramo de Gastos Médicos Mayores, pro- porcionado por una compañ́ıa de seguros (los datos reales fueron multiplicados por un factor debido al acuerdo de confidencialidad de la información de la aseguradora). Los resultados de este estudio serán comparados con los siniestros ocurridos no reportados reales de la compañ́ıa de seguros, estos siniestros serán definidos en el presente trabajo como IBNR Real, los cuales también fueron proporcionados por la compañ́ıa aseguradora. 1.2. Metodoloǵıa Para lograr el objetivo expuesto, se llevó a cabo la siguiente metodoloǵıa: Búsqueda bibliográfica en el marco teórico y normativo para sustentar los modelos pro- puestos. Determinación de criterios matemáticos y formulación a seguir. Uso de los programas: R y Excel para ejemplificar los resultados obtenidos. Con la información recabada en los puntos anteriores, se han desarrollado los caṕıtulos que conforman el presente trabajo: 1. Introducción: Breve exposición del trabajo, motivación, objetivos y metodoloǵıa. 2. Reserva de siniestros ocurridos no reportados (IBNR): Explicación de los fundamentos esenciales para el entendimiento de las reservas técnicas, definición de IBNR e introducción a los métodos clásicos y estocásticos. 3. Técnica Bootstrap: Introducción al método de remuestreo y teorización sobre el método Bootstrapping. 4. Cálculo del IBNR usando Boostrap: Análisis y determinación de los factores de Chain- Ladder y Regresión Múltiple para la estimación de la reserva de IBNR, aśı como la metodoloǵıa de remuestreo: por residuales y por partes. Simplificación de los métodos e instrucciones para el cálculo de la reserva de IBNR. 4 1.2. METODOLOGÍA 5. Aplicación del cálculo de la Reserva de IBNR: Ilustración de los cálculos y resultados obtenidos mediante la aplicación del programa R y la interfaz gráfica de Excel. 6. Conclusiones: Recapitulación de los resultados obtenidos en el presente trabajo. Finalmente se incluye un Apéndice con los códigos de R utilizados para cada uno de los ejemplos presentados en este trabajo, al igual que los gráficos generados de los presentes códigos de R, aśı como los enlaces de descarga donde el usuario podrá hacerse con el archivo adjunto del programa Excel y los códigos antes mencionados; de igual manera se anexa el Apéndice B donde se puede encontrar el Modelo de Regresión Múltiple donde se analiza y determinanlas B′s representan los parámetros de cambio de la variable respuesta y, para la estimación de la reserva de IBNR, aśı como la metodoloǵıa remuestreo por partes. Toda la información del documento está debidamente referenciada. 5 Caṕıtulo 2 Reserva de siniestros ocurridos no reportados (IBNR) Antes de iniciar con la definición de la reserva técnica de siniestros ocurridos no reportados (IBNR), es conveniente conceptualizar el sector asegurador. Las compañ́ıas de seguros son instituciones financieras que asumen riesgos a los que se ven expuestos sus asegurados, a cambio de un pago que se denomina prima, se pagará la indemniza- ción al asegurado en caso de ocurrir un determinado evento (siniestro) cuyo riesgo está cubierto por la cobertura de la póliza de seguro en los diferentes ramos y coberturas que maneje la compañ́ıa. Un aspecto básico de la regulación y supervisión de las operaciones de seguros es que las compañ́ıas cumplan con las obligaciones que han contráıdo con sus asegurados. El cumplimiento de tales obligaciones consiste fundamentalmente en hacer frente a las reclamaciones futuras que hagan los asegurados, para lo cual las aseguradoras deben contar con los recursos financieros suficientes. Es obligatorio contar con una provisión o fondo de reserva denominado reserva técnica para cubrir uno de los objetivos que es garantizar una parte de la solvencia de la compañ́ıa al afrontar el pago de reclamaciones futuras por parte de sus asegurados. La finalidad de las reservas técnicas es cubrir los siniestros esperados de la distribución siniestral, por seguro 6 2.1. RESERVA TÉCNICA o ramo, de igual manera mantener una parte de la solvencia requerida por la compañ́ıa de seguros para afrontar el pago de siniestros reclamados por sus asegurados. 2.1. Reserva Técnica Como se mencionó anteriormente la Reserva Técnica es un recurso financiero que la asegu- radora provisiona, con el propósito de cubrir una parte de las indemnizaciones futuras producto de obligaciones existentes. Una de las provisiones de mayor importancia para la estabilidad de las compañ́ıas de se- guros es la reserva de siniestros ocurridos no reportados (IBNR siglas que corresponden a la expresión inglesa ”incurred but not reported”), sobre todo en ramos con un notable diferimiento en las reclamaciones (Daños, Gastos Médicos Mayores y Vida). Es necesario entender algunos conceptos para definir la reserva de IBNR: Colas de siniestros: Periodo que abarca desde el final de la vigencia de la póliza hasta el término de los reportes o pagos de los siniestros. Expuestos: Total de asegurados cubiertos al riesgo durante el periodo de vigencia de la póliza. Frecuencia: El número de siniestros por unidad expuesta. Reclamación: Reporte del asegurado, haciendo del conocimiento de algún siniestro a la aseguradora. Reserva Técnica: Recursos que destina una compañ́ıa de seguros para respaldar las obli- gaciones que ha contráıdo con sus asegurados. Siniestro: Monto asignado que será pagado al asegurado o beneficiario para indemnizar el 7 2.2. DEFINICIÓN DE IBNR daño. 2.2. Definición de IBNR Una de las primeras definiciones formales de la reserva de siniestros ocurridos no reportados (IBNR) en México se puede encontrar en la Ley General de Instituciones y Sociedades Mutua- listas de Seguros de 1981 en la fracción II del Art́ıculo 50, está definición a lo largo del tiempo ha sufrido variaciones y modificaciones. Hoy en d́ıa se pueden encontrar muchas definiciones respecto a la reserva de IBNR como se mencionan en Villanueva Basto [2015] y Salgado [2012], en el presente trabajo se utiliza la siguiente definición a dicha reserva, la cual se eligió por ser concisa y de fácil compresión para el lector: “La reserva técnica de IBNR considera siniestros ocurridos no reportados, estos son aquellos siniestros que se producen en un intervalo de tiempo, durante la vigencia de la póliza, pero que la reclamación se realiza con posterioridad a la fecha de fin de vigencia o valuación de un periodo contable. La falta de constitución de la reserva por siniestros ocurridos y no reportados ocasionaŕıa efectos perjudiciales a los resultados técnicos presupuestados por las compañ́ıas de seguros. Ya que al no considerar las colas de siniestros dentro de estos resultados se subestima la frecuencia de la siniestralidad, lo que puede conducir a primas insuficientes cobradas a los expuestos. Cada empresa de seguros deberá constituir y valuar dicha reserva tomando como base el método actuarial de cálculo que en su opinión sea acorde con las caracteŕısticas de su cartera y experiencia siniestral.” En otras palabras, la reserva de IBNR son los siniestros que la aseguradora ignora su ocu- rrencia, por un atraso en el aviso. Según Ordoñez [2010] una de las cuestiones fundamentales en la demora del reclamo es debido a que éstos normalmente se reportan a terceros que facilitan o contactan con la compañ́ıa aseguradora, por lo cual hay que esperar un periodo de tiempo hasta 8 2.3. CARACTERÍSTICAS GENERALES que el reclamo llegue a la misma aseguradora y a su base de datos. En la definición propuesta a dicha reserva, se espećıfica la obligación de elegir un método actuarial para el cálculo de la reserva de IBNR, en este caso existen dos tipos de enfoques básicos, cada uno de los cuales agrupa numerosas metodoloǵıas. El primero se denomina método actuarial “clásico” el cual es una perspectiva determińıstica. El segundo es comúnmente calificado de método actuarial “es- tocástico” y arroja predicciones de la IBNR más certeras que los métodos clásicos. En Taylor [1986] o Gil [1995] se puede encontrar una extensa recopilación de estos métodos. 2.3. Caracteŕısticas Generales Si bien es cierto que en cada metodoloǵıa para el cálculo de las provisiones técnicas para siniestros pendientes 1 utilizan reglas y conceptos de partida distintos, se pueden definir algunos datos básicos necesarios en todas ellas. Por lo general, éstos son: cij : Monto pagado en el año de ocurrencia j, respecto al año de origen o vigencia i. Cij : Monto acumulado pagado e incluido el año de ocurrencia j, respecto al año de origen o vigencia i. Para el análisis de la reserva de siniestros ocurridos no reportados (IBNR), la información disponible se presenta en el denominado formato triángulo de siniestros (run-off triangle), el cual contiene los montos reales de siniestros pagados históricamente por la compañ́ıa de seguros, debido a su construcción toma la forma de un triángulo. Los montos que se buscan estimar son los datos que completen el triángulo inferior totalmente aśı como las colas de cada año de vigen- cia, es decir los siniestros que se encuentran debajo de la diagonal del triángulo. En la sección 2.4 de este caṕıtulo se menciona la importancia del triángulo, el cual puede ser representado de la siguiente forma: 1Consecuencias económicas que no han sido totalmente indemnizadas por la Aseguradora. 9 2.4. TRIÁNGULO DE SINIESTROS Año de Ocurrencia 1 2 3 · · · J − 1 J 1 c1,1 c1,2 c1,3 · · · c1,J−1 c1,J Año 2 c2,1 c2,2 c2,3 · · · c1,J−1 de 3 c3,1 c3,2 c3,3 · · · V igencia · · · · · · · · · · · · I − 1 cI−1,1 cI−1,2 I cI,1 Donde las filas hacen referencia al año de origen o vigencia del siniestro (i = 1, 2, 3, · · · , I) y las columnas, al año de ocurrencia o de pago (j = 1, 2, 3, · · · , J). Definiremos a I y J para refe- rirse al número máximo de años de vigencia y ocurrencia, respectivamente. El número máximo de años de los cuales se tiene información es max{I, J} y, debido a que filas y columnas inician con el numeral 1 se debe verificar que todos los datos cumplan: i+ j ≤ max{I, J}+ 1, lo que indica que se trata de un elemento del triángulo superior. Cabe mencionar que en la literatura sobre la construcción del triángulo suelen tomarse periodos anuales, pero noexiste ninguna diferencia esencial en si éstos son meses, trimestres, semestres, etc. 2.4. Triángulo de Siniestros El primer paso para obtener una buena estimación de la reserva de IBNR es la construc- ción del triángulo de siniestros, también conocido como triángulo de IBNR el cual contiene la información histórica de siniestralidad de la compañ́ıa de seguros, las dimensiones son el año o periodo de vigencia (eje vertical) y el año o periodo de ocurrencia (eje horizontal). A medida que el año de vigencia de los siniestros es más reciente se reduce la información, de ah́ı que la matriz resultante tenga la forma triangular. La siguiente figura ejemplifica la forma del triángulo: 10 2.4. TRIÁNGULO DE SINIESTROS Año de Ocurrencia 1 2 3 · · · J − 1 J 1 C1,1 C1,2 C1,3 · · · C0,J−1 C0,J Año 2 C2,1 C2,2 C2,3 · · · C1,J−1 de 3 C3,1 C3,2 C3,3 · · · V igencia · · · · · · · · · · · · I − 1 CI−1,0 CI−1,1 I CI,1 La gran relevancia e importancia que tienen los triángulos de siniestralidad radica en que a partir de ellos se analiza y se determina el mejor método actuarial de cálculo para obtener la reserva de IBNR. La finalidad del método actuarial elegido por las compañ́ıas de seguros es completar el triángulo en su totalidad de la manera más precisa a las reclamaciones reales, es decir, estimar los siniestros de la parte inferior de la diagonal más las colas de siniestralidad de cada vigencia, también conocido como triángulo inferior. Una vez que se recaba la información histórica de las reclamaciones pagadas por las com- pañ́ıas de seguros, se construye el triángulo de siniestralidad, a partir de éste se aplicará el método actuarial 2 elegido para lograr la estimación de la reserva técnica. Todas las metodoloǵıas inician su construcción a partir del triángulo de siniestralidad, y no es la excepción en los Métodos Clásicos y Estocásticos, a continuación, se presentan brevemen- te algunas metodoloǵıas pertenecientes a estos dos métodos (como ya se mencionó si el lector está interesado puede encontrar mayor detalle de estas metodoloǵıas en Taylor [1986] o Gil [1995]). En el caṕıtulo 4 se describirá tanto el método Chain-Ladder Clásico como el método Chain-Ladder Estocástico. 2Modelo estad́ıstico y matemático para la evaluación de riesgos financieros en la industria aseguradora. 11 2.5. MÉTODOS CLÁSICOS DE ESTIMACIÓN DE LA IBNR 2.5. Métodos Clásicos de estimación de la IBNR Los métodos clásicos o determińısticos se basan en el supuesto de mantener constante la proporción de siniestros que se reportan de un peŕıodo a otro, independientemente del peŕıodo de origen del siniestro; no utilizan expĺıcitamente supuestos probabiĺısticos para la obtención de la reserva, es decir, no presentan variabilidad. Su aplicación es sencilla, pero no es posible obtener intervalos de confianza para la estimación de la reserva. A pesar de eso, son bastante utilizados por las compañ́ıas de seguros. A continuación, se describen algunas metodoloǵıas pertenecientes a estos métodos (su ejem- plificación se presentará en el Apéndice E del presente trabajo): Grossing-up Link ratio Mı́nimos cuadrados de De Vylder 2.5.1. Grossing-up También conocido como método de crecimiento o extrapolación, se basa en el cálculo de la proporción acumulada de siniestros para cada periodo de ocurrencia con respecto al total reportado, para cada año de vigencia. Un dato fundamental para aplicar esta metodoloǵıa es la estimación de la siniestralidad total del primer año, considerando que es el más antiguo, es decir, el monto total que la compañ́ıa deberá pagar, correspondiente al primer año. Dicho importe se divide en dos partes: Monto conocido por el paso del tiempo: C1,j o bien c1,j , ∀j = 1, 2, · · · , J . Estimación del monto total de siniestros de ese año, que debe cumplir: C1,∞ ≥ C1,j . Tomando como referencia el primer año se obtienen los cocientes pj , definidos de la siguiente manera: pj = C1,j C1,∞ 12 2.5. MÉTODOS CLÁSICOS DE ESTIMACIÓN DE LA IBNR Se toma el supuesto de que estas proporciones se mantienen constantes, sea cual sea el año de ocurrencia, aplicándose aśı al resto de los años de vigencia a fin de obtener las correspondientes Ĉi,j . Estos montos se obtienen: Ĉi,∞ = Cij final pi Las reservas estimadas se obtendrán como la suma de las diferencias entre ese nivel Ĉ1,j y la última cifra conocida de provisión, Ci,I−i, tal y como sigue: IBNR = ∑I i=0(Ĉi,∞ − Ci,I−i) 2.5.2. Link ratio Este método parte del triángulo de siniestros acumulados y obtiene las tasas de variación en un año de vigencia a otro (también denominados porcentajes de crecimiento o link ratios) entre un periodo de ocurrencia y el siguiente. El cálculo de dichos ratios se obtiene según la expresión: fj = Ci,j+1 Cij i = 1, 2, · · · , I y j = 1, 2, · · · , J Una vez obtenidas cada una de las tasas, deben determinarse los factores de proyección que constituyen, el elemento básico de cálculo para esta metodoloǵıa. Dichos factores no son más que los productos de los ratios previamente calculados, estimando cuál será la siniestralidad de un ejercicio suponiendo que en el paso de un año a otro, dicha variable crecerá al ritmo fijado por la link ratio. La manera anaĺıtica de expresarlo seŕıa: Fk = ∏h j=k fj h variando de 1 a J siendo k el ejercicio considerado y fj la link ratio aplicada en el cálculo. Finalmente para calcular la reserva técnica, dichos factores son aplicados a las columnas del triángulo de ocurrencia, con diversas metodoloǵıas, las más conocidas son: El método del máximo, El método del mı́nimo y El método media aritmética, que sencillamente se escoge la fj máxima, mı́nima o media aritmética respectivamente y se le aplica el factor calculado a cada columna de año de ocurrencia. 13 2.5. MÉTODOS CLÁSICOS DE ESTIMACIÓN DE LA IBNR 2.5.3. Mı́nimos cuadrados de De Vylder Esta metodoloǵıa supone que la fracción de siniestros reportados hasta el periodo j resulta independiente del año de vigencia i. De este modo, puede usarse un modelo multiplicativo para la representación de las reclamaciones. Los datos de partida del triángulo deben ser montos no acumulados cij . La hipótesis principal del modelo es: cij = xi · pj cumpliéndose ∑J j=1 pj = 1 donde: xi: monto total a pagar de los siniestros en el año de origen i. pj : proporción de xi que se paga en el año de ocurrencia j. Luego, los estimadores anteriores se obtienen por mı́nimos cuadrados; es decir, se trata de determinar los valores de xi y pj tales que ∑ (cij−xi ·pj)2 sea mı́nima, donde la suma se realiza sobre el conjunto de sub́ındice del que se tenga información. El sistema de ecuaciones resultante es: xi = ∑ ∀j∈J cij · pj∑ ∀j∈J p 2 j y pj = ∑ ∀i∈I cij · xi∑ ∀i∈I x 2 i Cabe resaltar que las columnas del triángulo de siniestralidad con los montos acumulados o no, resultan proporcionales. La similitud entre todos los métodos clásicos a los cuales se ha hecho referencia, únicamente ofrecen predicciones puntuales de la IBNR mediante un modelo deter- mińıstico, en otras palabras los modelo proporcionan una reserva técnica única sin tomar en cuenta las condiciones de variabilidad, siendo una limitante de estos métodos. 14 2.6. MÉTODOS ESTOCÁSTICOS DE ESTIMACIÓN DE LA IBNR 2.6. Métodos Estocásticos de estimación de la IBNR Los métodos estocásticos son más sofisticados, y su origen proviene, según Taylor [2003], a mediados de los años 70. Este método supone aleatoriedad, es decir, aceptar la variación de si- niestralidad a lo largo del tiempo para cualquier año de ocurrencia. Estos métodos, como afirma England [2002], buscan obtener estimaciones tanto del valor como de la variabilidad de la IBNR, a través de funciones de distribución de probabilidad. Muchos de los métodos estocásticos que se han propuesto enla literatura, parten de la formulación pura del método Chain Ladder o de ligeras modificaciones (la cual se analizará en el Caṕıtulo 4 del presente trabajo). A continuación, se presenta brevemente una metodoloǵıa perteneciente a los métodos es- tocásticos: 2.6.1. Bornhuetter-Ferguson Este modelo propuesto por Bornhuetter y Ferguson en 1972, combina dos metodoloǵıas: la Loss Ratio con otra basada en la experiencia de la compañ́ıa. Mientras el primer método proporciona una siniestralidad a priori, el segundo se basa en la liquidación de siniestros que se encuentra en la diagonal del triángulo (estos siniestros son representados de la siguiente manera: Ci,J−i+1 para i = 1, · · · , I). La expresión matemática que resulta para la estimación de los montos futuros acumulados pueden formularse como: Ĉij = Ĉi,k−i + (γ̂ − γ̂k−i) · α̂i i+ j > k siendo: γ̂: vector de los estimadores a priori de los montos acumulados. α̂: vector de los estimadores a priori de las pérdidas finales esperadas. Si el lector requiere entender mejor la expresión del método Bornhuetter-Ferguson y las hipótesis requeridas, puede remitirse a [Schmidt, 2007] donde se explica con mayor detalle di- 15 2.6. MÉTODOS ESTOCÁSTICOS DE ESTIMACIÓN DE LA IBNR cho método. Una vez analizadas brevemente, algunas metodoloǵıas pertenecientes a los Métodos clásicos y estocásticos, es razonable pensar que la elección del método actuarial para el cálculo de la IBNR, puede estar condicionado, debido a que los métodos clásicos no cum- plen con estar fundamentados en una base matemática, aśı como con la variabilidad que la IBNR puede presentar, a diferencia de los métodos estocásticos que responden de forma adecuada a estas necesidades. En el caṕıtulo siguiente se explicará la técnica Bootstrap que será parte fundamental en los modelos propuestos para el cálculo de la reserva de siniestros ocurridos no reportados en los Caṕıtulos 4 y 5. 16 Caṕıtulo 3 Técnica Bootstrap Antes de iniciar la introducción al Bootstrap, es conveniente que se entienda el concepto de remuestreo. Desde finales de la década de los 60’s comenzó a desarrollarse un revolucionario método conocido con el nombre de “resampling” (remuestreo), para solucionar, por una parte, problemas en el marco de la teoŕıa de probabilidad y la inferencia estad́ıstica y, por otra, la des- motivación de los estudiantes durante los cursos de estad́ıstica en los años 60’s. Dicho método se basa en el empleo de la simulación, utilizando los recursos computacionales. Los resultados que se pueden alcanzar con las técnicas del remuestreo, logran dar solución a problemas clásicos (intervalos de confianza, prueba de hipótesis, tamaño muestral), tareas cuya solución anaĺıtica es dif́ıcil o imposible de obtener con las herramientas tradicionales; pero no se debe pensar que la conclusión es que el método de remuestreo es un método capaz de sustituir la inferencia clási- ca, más bien debe ser visto como una herramienta útil en situaciones donde ésta es inoperante o sumamente engorrosa. En la primavera de 1967, el profesor Julian L. Simon de la Universidad de Ilinois, comienza a desarrollar un método revolucionario para enseñar y aplicar la estad́ıstica, actualmente conoci- do como “resampling” (remuestreo), su esencia consiste en usar el conjunto de datos observados o generados, para que a partir de éstos se generen nuevas muestras hipotéticas. En 1979, Bradley Efron desarrolla y publica el análisis formal del Bootstrap, término que proviene de la expresión inglesa: to pull oneself up by one’s bootstraps (que podŕıa traducirse 17 3.1. INTRODUCCIÓN AL BOOTSTRAP como: levantarse mediante el propio esfuerzo). Es entonces cuando realmente el enfoque de Simon cobra una importante fuerza teórica y capta el interés de toda la comunidad estad́ıstica, quienes comienzan a explorarlo y utilizarlo para solucionar una amplia gama de problemas en probabilidad e inferencia. Este proceder ha sido considerado por la American Statistical Association como: el único gran descubrimiento en estad́ıstica desde 1970 [Miranda, 2003]. 3.1. Introducción al Bootstrap El método Bootstrap o Bootstrapping es un procedimiento de “resampling” (remuestreo), basado en generar un gran número de muestras para estudiar el comportamiento de determi- nados estad́ısticos, la idea de fondo es construir un modelo de distribución a partir de la infor- mación proporcionada por la muestra, este procedimiento es diferente a los métodos clásicos donde la base para hacer inferencias sobre la muestra se encuentra en suponer una distribución muestral teórica, cuyos parámetros pueden ser estimados a partir de estad́ısticos observados en la muestra, el Bootstrap implica obviar los supuestos sobre la distribución teórica que siguen los estad́ısticos. En su lugar, la distribución del estad́ıstico se determina simulando un número elevado de muestras aleatorias generadas directamente a partir de los datos observados en la muestra. Definición 1 Un estad́ıstico (muestral) es una función F que, dada una muestra estad́ıstica de valores (X1, X2, ..., Xn), asigna un número, F (X1, X2, ..., Xn), que sirve para estimar deter- minados parámetros de la distribución de la que procede la muestra. En otras palabras, un estad́ıstico es una medida cuantitativa derivada de un conjunto de datos de una muestra, con el objetivo de estimar o inferir caracteŕısticas de una población o modelo estad́ıstico. Existen diversos procedimientos para llevar a cabo una simulación Bootstrap, los cuales se clasifican en dos grandes rubros, los procedimientos paramétricos y los no paramétricos: Bootstrap paramétrico: Se conoce que F pertenece a una familia paramétrica de distribu- ción y sólo se estiman sus parámetros. 18 3.2. BOOTSTRAP NO PARAMÉTRICO Bootstrap no paramétrico: Se desconoce la fórmula de F y se estima con F̂ obtenida a partir de la muestra. Definición 2 Modelos paramétricos y no paramétricos: Sea X una variable aleatoria (v.a.) con distribución de probabilidad dada por la función de distribución F. La v.a. X sigue un modelo paramétrico, si su distribución de probabilidad F pertenece a una familia de distribución con parámetros de dimensión finita. La v.a. X sigue un modelo no paramétrico si sobre su distribución F únicamente se supo- nen algunas condiciones de regularidad. Ejemplos de estas condiciones son: Continuidad y Simetŕıa. A pesar de la importancia de la metodoloǵıa Bootstrap paramétrico, el presente estudio se enfocará en la metodoloǵıa del Bootstrap no paramétrico, la principal razón se debe a que en la metodoloǵıa Bootstrap paramétrico se conoce la función de distribución de las variables aleatorias caso contrario que en la metodoloǵıa Bootstrap no paramétrico, lo mismo ocurre al tratar de inferir la reserva de IBNR, es decir no se conoce la función de distribución que generan los siniestros que conforman el triángulo de siniestralidad, los cuales seŕıan las variables aleatorias. Por lo que en futuras ocasiones que se mencione la metodoloǵıa Bootstrap únicamente se hará referencia al Bootstrap no paramétrico. 3.2. Bootstrap no paramétrico Es un método de inferencia estad́ıstica válido cuando no se hacen hipótesis paramétricas sobre la distribución de los datos. La estimación de parámetros con la técnica Bootstrap implica básicamente desarrollar un proceso en el que se distinguen diferentes pasos, los cuales consisten: 19 3.2. BOOTSTRAP NO PARAMÉTRICO 1. A partir de la muestra original (X1, X2, ..., Xn), se hace un muestreo con reposición, es decir, la extracción de un primer elemento se repone en la muestra original de tal forma que podŕıa ser elegido de nuevo como segundo elemento de la muestra. Cada observación individual tiene una probabilidad 1n de ser elegida cada vez. 2. Para la muestra obtenidase calcula el valor de un determinado estad́ıstico T que se utiliza como estimador del parámetro poblacional, en cuyo estudio se tiene interés. 3. Se repiten los dos pasos anteriores, hasta obtener un elevado número de estimaciones. En este punto, las herramientas tecnológicas son de suma importancia, para desarrollar las tareas de selección de muestra y determinación de las estimaciones. 4. Se construye una distribución emṕırica del estad́ıstico, que representa una buena aproxi- mación a la verdadera distribución. Es decir, se determina de este modo la distribución muestral de un estad́ıstico sin haber hecho suposiciones sobre la distribución teórica a la que se ajusta y sin manejar fórmulas anaĺıticas para determinar los correspondientes parámetros de esa distribución. Suponga una muestra (X1, X2, ..., Xn) con una función de distribución desconocida, tales que: (X1, X2, ..., Xn) ∼i.i.d F Son variables aleatorias independientes e idénticamente distribuidas (i.i.d.). La metodoloǵıa Bootstrap permitirá obtener la distribución emṕırica F̂n, que constituye la estimación no pa- ramétrica de la distribución F. Esta estimación se apoya en el Teorema de Glivenko-Cantalli, que establece una convergencia casi segura (c.s.), cuando n → ∞, entre las distribuciones F y F̂n, denotando que se trata de una convergencia asintótica. supx| ˆF (x)n − F (x)| →c.s. 0 Por lo tanto, es factible establecer F (x) = ˆF (x)n, lo que significa que la función de distri- bución original es igual a la función de distribución estimada. 20 3.2. BOOTSTRAP NO PARAMÉTRICO 3.2.1. Teorema de Glivenko-Cantelli El Teorema de Glivenko-Cantelli, determina el comportamiento asintótico de la función de distribución emṕırica conforme el número de observaciones crece. Teorema 1 Sea {Xn}n≥1 una sucesión de variables aleatorias independientes e idénticamente distribuidas (i.i.d) definidas en el espacio de probabilidad (Ω,Λ, P ) con función de distribución común F . Se denota por F̂n la función de distribución emṕırica resultante de las n primeras variables aleatorias X1, ..., Xn. Entonces, supx∈<| ˆF (x)n − F (x)| →c.s. 0 Demostración. Se presentará la demostración que hace Vélez [1993], p.36. Por la ley fuer- te de los grandes números, F̂ (x)n → F (x) casi seguro (c.s.), es decir, para cada x ∈ < existe Ax ∈ Λ tal que P (Ax) = 1 y limnFn(x)(w) = F (x) si w ∈ Ax. Se ha denotado por Fn(x)(w) a la función de distribución emṕırica obtenida al observar X1(w), ..., Xn(w), siendo w un elemento del espacio Ω. De la ley fuerte de los grandes números tomamos I(−∞,x) para cada x ∈ <, existe Bx ∈ Λ tal que P (Bx) = 1 y limnFn(x−)(w) = F (x−) si w ∈ Bx, donde g(x−) denota el ĺımite por la izquierda de una función g en x. Para cada número natural k, y cada j = 1, ..., k, se consideran los puntos xjk = {x ∈ < : F (x−) ≤ jk ≤ F (x)} y los sucesos de A siguientes: Ajk = Axjk = {w ∈ Ω : Fn(xjk)→ F (xjk)} Bjk = Bxjk = {w ∈ Ω : Fn(x − jk)→ F (x − jk)} Dk = ∩kj=1(Ajk ∩Bjk), D = ∩∞k=1Dk. 21 3.2. BOOTSTRAP NO PARAMÉTRICO Dk es el suceso definido por la condición de que la función de distribución emṕırica converja a la teórica para todos los puntos xjk (de igual manera para los ĺımites por la izquierda), para un k fijo. D es el suceso en que esto ocurre simultáneamente para todo k. Por la ley de los grandes números, P (Ajk) = P (Bjk) = 1 para todo j y todo k, luego P (Dk) = 1 para todo k y, por tanto, P (D) = 1. Obsérvese que, si x ∈ [xjk, x(j+1)k], por ser F y Fn funciones de distribución se tiene que F (xjk) ≤ F (x) ≤ F (x−(j+1)k), y Fn(xjk) ≤ Fn(x) ≤ Fn(x − (j+1)k) Como además F (x−(j+1)k)− F (xjk) ≤ 1 k F (x)n − F (x) ≤ Fn(x−(j+1)k)− F (xjk) ≤ Fn(x − (j+1)k)− F (x − (j+1)k) + 1 k y Fn(x)− F (x) ≥ Fn(xjk)− F (x−(j+1)k) ≥ Fn(xjk) + F (xjk)− 1 k con lo cual, si δ (k) n es la mayor entre todas las diferencias |Fn(xjk)− F (xjk)| y |Fn(x−jk)− F (x − jk)| (para n y k fijos) se tiene que Fn(x)− F (x) ≤ δ(k)n + 1k y Fn(x)− F (x) ≥ δ (k) n − 1k Aśı, para cualquier k ∈ N , supx∈<|Fn(x)− F (x)| ≤ δ (k) n + 1 k Obsérvese que, si se verifica el suceso D, para cualquier k ∈ N y cualquier ε > 0, se tiene que δ (k) n < ε a partir de un cierto n, de forma que supx∈<|Fn(x)− F (x)| ≤ ε+ 1k a partir de cierto n. Por lo tanto, 22 3.3. TÉCNICAS DE SIMULACIÓN EN EL CÁLCULO DE PROBABILIDADES supx∈<|Fn(x)− F (x)| →n 0 siempre que se verifique D. Como P (D) = 1, se sigue que supx∈<|Fn(x)− F (x)| →n 0 casi seguro La importancia del teorema anterior radica en que a mayor número de muestras mejor será la estimación a la que se llegará. En resumen, el método Bootstrap, supone utilizar la muestra considerando que en si misma contiene la información necesaria sobre la distribución muestral. Cuanto más grande sea el tamaño de la muestra, mejor será la estimación que se haga sobre la distribución muestral. Sin embargo, esto no significa que, con muestras pequeñas, entre 10 y 20 casos, el método Bootstrap no pueda ofrecer resultados correctos. 3.3. Técnicas de simulación en el cálculo de probabilidades En la vida cotidiana todos los seres humanos han realizado algún cálculo de probabilidad, aunque no lo noten, estos cálculos de probabilidad se llevan a cabo de forma inconsciente e inconsistentemente. Por ejemplo, al estimar la probabilidad de éxito sobre su elección de ruta para llegar al trabajo, es decir, encontrar poco tráfico, o cuando se mira al cielo para estimar la probabilidad de lluvia y decidir si llevar o no el paraguas, etc. Para realizar un cálculo de probabilidades de forma consistente se puede utilizar alguna de las tres estrategias básicas: 1. Teoŕıa formal de las probabilidades. 2. Experiencia f́ısica (observar un gran número de veces y calcular la frecuencia relativa con que ocurre el evento de interés). 3. Simular la experiencia f́ısica (el experimento en el cual se está interesado). 23 3.3. TÉCNICAS DE SIMULACIÓN EN EL CÁLCULO DE PROBABILIDADES La primera de ellas implica un conocimiento teórico de las reglas de probabilidades y su mayor dificultad radica en que, en determinadas situaciones resulta verdaderamente complejo hallar la solución anaĺıtica del problema. La segunda, no requiere de tal conocimiento teórico, sin embargo, realizar cierto experimen- to un gran número de veces puede resultar una tarea engorrosa y tediosa. Aunque, en ocasiones, es la única manera de estimar una probabilidad. La última posibilidad, aplicando técnicas de simulación, se ha convertido en una estrategia sumamente atractiva e intuitiva, ya que no se requiere del conocimiento teórico de la teoŕıa de probabilidades y agiliza el proceso de realizar el experimento. Su principal dificultad radica en que simular un experimento exige conocer las leyes f́ısicas que lo rigen. Los siguientes ejemplos ilustran el poder de la simulación como herramienta utilizada para resolver problemas en el marco de las probabilidades. Ejemplo 1 ¿Cuál es la probabilidad de que 2 o más personas, entre un total de 25 alumnos de un curso de la Facultad de Ciencias, cumplan años el mismo d́ıa? La solución anaĺıtica para este problema seŕıa la siguiente, se denomina al suceso A como ”hay al menos dos personas que celebran sus cumpleaños a la vez” y Ac al evento complemen- tario ”no hay dos personas para las que coincida la fecha de nacimiento”. Suponga un año de 365 d́ıas, el número de casos posibles de celebración es 36525 un número enorme. El número de casos favorables a que no existan dos personas que hayan nacido el mismo d́ıa se puede obtener de la siguiente manera: 365 ∗ 364 ∗ 363 ∗ ... ∗ 341, esto se explica de la siguiente forma: la primera persona puede haber nacido uno de los 365 d́ıas del año, la siguiente uno de los 364 d́ıas restantes y aśı sucesivamente, para que la probabilidad de que no haya dos personas que cumplan años el mismo d́ıa este dada por: p(Ac)= 365∗364∗363∗...∗341 36525 = 0.4313 24 3.3. TÉCNICAS DE SIMULACIÓN EN EL CÁLCULO DE PROBABILIDADES aśı la probabilidad que se buscaba es: p(A) = 1− p(Ac) = 1− 0.4313 = 0.5687 Mediante simulación, la solución es extremadamente sencilla si se compara con el procedi- miento desarrollado anteriormente. Los pasos para dar solución con técnicas de simulación son los siguientes: 1. Se crean 25 números aleatorios que se encuentren en el rango de 1 hasta 365 (los d́ıas del año). 2. Si los 25 números son diferentes, se registra 0; en caso contrario 1. 3. Se repiten los pasos anteriores digamos 1,000 veces. 4. La solución es la proporción de unos entre el número de veces que repetimos el experi- mento. Para explotar las herramientas computacionales para realizar las simulaciones, en este es- tudio se utilizó el programa R (lenguaje de programación estad́ıstico) R Core Team [2013], (El código de los programas a los cuales se hará referencia se encontrarán en el apartado apéndice A). Con dicho programa, proporcionar solución al problema anterior es muy sencillo. En la siguiente tabla se observan las probabilidades obtenidas mediante el programa: No. Simulaciones Probabilidad ID. 1 100 0.56 ID. 2 1,000 0.552 ID. 3 5,000 0.579 ID. 4 10,000 0.5659 En la tabla anterior se observa que las probabilidades al ir incrementando el número de simulaciones son muy aproximadas al resultado teórico. Lo que ejemplifica el principio del Teorema de Glivenko-Cantalli, que refiere que a mayor número de simulaciones se obtiene una estimación casi segura a la probabilidad resultante con las técnicas de la teoŕıa de probabilidad. 25 3.3. TÉCNICAS DE SIMULACIÓN EN EL CÁLCULO DE PROBABILIDADES Ejemplo 2 Si se lanzan 23 dados. ¿Cuál es la probabilidad de que la suma sea un múltiplo de 7? Resulta complicado resolver este problema con la teoŕıa de probabilidad, ya que implicaŕıa determinar de cuántas maneras distintas se puede obtener un múltiplo de 7 y después dividirlo por el número 623, mediante las técnicas de simulación, la resolución es muy sencilla. Los pasos que sigue el programa son los siguientes: 1. Se crea un vector con los múltiplos del número 7 dentro del intervalo [23, 138]. 2. Se crean 23 números aleatorios que se encuentren en el intervalo de [1, 6] (los números del dado). 3. Si la suma de los 23 números coincide con algún elemento del vector del paso 1, se registra 1; en caso contrario 0. 4. Se repiten los pasos anteriores digamos 1,000 veces. 5. La solución es la proporción de unos entre el número de veces que repetimos el experi- mento. A continuación se muestran las probabilidades que se obtuvieron con el programa: No. Simulaciones Probabilidad ID. 1 100 0.11 ID. 2 1,000 0.151 ID. 3 5,000 0.1352 ID. 4 10,000 0.1418 Lo que se intenta ilustrar con estos ejemplos, es que resolver casi cualquier problema en el marco de la teoŕıa de probabilidad usando el poder de las simulaciones, es una tarea simple, resulte o no sencilla la solución con los métodos formales basados en fórmulas de la teoŕıa clásica. Por lo tanto, se analizará el poder de la simulación por medio de la técnica bootstrap mediante los métodos de remuestreo como herramientas para llevar acabo el cálculo de la estimación de la reserva de IBNR. 26 3.4. MÉTODOS DE REMUESTREO BOOTSTRAP 3.4. Métodos de remuestreo Bootstrap Existen dos métodos de remuestreo bootstrap clásicos. El primero de ellos recibe el nombre de Remuestreo por partes y el segundo Remuestreo a partir de los residuos o residuales. El uso de uno por sobre el otro dependerá de la naturaleza del modelo y de la interpretación de éste. En la Sección 3.4.5 se pueden encontrar algunas razones que justifiquen el uso de uno u otro método. Por ejemplo, en un análisis respecto a los estimadores de los coeficientes de regresión lineal múltiple cuando la teoŕıa normal no se justifica, es de gran utilidad el proceso de remuestreo por partes, ya que la hipótesis de normalidad en un modelo de regresión afirma que los residuos del modelo ε siguen una distribución normal no aśı las variables aleatorias del modelo (para mayor detalle véase Apéndice B). A continuación, se presenta las metodoloǵıas de los remuestreos. 3.4.1. Remuestreo por partes Este método consiste en realizar el remuestreo a partir de los datos originales, es decir imaginemos a los datos como muestras aleatorias e independientes de una distribución F, es decir, (xi, yi) ∼ F . En el caso no paramétrico, el estimador F̂ de F debe ser la distribución emṕırica de los datos. Esta metodoloǵıa se realizará para el cálculo de la reserva de IBNR mediante el Modelo de Regresión (véase Apéndice B), los resultados se presentan en el Caṕıtulo 5. 3.4.2. Remuestreo por partes: Parámetros β′s Como ya se ha mencionado este método consiste en realizar el remuestreo a partir de los datos originales. En este caso no paramétrico, se obtendrán los estimadores β′s de un modelo de regresión lineal múltiple (véase Apéndice B), el algoritmo para realizar el remuestreo por bootstrap es el siguiente: Para i = 1, · · · , I donde en nuestro ejemplo práctico i son los años de vigencia en el triángulo de siniestralidad. 27 3.4. MÉTODOS DE REMUESTREO BOOTSTRAP 1. Se selecciona 1∗, · · · , I∗ de forma aleatoria y con reemplazo a partir de {1, · · · , I}. 2. Para j = 1, · · · , J , tome x∗i,j = xi∗,j , y∗i = yi∗ , en este ejemplo práctico xi∗,j son los montos ci,j del triángulo de siniestralidad y yi∗ es la suma de dichos montos. 3. Por último, obtener β̂, por mı́nimos cuadrados a partir de (x∗1, y ∗ 1), · · · , (x∗n, y∗n). En el caso de tener pocas observaciones es probable que la matriz (XtX) resulte singular 1. En ese caso no se podrán calcular los estimadores de los coeficientes de regresión con el método de mı́nimos cuadrados por lo que se deberá generar una nueva muestra bootstrap. 3.4.3. Remuestreo residual Este método supone realizar el remuestreo a partir de los residuos (se llama residuo a la diferencia entre los valores de la variable original y los valores que predecimos a partir de nuestra muestra) cuando se supone que éstos son quienes dan estructura al modelo y cuando la varianza de los residuos es una constante desconocida σ2. Para entender estos conceptos se ejemplifican con la obtención de los residuos, mediante el modelo estad́ıstico basado en la distribución Gamma propuesto por Mack [1993], se utiliza este modelo para la estimación de siniestros del triángulo superior, con lo cual se podrán generar los residuos antes mencionados. Por lo tanto, la obtención de la estimación de los siniestros esta dado por: Ĉi,j = E[Ci,j ] = mi,j donde: i = 1, 2, · · · , I y j = 1, 2, · · · , J mi,j = Representan la estimación de los datos originales es decir una estimación del triángu- lo superior. Aśı los residuos ri se denotan con la siguiente formula: ri = Ci,j−mi,j , por lo que la varianza de los residuos viene dada por: V AR[ ∑I i=1 ri] = σ 2. 1Una matriz singular o no invertible, es aquella que no cuenta con otra matriz que al ser multiplicadas generen la matriz identidad. Una matriz es singular si y solo si su determinante es nulo. 28 3.4. MÉTODOS DE REMUESTREO BOOTSTRAP La distribución Gamma es una de las más importantes, desde el punto de vista actuarial, por ser una de las que mejor se ajusta a la distribución emṕırica de las cuant́ıa o montos de los siniestros [Cid, 2000]. Se consideran fijas las observaciones Ci,j , y se remuestrea a partir de los residuos; aunque no es exactamente esto lo que se llevará acabo, ya que se aplica el ajuste de Pearson 2 a los residuos, dicha metodoloǵıa se utilizará como solución para hallar un modelo que reproduzca los resultados de Chain-Ladder Estocástico. 3.4.4. Remuestreo residual: Chain-Ladder Estocástico con Boostrap Se presenta el algoritmo a seguir para realizarel remuestreo residual aplicado al Chain- Ladder estocástico: 1. Se calculan los factores de proyección aplicando el método Chain-Ladder estocástico (véase sección 4.2.1) al triángulo run-off de los datos originales de cuant́ıas acumuladas. 2. Se obtienen los valores acumulados estimados para los años anteriores de forma recurrente, dividiendo el valor del año j entre el factor de proyección del año j-1, donde j es el año de ocurrencia en triángulo de siniestralidad, es decir se realizan un número elevado de Triángulos de Siniestros. 3. Se calculan los incrementos anuales para cada Triángulo de Siniestralidad partir de los valores estimados en el paso 2. Las variaciones en las cantidades estimadas se calculan por fila. mi,j = Ĉi,j j = 1Ĉi,j − Ĉi,j−1 1 < j; j = J − i donde mi,j son los incrementos estimados. 4. Elaboración de los residuos de Pearson. Para su cálculo se aplica la siguiente expresión: 2El ajuste de Pearson provee una medida de qué tan bien las observaciones son pronosticadas por el modelo. 29 3.4. MÉTODOS DE REMUESTREO BOOTSTRAP r̂i,j = Ci,j −mi,j√ mi,j (3-1) 5. Se remuestrean los residuos utilizando la técnica bootstrap imponiendo la condición de que todos los residuos tengan la misma probabilidad de ser remuestreados. 6. Se calculan los incrementos a partir de la muestra por el método bootstrap. Se tendrán que despejar la ecuación del paso 4, partiendo de la ecuación (3-1) de los residuos de Pearson, es decir: Ĉi,j = r̂i,j · √ mi,j +mij 7. Se vuelven a calcular los factores de proyección del método Chain-Ladder de las mues- tras regeneradas. A partir de los datos acumulados se obtiene los factores de la muestra bootstrap. 8. Para finalizar, se calcula la estimación de la reserva de IBNR a partir de la muestra bootstrap y sus factores de proyección. Al conocer la distribución, pueden calcularse estad́ısticos de información tales como, la desviación estándar o cuantiles de la reserva. El proceso de estos ocho pasos descritos se repite un número elevado de veces, Irene Lo- zano Albarrán [2010] sugiere que el número de repeticiones sea de 5,000 o incluso superior. En los ejemplos presentados en su publicación realizan un total de 10,000 repeticiones. En cada una de las repeticiones se obtiene una nueva muestra y un nuevo valor de los estad́ısticos. 3.4.5. Diferencia entre métodos La gran diferencia entre los métodos de remuestreo, se identifica en la forma de calcular las réplicas o nuevas muestras bootstrap, el primero lo realiza a partir de los datos originales y el segundo lo hace con los residuos. En las dos formas de obtener replicaciones bootstrap se pueden mencionar dos puntos que se deben tener en cuenta para de escoger uno de los métodos: 30 3.4. MÉTODOS DE REMUESTREO BOOTSTRAP El método por partes permite aplicarse aún en casos de heterocedasticidad es decir que las observaciones provienen de distribuciones de probabilidad con distinta varianza. El método de remuestreo por pares es frágil cuando se tiene pocas observaciones. En este sentido, un método no es mejor que el otro, la elección dependerá de cada caso y de la interpretación de las variables, aśı como el objetivo del estudio en cuestión. 31 Caṕıtulo 4 Cálculo de la Reserva de IBNR usando Boostrap El bootstrapping es un método estocástico, el cual genera una distribución estad́ıstica de los siniestros finales. La teoŕıa también conocida como Bootstrap proviene de la estad́ıstica general y fue desarrollada alrededor de 1980 por Bradley Efron. Puede ofrecer soluciones numéricas a una amplia gama de problemas estad́ısticos, esta técnica fue desarrollada para llevar a cabo ciertas inferencias. En esencia, se trata de sustituir el tradicional sistema de cálculo y sus complejas expresiones anaĺıticas por un mecanismo basado en la aplicación de un algoritmo numérico de simulación. La simulación consiste en repetir un proceso de generación de muestras en un número sufi- cientemente elevado de veces, para realizar inferencias. Por lo cual es necesario el uso de las herramientas computacionales. Algunas ventajas de la técnica de Bootstrap son: Es útil cuando la precisión en el cálculo de los estimadores, suele ser algebraicamente complicada, o bien no se conoce la distribución de los datos. Permite obtener una buena aproximación de los principales estimadores a partir de la muestra, aún sin conocer la distribución de donde provienen los datos. Es importante distinguir entre el bootstrap paramétrico del que no lo es, en el Caṕıtulo 3 del 32 presente trabajo se profundizó con mayor detalle. Pero, la diferencia fundamental entre ambos es el conocimiento o no de la función de distribución responsable de la generación de los valores que se desea analizar. Si se conoce la función de distribución, entonces se estaŕıa en el caso paramétrico, en el caso contrario seŕıa el no paramétrico, situación en la que las probabilidades de ocurrencia vendŕıan dadas por la función emṕırica de distribución. Como se ha mencionado en caṕıtulos anteriores, uno de los objetivos principales de las compañ́ıas de seguros recae en la estimación correcta de sus obligaciones futuras. Para cada aseguradora es fundamental conocer sus pasivos y cómo pueden cubrirlos para evitar la insol- vencia. Con el fin de lograr este propósito, se han desarrollado diversos métodos de estimación, en gran parte determińısticos, que permiten prever las obligaciones futuras. Uno de estos méto- dos es el llamado ”Método Chain-Ladder Clásico” el cual será explicado en la sección 4.1 del presente trabajo. El Método Chain-Ladder es probablemente la metodoloǵıa más utilizada por las compañ́ıas para la estimación de obligaciones futuras. Las razones de su popularidad recaen principalmente en que es fácil de usar, no requiere de un software especializado para implementarlo y carece de supuestos probabiĺısticos, con la excepción que la proporción de siniestros o reclamos que son reportados a la compañ́ıa de un periodo a otro se mantienen constantes. Dado que en la prácti- ca esta última suposición es bastante cuestionable por la existencia de factores que afectan tal comportamiento, se hace necesario el estudiar e introducir métodos con una base probabiĺıstica más formal que no sólo nos permitan una estimación puntual de reservas más realistas, sino también de su variabilidad e intervalos de confianza. A partir del Método Chain-Ladder Clásico, Mack [1993] introdujo una versión estocástica del mismo que permitió la estimación de la variabilidad de las reservas mediante el error cuadrático medio como una medida de incertidumbre contenida en los reclamos o siniestros. 33 4.1. CHAIN-LADDER CLÁSICO 4.1. Chain-Ladder clásico En general el método Chain-Ladder utiliza un factor para ”suavizar”los datos y, con base en éstos, realizar interpolaciones con el objetivo de estimar los siniestros agregados para cada año de ocurrencia y, posteriormente, la reserva correspondiente. El supuesto de esta metodoloǵıa es que las columnas del triángulo de ocurrencia son pro- porcionales. La sustentación del supuesto depende en buena medida, tanto del tipo de negocio, como de la homogeneidad y tamaño de la cartera. Para estimar la proporción de cambio de un ejercicio a otro se calculan los factores fj para cada año j de ocurrencia en el triángulo de siniestralidad. Donde fj es la tasa de modi- ficación de liquidación de siniestro también llamado factor de Chain-Ladder, el cual trata de estimar la proporción de cambio de un ejercicio a otro, fj está dada por la siguiente formulación: fj = ∑I−j+1 i=1 Ci,j∑I−j+1 i=1 Ci,j−1 j = 2, 3, · · · , J La fórmula anterior se puede interpretar como la suma de los siniestros del triángulo de si- niestralidad de la columna j que representa el año de ocurrencia hasta el año de vigencia I−j+1 (enotras palabras, se suman los siniestros de la columna j hasta el último valor conocido de vigencia) esto se divide entre la suma de los siniestros de la columna j − 1 hasta el mismo año de vigencia antes descrito. Es decir, se obtiene un factor de proyección o de crecimiento de un año al otro, es por eso que la fórmula se inicia en el año de ocurrencia j = 2, debido a que para el año j = 1 el triángulo de siniestralidad se encuentra completo y no es necesario estimar ninguna reserva. A partir de las proporciones obtenidas, se calculan las proyecciones Ĉi,j es decir los valores que faltan en el triángulo de IBNR hasta completarlo. Se definen los valores de la diagonal del triángulo de la siguiente manera Ci,I−i+1 para cada año de vigencia i = 1, · · · , I es decir la última siniestralidad que se conoce, a partir de ellos se estiman los siniestros futuros Ĉi,j∗+k donde j∗ = I − i + 1 y k = 1, · · · , J − 1. Es decir, se completa la siniestralidad de los años 34 4.1. CHAIN-LADDER CLÁSICO después del último valor conocido. Dichos valores se obtienen de la siguiente expresión: Ĉi,j∗+k = Ci,j∗+k−1 · fj∗+k cumpliendo que j∗ + k ≥ J La provisión técnica total de IBNR vendrá dada por la suma de la diferencia entre el monto de siniestralidad estimada y el monto de siniestralidad del año anterior. Algunos aspectos im- portantes a considerar en esta metodoloǵıa, tal y como se destaca en Claramunt [2003]: Los datos del triángulo de siniestralidad deben ser positivos en su mayoŕıa. Válido en situaciones con tasa de inflación constantes. Aunque no se trata de un método estocástico, surge como un caso particular de diferentes modelos estocásticos. 4.1.1. Variantes de Chain-Ladder Varios han sido los intentos de depurar la metodoloǵıa clásica de Chain-Ladder, dando lugar a variantes del modelo. No obstante, la técnica permanece esencialmente igual, manteniendo el supuesto principal idéntico. La diferencia radica en la ponderación de los factores de desarrollo. En este sentido, Van Eeghen [1981] describe variantes del método Chain-Ladder. En todas ellas, parte del triángulo run-off formado por los factores de desarrollo di,j , obtenidos de la siguiente manera: di,j = Ci,j Ci,j−1 j = 2, 3, · · · , J Además, cada variante utiliza una hipótesis alternativa. De entre todas ellas, se destacan dos por su simplicidad matemática y por ser las más habituales en la literatura relacionada con ello: 1. Ajuste de tendencias lineales (por mı́nimos cuadrados) a cada columna de di,j 35 4.1. CHAIN-LADDER CLÁSICO 2. Supuesto de que el factor de desarrollo es constante en cada columna, estimándose me- diante una media aritmética ponderada de los factores de desarrollo emṕırico; esto es: d̂i,j = ∑k−j−1 i=0 wi,j · di,j∑k−j−1 i=0 wi,j−1 con peso wi,j : wi,j = 1 (Se supone que existe una tendencia lineal dentro del triangulo). wi,j = Ci,j (Chain-Ladder clásico). wi,j = i + j + 1 (Ponderación que sirve para dar peso a algunos años de ocurrencia y años de vigencia). wi,j = (i + j + 1) 2 (Ponderación que sirven para dar mayor peso a algunos años de ocurrencia y años de vigencia). 4.1.2. Algoritmo para estimación: Chain-Ladder Clásico 1. Se calculan los factores de Chain-Ladder respecto al triángulo de siniestralidad acumulada: fj = ∑I−j+1 i=1 Ci,j∑I−j+1 i=1 Ci,j−1 j = 2, 3, · · · , J 2. Con estos factores se estimarán los valores que faltan en el triángulo de siniestralidad para cada año de vigencia i = 1, · · · , I hasta completarlo. Dichos valores se hallan mediante la siguiente expresión: Ĉi,j∗+k = Ci,j∗+k−1 · fj∗+k cumpliendo que j∗ + k ≥ J donde: j∗ = I − i+ 1 k = 1, · · · , J − 1 3. La provisión técnica total de IBNR vendrá dada por la suma de la diferencia entre el monto de siniestralidad estimada y el monto de siniestralidad real. 36 4.1. CHAIN-LADDER CLÁSICO 4.1.3. Desarrollo de una Aplicación (interacción entre R y Excel) Sin querer entrar en detalles de la programación, en este apartado del trabajo se explica el objetivo perseguido por la aplicación, su estructura y la utilidad para el usuario. Aśı el objetivo principal que se busca con la creación de dicha aplicación es el de permitir al usuario calcular la estimación de reserva de IBNR partiendo de un triángulo de siniestralidad completo, formado por cuant́ıas no acumuladas (ci,j) y con igual número de años de vigencia i que de ocurrencia j. El lector podrá comprender el desarrollo de la herramienta informática para el cálculo de la provisión técnica IBNR utilizando las metodoloǵıas descritas en el presente trabajo, es decir se explicará el algoritmo por medio de la herramienta informática, en este caso se explica el algoritmo de la metodoloǵıa Chain-Ladder Clásico. Dicha aplicación se realiza gracias a los códigos generados en el programa R y a un ar- chivo para presentar los resultados mediante la interfaz gráfica del programa Excel, el lector podrá obtener los códigos mencionados en el Apéndice A y el archivo de Excel antes descrito en los enlaces de descarga en el Apéndice D. Dicho lo anterior el algoritmo Chain-Ladder Clásico describe: 1. Los factores de Chain-Ladder se calculan por medio de las ĺıneas del código enumerado del 1 al 7 del apartado Chain-Ladder Clásico. 2. Se completa el triángulo de siniestralidad con los factores anteriores con el código enume- rado del 8 al 12 del apartado antes mencionado. 3. Se transforma el triángulo acumulado a cuant́ıas sin acumular para obtener la reserva técnica de IBNR con el código enumerado del 13 a 14 del apartado ya descrito. 4. Gracias a la libreŕıa XLConnet de R se logra realizar la interacción entre R y Excel, se genera dicha conjunción al correr el código enumerado del 15 a 25 del apartado antes mencionado. En resumen, estas ĺıneas recaban los valores de los factores Chain-Ladder y 37 4.2. EL MÉTODO CHAIN-LADDER ESTOCÁSTICO DE MACK el triángulo de cuant́ıas sin acumular para luego ser agregados en el archivo de Excel de nombre Triángulo.xlsm en la hoja de cálculo CLClas en la celda A1 y A10 respectivamente. 5. Una vez los valores en el archivo Triángulo en la hoja de cálculo CLClas, se utiliza la interfaz gráfica de Excel para llevar a cabo una tabla comparativa entre la estimación del IBNR realizada y el IBNR Real facilitado por la compañ́ıa de seguros. Figura 4-1: Vista al archivo ”Triángulo.xlsm”hoja de cálculo CLClas La finalidad de utilizar la interfaz gráfica de Excel es presentar de forma amigable los re- sultados y facilitar la manipulación de los mismos, esto debido a que hoy en d́ıa la mayoŕıa de los resultados de las compañ́ıas aseguradoras son presentados en dicho programa. 4.2. El método Chain-Ladder estocástico de Mack Mack [1993] planteó la siguiente cuestión: ¿Cómo se puede utilizar la información represen- tada por observaciones pasadas y presentes, para predecir las severidades acumuladas futuras totales de los siniestros? Con esta pregunta Mack introdujo algunas condiciones en el modelo Chain-Ladder que se detallan a continuación: 38 4.2. EL MÉTODO CHAIN-LADDER ESTOCÁSTICO DE MACK 1. Los montos pagados por siniestros con diferentes periodos de vigencia son independientes e idénticamente distribuidos; es decir, ∀i 6= l, Ci,j y Cl,k son variables aleatorias indepen- dientes e idénticamente distribuidas para cualquier valor de j y k. 2. Las variables aleatorias Ci,j son positivas casi en la mayoŕıa de los registros y tiene espe- ranza finita. 3. Existen números reales no negativos fi, los cuales son denominados factores de desarrollo, para i y j = 1, 2, · · · , n. E[Ci,j+1|Ci,1, · · · , Ci,j ] = fj · Ci,j = Ĉi,j (4-1) La principal motivación de Mack para introducir la ecuación (4-1) fue explicar la forma de los llamados estimadores Chain-Ladder los cuales son comúnmente usados en la práctica para la estimación de reservas futuras. En estesentido, el modelo de Mack es dictado por un procedimiento estad́ıstico amplio. 4.2.1. Factores de desarrollo para el estimador Chain-Ladder Los factores de desarrollo se generan a partir de de la ecuación (4-1), donde se observa: E[Ci,j+1|Ci,1, · · · , Ci,j ] = fj · Ci,j = fj · E[Ci,j ] donde: j = 1, 2, · · · , J Se asume por la segunda condición de Mack que Ci,j es positivo para cada j. Por tanto: fj = E[Ci,j+1] E[Ci,j ] donde: j = 1, 2, · · · , J 39 4.2. EL MÉTODO CHAIN-LADDER ESTOCÁSTICO DE MACK Por la Ley Fuerte de los Grandes Números el estimador de momentos propuesto para fj esta dado por: fj = ∑J−j i=1 Ci,j+1∑J−j i=1 Ci,j donde: j = 1, 2, · · · , J Por consiguiente fi es llamado el estimador del modelo Chain-Ladder Estocástico y a partir de él, se obtiene la estimación de la reserva de IBNR. Cabe mencionar que este estimador del modelo Chain-Ladder Estocástico es el mismo que el calculado con el modelo Chain-Ladder Clásico, por lo cual se obtendrá la misma estimación de reserva de IBNR en los dos modelos, la gran diferencia radica en que el modelo estocástico proporciona un error cuadrático medio el cual es una forma de evaluar la diferencia entre un estimador y el valor real de la cantidad que se quiere calcular. 4.2.2. Predicciones en el Modelo de Mack El objetivo primordial consiste en predecir la severidad futura Ci,I+2−i para un periodo continuo con base en el triángulo de siniestralidad. Por ello el Modelo de Mack [1997] define la ecuación predictiva como: E[Ci,I+2−i] = fI+1−i · Ci,I+1−i donde: i = 2, 3, · · · , I Esto implica que la estimación de la reserva de IBNR se pueda obtener de la siguiente forma: Ĉi,I+2−i = fI+1−i · Ci,I+1−i donde: i = 2, 3, · · · , I 40 4.2. EL MÉTODO CHAIN-LADDER ESTOCÁSTICO DE MACK Como ya se mencionó la estimación del IBNR es la misma en las metodologiás de Chain- Ladder Clásico y Estocástico, el planteamiento de predicciones en el Modelo de Mack es una forma distinta de verlo al ya descrito en la sección 4.1, pero la finalidad es la misma, es decir completar el triángulo inferior partiendo de los últimos valores conocidos y con ellos generar las estimaciones de la reserva técnica de IBNR. 4.2.3. Error Cuadrático Medio de Mack El error cuadrático medio de las variables Ti, para estimar T̂i, se define como: ECM(T ) = E[(T̂i − Ti)2] donde: (T̂i − Ti) mide el error que se comete al estimar T̂i mediante Ti. Se considera el cuadrado de ese error para evitar que las diferencias positivas se compensen con las negativas. Finalmente, se calcula cuánto vale, en promedio, este error cuadrático. En Estad́ıstica, el error cuadrático medio es usado para determinar la medida en la que el modelo no se ajusta a la información, o si el quitar ciertas observaciones puede simplificar el modelo de manera correcta. Se puede decir que un error cuadrático medio mı́nimo a menudo indica una variación mı́nima, y por lo tanto indica un buen estimador. El error cuadrático medio de las predicciones Ĉi,I+2−i viene dada por: MackS.E. = E[(Ĉi,I+2−i − Ci,I+2−i)2] En Mack [1997] se definen los intervalos de confianza de los montos de reservas totales estimados para el periodo de vigencia i, con la siguiente formula: [Ĉi,I+k−i − (z1−α 2 ·MackS.E.) , Ĉi,I+k−i + (z1−α 2 ·MackS.E.)] 41 4.2. EL MÉTODO CHAIN-LADDER ESTOCÁSTICO DE MACK Siendo z1−α 2 el percentil 100(1− α) % de una distribución normal estándar. La fórmula anterior se puede entender como el rango que puede variar la estimación de la reserva técnica de IBNR, debido al error cuadrático medio que presenta el modelo con una cierta ponderación es decir con un nivel de confianza o de probabilidad que permanezca dentro de este rango. Este es el gran aporte de los modelos estocásticos, que permiten obtener una estimación puntual de la reserva y un intervalo de variabilidad. 4.2.4. Algoritmo para estimación: Chain-Ladder Estocástico 1. Se calculan fi los factores de Chain-Ladder Estocástico respecto al triángulo de siniestra- lidad acumulada: fj = ∑I−j+1 i=1 Ci,j∑I−j+1 i=1 Ci,j−1 j = 2, 3, · · · , J 2. Con estos factores se estima la reserva de IBNR es decir se completa el triángulo de siniestralidad para cada año de vigencia i = 1, · · · , I. La reserva estimada se obtiene mediante la siguiente expresión: Ĉi,j∗+k = Ci,j∗+k−1 · fj∗+k cumpliendo que j∗ + k ≥ J donde: j∗ = I − i+ 1 k = 1, · · · , J − 1 3. La provisión técnica total de IBNR vendrá dada por la suma de la diferencia entre el monto de siniestralidad estimada y el monto de siniestralidad real. 4. Se calcula el error cuadrático medio y el intervalo de confianza de la estimación: [Ĉi,I+k−i − (z1−α 2 ·MackS.E.) , Ĉi,I+k−i + (z1−α 2 ·MackS.E.)] Siendo z1−α 2 el percentil 100(1− α) % de una distribución normal estándar. 42 4.2. EL MÉTODO CHAIN-LADDER ESTOCÁSTICO DE MACK 4.2.5. Desarrollo de una Aplicación (interacción entre R y Excel) El algoritmo Chain-Ladder Estocástico describe: 1. Los factores de Chain-Ladder Estocástico se calculan por medio de las ĺıneas del código enumerado del 1 al 4 del apartado Chain-Ladder Estocástico. 2. Se completa el triángulo de siniestralidad con los factores anteriores con la ĺınea de código enumerado con 5 del apartado antes mencionado. 3. Se calculan los errores cuadráticos medios por estimación es decir por año de vigencia y el error cuadrático medio total con el código enumerado del 6 a 8 del apartado ya descrito. 4. Mediante la libreŕıa XLConnet de R logramos realizar la interacción entre R y Excel, se genera dicha conjunción al correr el código enumerado del 13 a 26 del apartado antes mencionado. En resumen, estás ĺıneas recaban los valores de los factores Chain-Ladder Estocástico, el triángulo de cuant́ıas acumuladas y los valores de los errores cuadráti- cos medios por estimación y total, para luego ser agregados en el archivo de Excel de nombre Triángulo.xlsm en la hoja de cálculo CLEsto en la celda A3, A12, A78 y A88 respectivamente. 5. Una vez los valores en el archivo Triángulo en la hoja de cálculo CLEsto, se utiliza la interfaz gráfica de Excel para llevar acabo el cálculo de los intervalos de confianza, aśı como una tabla comparativa entre la estimación del IBNR realizada y el IBNR Real facilitado por la compañ́ıa de seguros. 43 4.3. CHAIN-LADDER CON BOOTSTRAP Figura 4-2: Vista al archivo ”Triángulo.xlsm”hoja de cálculo CLEsto Como se indicó se utiliza la interfaz gráfica de Excel para presentar de forma amigable los resultados y facilitar la manipulación de los mismos. 4.3. Chain-Ladder con Bootstrap Como ya se ha mencionado el Bootstrap o Bootstrapping es una técnica de remuestreo desarrollada para llevar a cabo ciertas inferencias. A grandes rasgos, se trata de reemplazar el sistema clásico de cálculo que conlleva la aplicación de expresiones anaĺıticas complejas, por un mecanismo con base en la aplicación de un algoritmo numérico de simulación. Éste consiste en generar un elevado número de muestras para realizar esas inferencias. La propuesta de esta metodoloǵıa para dar una solución al problema de la estimación de reservas parte de England [1999]. Dado que las reservas suelen estimarse a partir de diversos modelos, el remuestreo se realizará a partir de los residuos del modelo seleccionado, tal y como sugiere Efron [1994]. Un aspecto fundamental consiste en determinar cuál será la expresión de los residuos; siendo los más habituales los que resultan a partir de la media dispersión de Pearson. Debido al desconocimiento de la distribución de las variables Ci,j se remuestrean los 44 4.3. CHAIN-LADDER CON BOOTSTRAP residuos. Para ello, se utilizará el residuo de Pearson, que tiene la propiedad de distribuirse asintóticamente como una distribución normal con media 0 y desviación 1. Con esto, se remues- trea una variable que tiene una distribución asintótica conocida.
Compartir