Mémoires d'Actuariat
Evaluation de la charge ultime aviation et maritime par des méthodes de Machine Learning : Impact des données sur les résultats observés
Auteur(s) LEJEUNE M.
Société La Réunion Aérienne
Année 2023
Résumé
En assurance, la charge ultime, calculée lors du provisionnement, est une notion fondamentale pour l’entreprise. Celle-ci doit être calculée avec soin, puisque le Best Estimate, part importante lors du calcul du risque de réserve sous solvabilité 2 en découle. Cette charge ultime, est généralement obtenue par des méthodes actuarielles déterministes, du type Chain Ladder. Cette méthode est particulièrement adaptée aux assurances de masses, telles que l’automobile. Cependant, les limites du modèle sont atteintes lorsque les données sont moins nombreuses, plus volatiles et irrégulières dans le temps, telles que les sinistres aviation et maritime. Aujourd’hui, les entreprises d’assurance ont à disposition de nombreuses données concernant les sinistres et les assurés, sur un historique de plusieurs années. Cette grande volumétrie, octroie de nouveaux outils aux actuaires et leur permet de se tourner vers de nouvelles méthodes pour la tarification, mais également en provisionnement. De ce fait, de nouvelles méthodes de provisionnement ont vu le jour ces dernière années, dont de nombreuses basées sur des méthodes ligne à ligne grâce au Machine Learning. De ce fait, dans ce mémoire, nous allons appliquer des méthodes de provisionnement ligne à ligne grâce à plusieurs modèles de partitionnement récursifs basés sur la méthode CART (Classification And Regression Trees) définie par Breiman L. et al. (1984), ainsi qu’un modèle de régression pénalisée, Elastic Net, définie par Zou H. et Hastie T. (2004), afin de prédire la charge ultime d’un exercice de souscription, à partir des informations disponibles à sa deuxième année de développement. Pour tester la capacité de prédiction de ces modèles, ces derniers sont appliqués à deux portefeuilles de la même Line of Business, Marine Aviation Transport, une branche contenant des portefeuilles tous deux plus ou moins volatils et plus ou moins sinistrés, sur lesquels la méthode du Chain Ladder nous montre ses limites. La notion de censure, très importante lors de l’application de ces méthodes est abordée, grâce à l’introductions des poids IPCW (Inverse Probability of Censoring Weighting). A l’issue de ces tests, les deux prédictions obtenues sont confrontées à leur résultat Chain Ladder respectifs, afin d’identifier les modèles les plus précis, et les raisons des différences en termes de qualité de résultats. Mots clés : Charge ultime, Best Estimate, Censure, IPCW, Kaplan Meier, CART, Forêts aléatoires, Boosting de gradient, XGBoost, Elastic Net, Aviation, Maritime.
Abstract
In insurance, the ultimate loss cost, calculated during reserving, is a fundamental concept for the company. It must be calculated with care, since the Best Estimate, an important part when calculating the reserving risk under solvency 2 results from it. This ultimate charge is generally obtained by deterministic actuarial methods, like Chain Ladder. This method is particularly suitable for mass insurance, such as auto. However, the limits of the model are reached when the data are fewer, more volatile and irregular over time, such as aviation and marine claims. Today, insurance companies have access to a lot of data concerning claims and the insured, over a history of several years. This large volume provides new tools to actuaries and allows them use new methods for pricing, but also for reserving. As a result, new reserving methods have emerged in recent years, many of which are based on line-by-line methods using Machine Learning. Therefore, in this dissertation, we will apply line-by-line reserving methods using several recursive partitioning models based on the CART (Classification And Regression Trees) method defined by Breiman L. et al. (1984), as well as a penalized regression model, Elastic Net, defined by Zou H. and Hastie T. (2004), in order to predict the ultimate loss cost of an underwriting year, from the information available at its second year of development. To test the level of prediction of these models, they are applied to two portfolios of the same Line of Business, Marine Aviation Transport, a branch containing portfolios both more or less volatile and with more or less claims, on which the method of Chain Ladder shows us its limits. The notion of censorship, which is very important when applying these methods, is addressed, thanks to the introduction of IPCW weights (Inverse Probability of Censoring Weighting). At the end of these tests, the two predictions obtained are compared with their respective Chain Ladder results, in order to identify the most accurate models, and the reasons for the differences in terms of quality of results are explained. Key words: Ultimate loss cost, Best Estimate, Censorship, IPCW, Kaplan Meier, CART, Random Forest, Gradient boosting, XGBoost, Elastic Net, Aviation, Maritime.
Mémoire complet
Auteur(s) LEJEUNE M.
Société La Réunion Aérienne
Année 2023
Résumé
En assurance, la charge ultime, calculée lors du provisionnement, est une notion fondamentale pour l’entreprise. Celle-ci doit être calculée avec soin, puisque le Best Estimate, part importante lors du calcul du risque de réserve sous solvabilité 2 en découle. Cette charge ultime, est généralement obtenue par des méthodes actuarielles déterministes, du type Chain Ladder. Cette méthode est particulièrement adaptée aux assurances de masses, telles que l’automobile. Cependant, les limites du modèle sont atteintes lorsque les données sont moins nombreuses, plus volatiles et irrégulières dans le temps, telles que les sinistres aviation et maritime. Aujourd’hui, les entreprises d’assurance ont à disposition de nombreuses données concernant les sinistres et les assurés, sur un historique de plusieurs années. Cette grande volumétrie, octroie de nouveaux outils aux actuaires et leur permet de se tourner vers de nouvelles méthodes pour la tarification, mais également en provisionnement. De ce fait, de nouvelles méthodes de provisionnement ont vu le jour ces dernière années, dont de nombreuses basées sur des méthodes ligne à ligne grâce au Machine Learning. De ce fait, dans ce mémoire, nous allons appliquer des méthodes de provisionnement ligne à ligne grâce à plusieurs modèles de partitionnement récursifs basés sur la méthode CART (Classification And Regression Trees) définie par Breiman L. et al. (1984), ainsi qu’un modèle de régression pénalisée, Elastic Net, définie par Zou H. et Hastie T. (2004), afin de prédire la charge ultime d’un exercice de souscription, à partir des informations disponibles à sa deuxième année de développement. Pour tester la capacité de prédiction de ces modèles, ces derniers sont appliqués à deux portefeuilles de la même Line of Business, Marine Aviation Transport, une branche contenant des portefeuilles tous deux plus ou moins volatils et plus ou moins sinistrés, sur lesquels la méthode du Chain Ladder nous montre ses limites. La notion de censure, très importante lors de l’application de ces méthodes est abordée, grâce à l’introductions des poids IPCW (Inverse Probability of Censoring Weighting). A l’issue de ces tests, les deux prédictions obtenues sont confrontées à leur résultat Chain Ladder respectifs, afin d’identifier les modèles les plus précis, et les raisons des différences en termes de qualité de résultats. Mots clés : Charge ultime, Best Estimate, Censure, IPCW, Kaplan Meier, CART, Forêts aléatoires, Boosting de gradient, XGBoost, Elastic Net, Aviation, Maritime.
Abstract
In insurance, the ultimate loss cost, calculated during reserving, is a fundamental concept for the company. It must be calculated with care, since the Best Estimate, an important part when calculating the reserving risk under solvency 2 results from it. This ultimate charge is generally obtained by deterministic actuarial methods, like Chain Ladder. This method is particularly suitable for mass insurance, such as auto. However, the limits of the model are reached when the data are fewer, more volatile and irregular over time, such as aviation and marine claims. Today, insurance companies have access to a lot of data concerning claims and the insured, over a history of several years. This large volume provides new tools to actuaries and allows them use new methods for pricing, but also for reserving. As a result, new reserving methods have emerged in recent years, many of which are based on line-by-line methods using Machine Learning. Therefore, in this dissertation, we will apply line-by-line reserving methods using several recursive partitioning models based on the CART (Classification And Regression Trees) method defined by Breiman L. et al. (1984), as well as a penalized regression model, Elastic Net, defined by Zou H. and Hastie T. (2004), in order to predict the ultimate loss cost of an underwriting year, from the information available at its second year of development. To test the level of prediction of these models, they are applied to two portfolios of the same Line of Business, Marine Aviation Transport, a branch containing portfolios both more or less volatile and with more or less claims, on which the method of Chain Ladder shows us its limits. The notion of censorship, which is very important when applying these methods, is addressed, thanks to the introduction of IPCW weights (Inverse Probability of Censoring Weighting). At the end of these tests, the two predictions obtained are compared with their respective Chain Ladder results, in order to identify the most accurate models, and the reasons for the differences in terms of quality of results are explained. Key words: Ultimate loss cost, Best Estimate, Censorship, IPCW, Kaplan Meier, CART, Random Forest, Gradient boosting, XGBoost, Elastic Net, Aviation, Maritime.
Mémoire complet