Mémoires d'Actuariat

Analyse comparative des méthodes de Machine Learning et de Deep Learning en provisionnement non-vie
Auteur(s) EL KASMI A.
Société Addactis France
Année 2023

Résumé
Ces dernières années, de nouvelles méthodes basées sur l'apprentissage automatique et l'apprentissage profond en particulier ont révolutionné le travail des actuaires, y compris dans le domaine du provisionnement en assurance non-vie. Ces méthodes ont fait preuve d'obtenir une estimation centrale plus précise que celle obtenue par des méthodes usuelles comme Chain-Ladder et GLM ODP. Cependant, à ce jour, les applications de ces méthodes dans le provisionnement en vision agrégée ont été principalement axées sur la prédiction de l'estimation centrale. Dans la pratique, l'estimation de la distribution des provisions est aussi importante pour l'allocation de capital qui satisfait aux exigences réglementaires, afin de mieux évaluer les risques de provisions et mieux connaître leurs portefeuilles de sinistres. Ce mémoire applique les méthodes d'apprentissage automatique (arbre de décision, forêt aléatoire et XGBoost avec une régression Tweedie) et le Mixture Density Network (MDN), un réseau de neurones qui se concentre sur la prévision probabiliste en appliquant un mélange gaussien aux données incrémentaux, pour obtenir simultanément une estimation centrale précise et un choix de distribution flexible. L'ajustement des modèles est effectué en utilisant une approche de type ROCV (Rolling-Origin Cross Validation). Tout au long de ce mémoire, nous nous concentrons sur les triangles de développement (données incrémentaux) et nous montrons que les modèles MDN et XGBoost avec une régression Tweedie sont plus performants que les méthodes usuelles, même avec des quantités de données relativement limitées. Nous utilisons à la fois des données simulées pour valider les résultats et des données réelles pour illustrer et vérifier le caractère pratique des approches.

Abstract
In recent years, new methods based on Machine Learning and Deep Learning in particular have revolutionized the work of actuaries, including in the field of non-life insurance reserving. These methods have proven to obtain a more accurate best estimate than that obtained by usual methods such as Chain-Ladder and GLM ODP. However, to this day, the applications of these methods in aggregate reserving have been mainly focused on the prediction of the best estimate. In fact, estimating the distribution of reserves is also important for risk assessment and measurement, to better assess the risks of reserves and to better understand their claims portfolios. This dissertation Applies Machine Learning methods (decision tree, random forest and XGBoost with Tweedie regression) and the Mixture Density Network (MDN), a neural network that focuses on probabilistic forecasting by applying a mixture Gaussian to incremental data, to simultaneously obtain an accurate best estimate and a flexible distribution choice. Model fitting is performed using a Rolling-Origin Cross Validation (ROCV) approach. Throughout this work, we focus on development triangles (incremental data) and show that MDN and XGBoost models with Tweedie regression perform better than the usual methods, even with relatively limited amounts of data. We use both simulated data to validate the properties and real data to illustrate and verify the practicality of the approaches.

Mémoire complet