Mémoires d'Actuariat

Estimation de la valeur d'un portefeuille d'épargne avec des techniques de Machine Learning
Auteur(s) MOUAFO M.
Société CNP Assurances
Année 2023

Résumé
Afin d'évaluer la rentabilité ajustée au risque, les assureurs développent des modèles Actif/Passif de plus en plus sophistiqués et complexes. Dans ce mémoire, nous explorerons l'utilisation des techniques de Machine Learning pour estimer la valeur d'un portefeuille d'épargne (que nous noterons Value In Force ou VIF) en se basant sur des données et en identifiant les facteurs de risque clés qui influencent les résultats. Les résultats de cette étude ont pour but de fournir un dispositif rapide et fiable d'aide à la décision.\\ Les modèles retenus sont le XGBoost, le random forest, et la régression LASSO. Nous avons aussi proposé une approche par décomposition en sous variables, qui a pour but de prédire individuellement les trois principales variables qui constituent la VIF.\\ Il en ressort que la performance des méthodes retenues est fortement dépendante de la qualité de la base d'apprentissage. Le modèle XGBoost avec une approche par décomposition en sous variables présente les meilleures performances et des résultats satisfaisants.\\ Nous avons proposé une application concrète de ce modèle à travers le calcul du SCR.\\Nous avons d'autre part utilisé un module d'explicabilité des modèles de Machine Learning pour apprécier la cohérence des traitements restitués par notre modèle.\\ On en retient que ce genre de modélisation n’est pas sans risque d’erreurs, avec des biais qui peuvent être de sources différentes. On note par exemple le risque d’avis d’expert, de sélection de données et de de variables omises. Ensuite, plusieurs pistes d’investigations à entrevoir pour améliorer les résultats, en particulier au niveau de la base de données.

Abstract
In order to assess risk-adjusted profitability, insurers are developing increasingly sophisticated and complex Asset/Liability models. In this dissertation, we will explore the use of Machine Learning techniques to estimate the value of a savings portfolio (which we will denote Value In Force or VIF) based on data and identifying the key risk factors that influence the results. The results of this study are intended to provide a rapid and reliable decision-support tool. The models selected are XGBoost, random forest and LASSO regression. We have also proposed a sub-variable decomposition approach, which aims to predict individually the three main variables that make up the VIF. The results show that the performance of the selected methods is highly dependent on the quality of the learning base. The XGBoost model with a sub-variable decomposition approach showed the best performance and satisfactory results. We have proposed a concrete application of this model through the calculation of the SCR.We have also used a Machine Learning model explicability module to assess the consistency of the processing rendered by our model. Our conclusion is that this kind of modeling is not without risk of error, with biases that can come from a variety of sources. There is, for example, the risk of expert opinion, of selecting the wrong model, or of the wrong model being used.

Mémoire complet