Mémoires d'Actuariat
Apport de la Data Science pour la tarification en assurance MRH
Auteur(s) BARLIOT E.
Société Generali
Année 2023
Confidentiel jusqu'au 09/05/2025
Résumé
La constante évolution des contextes économique, réglementaire, juridique et environnemental conduit les différents acteurs du marché de l’assurance à faire face à une forte concurrence. Ce contexte difficile contraint les assureurs à devoir trouver le bon équilibre entre proposer un niveau de prime acceptable et maintenir une rentabilité technique. Pour résoudre cette problématique, les compagnies se reposent notamment sur l’optimisation des processus de tarification, élément qui constitue un des cœurs de métier de l’actuariat. Parmi tous les outils disponibles, les plus anciens, nommés GLM (modèles linéaires généralisés), restent les plus fréquemment utilisés dans le processus de tarification. Ce mémoire propose une étude comparative et concurrentielle de ce type de modèle avec des pratiques de Data Science innovantes sur cinq garanties d’une assurance multirisque habitation, où l’éventuel apport de ces méthodes non paramétriques (arbre de régression, Random Forest et Gradient Boosting) sera recherché. Pour déterminer si l’utilisation des méthodes de Data Science représente ou non une avancée par rapport aux méthodes GLM, cette étude va s’appuyer sur l’analyse d’indicateurs permettant de mesurer les performances prédictives des différents modèles comparés : la MSE et sa racine carrée, la RMSE, moins sensible aux valeurs extrêmes, mais aussi l’indice de Gini. L’étude comporte trois grands axes : le premier présente le marché et les modèles utilisés, le second met en œuvre ces modèles pour l’estimation de la fréquence et du coût et le dernier analyse les résultats obtenus en les comparant avec le tarif actuellement en vigueur au sein de l’entreprise initiatrice de ce projet, l’ÉQUITÉ, filiale dédiée à la gestion des partenariats de GENERALI France.
Abstract
The constant evolution of the economic, regulatory, legal and environmental context leads the various players in the insurance market to face a strong competition. This difficult context forces insurers to find the right balance between offering an acceptable level of premium and maintaining a technical profitability. To overcome this issue, companies are relying on the optimization of the pricing process in particular, which is one of the core businesses of actuarial sciences. Among all the methods available, one of the oldest, named GLM (generalized linear models), remains the most frequently used in the pricing process. This dissertation proposes a comparative and competitive study of this type of model with innovative Data Science practices on five guarantees of home insurance, where the possible benefits of these non-parametric methods (regression tree, Random Forest and Gradient Boosting) will be sought. To determine whether or not the use of Data Science methods represents an advance over GLM methods, this study will be based on the analysis of indicators that allow to measure the predictive performance of the various compared models: the MSE and its square root, the RMSE, less sensitive to extremes values, and also the Gini index. The study has three main axes: the first presents the market and the models used, the second implements these models for both the frequency and cost estimation and the last one analyzes the results obtained by comparing them with the rate currently in effect within the company initiating this project, l’ÉQUITÉ, a subsidiary dedicated to managing GENERALI France’s partnerships.
Auteur(s) BARLIOT E.
Société Generali
Année 2023
Confidentiel jusqu'au 09/05/2025
Résumé
La constante évolution des contextes économique, réglementaire, juridique et environnemental conduit les différents acteurs du marché de l’assurance à faire face à une forte concurrence. Ce contexte difficile contraint les assureurs à devoir trouver le bon équilibre entre proposer un niveau de prime acceptable et maintenir une rentabilité technique. Pour résoudre cette problématique, les compagnies se reposent notamment sur l’optimisation des processus de tarification, élément qui constitue un des cœurs de métier de l’actuariat. Parmi tous les outils disponibles, les plus anciens, nommés GLM (modèles linéaires généralisés), restent les plus fréquemment utilisés dans le processus de tarification. Ce mémoire propose une étude comparative et concurrentielle de ce type de modèle avec des pratiques de Data Science innovantes sur cinq garanties d’une assurance multirisque habitation, où l’éventuel apport de ces méthodes non paramétriques (arbre de régression, Random Forest et Gradient Boosting) sera recherché. Pour déterminer si l’utilisation des méthodes de Data Science représente ou non une avancée par rapport aux méthodes GLM, cette étude va s’appuyer sur l’analyse d’indicateurs permettant de mesurer les performances prédictives des différents modèles comparés : la MSE et sa racine carrée, la RMSE, moins sensible aux valeurs extrêmes, mais aussi l’indice de Gini. L’étude comporte trois grands axes : le premier présente le marché et les modèles utilisés, le second met en œuvre ces modèles pour l’estimation de la fréquence et du coût et le dernier analyse les résultats obtenus en les comparant avec le tarif actuellement en vigueur au sein de l’entreprise initiatrice de ce projet, l’ÉQUITÉ, filiale dédiée à la gestion des partenariats de GENERALI France.
Abstract
The constant evolution of the economic, regulatory, legal and environmental context leads the various players in the insurance market to face a strong competition. This difficult context forces insurers to find the right balance between offering an acceptable level of premium and maintaining a technical profitability. To overcome this issue, companies are relying on the optimization of the pricing process in particular, which is one of the core businesses of actuarial sciences. Among all the methods available, one of the oldest, named GLM (generalized linear models), remains the most frequently used in the pricing process. This dissertation proposes a comparative and competitive study of this type of model with innovative Data Science practices on five guarantees of home insurance, where the possible benefits of these non-parametric methods (regression tree, Random Forest and Gradient Boosting) will be sought. To determine whether or not the use of Data Science methods represents an advance over GLM methods, this study will be based on the analysis of indicators that allow to measure the predictive performance of the various compared models: the MSE and its square root, the RMSE, less sensitive to extremes values, and also the Gini index. The study has three main axes: the first presents the market and the models used, the second implements these models for both the frequency and cost estimation and the last one analyzes the results obtained by comparing them with the rate currently in effect within the company initiating this project, l’ÉQUITÉ, a subsidiary dedicated to managing GENERALI France’s partnerships.