Mémoires d'Actuariat
Construction d'un modèle de Machine Learning interprétable pour la tarification en assurance non-vie
Auteur(s) KRUPOVA M.
Société Addactis France
Année 2023
Résumé
Dans un contexte d’accroissement perpétuel de la concurrence et d’une pression réglementaire très forte, la justesse et la précision actuarielle du tarif sont des enjeux clefs pour le secteur de l’assurance non-vie. Les modèles linéaires généralisés traditionnellement utilisés donnent lieu à un tarif multiplicatif favorisant l’interprétabilité et l’applicabilité opérationnelle. D’autre part, les méthodes et algorithmes issus de l’Apprentissage Statistique, ou Machine Learning, se focalisent sur un objectif prédictif et permettent de construire des modèles ayant une précision accrue et une forte capacité à capturer des non-linéarités inhérentes à la donnée. La performance de ces modèles se heurte cependant à leur complexité et leur faible interprétabilité. Au-delà d’une analyse séparée des modèles linéaires généralisés et des modèles de Machine Learning, l’objectif de ce mémoire est de construire une méthode exploitant conjointement les avantages de ces deux approches, un modèle atteignant un fort pouvoir prédictif tout en conservant une interprétabilité intrinsèque. Partant des données d’un assureur, nous appliquons alors le modèle additif généralisé dont nous exploitons la structure additive combinant habituellement des fonctions splines pour introduire des fonctions composantes incorporant des modèles de Machine Learning. Au lieu d’interpréter un modèle de Machine Learning, nous construisons ainsi un modèle de Machine Learning intrinsèquement interprétable, un modèle Glass Box. Nous montrons l’intérêt de ce type de modélisation dans la tarification en assurance non-vie. Mots clés Assurance non-vie, Modèle linéaire généralisé, Modèle additif généralisé, Machine Learning, Interprétabilité, Modèle Glass Box.
Abstract
In the face of the ever-increasing competition and mounting regulatory pressure, actuarial precision and accuracy shape the art of setting the price in the non-life insurance sector. Generalized linear models are the standard method in pricing of non-life insurance products, leading to a multiplicative tariff that is immediately interpretable and operationally efficient. In recent years, the advent of Machine Learning has been termed the next frontier of innovation and productivity, focusing on predictive power and capturing the inherent non-linearity of the data. However, the high accuracy of complex models comes at the cost of interpretability. Beyond the separate analysis of the generalized linear models and Machine Learning methods, the aim of this master thesis is to bring these two classes of models with their complementing properties together. In other words, the objective is to propose a model that achieves high predictive accuracy while retaining much of the intelligibility of linear models. Working with insurer data, we apply the generalized additive model which explicitly decomposes a complex function into one-dimensional building-blocks, usually the spline functions, and we extend the framework to Machine Learning components. Rather than interpreting Machine Learning models, we construct models that are intrinsically interpretable, the Glass Box models. Our experiments show the potential of this approach in the field of non-life insurance pricing. Keywords Non-life insurance, Generalized linear model, Generalized additive model, Machine Learning, Interpretability, Glass Box model.
Mémoire complet
Auteur(s) KRUPOVA M.
Société Addactis France
Année 2023
Résumé
Dans un contexte d’accroissement perpétuel de la concurrence et d’une pression réglementaire très forte, la justesse et la précision actuarielle du tarif sont des enjeux clefs pour le secteur de l’assurance non-vie. Les modèles linéaires généralisés traditionnellement utilisés donnent lieu à un tarif multiplicatif favorisant l’interprétabilité et l’applicabilité opérationnelle. D’autre part, les méthodes et algorithmes issus de l’Apprentissage Statistique, ou Machine Learning, se focalisent sur un objectif prédictif et permettent de construire des modèles ayant une précision accrue et une forte capacité à capturer des non-linéarités inhérentes à la donnée. La performance de ces modèles se heurte cependant à leur complexité et leur faible interprétabilité. Au-delà d’une analyse séparée des modèles linéaires généralisés et des modèles de Machine Learning, l’objectif de ce mémoire est de construire une méthode exploitant conjointement les avantages de ces deux approches, un modèle atteignant un fort pouvoir prédictif tout en conservant une interprétabilité intrinsèque. Partant des données d’un assureur, nous appliquons alors le modèle additif généralisé dont nous exploitons la structure additive combinant habituellement des fonctions splines pour introduire des fonctions composantes incorporant des modèles de Machine Learning. Au lieu d’interpréter un modèle de Machine Learning, nous construisons ainsi un modèle de Machine Learning intrinsèquement interprétable, un modèle Glass Box. Nous montrons l’intérêt de ce type de modélisation dans la tarification en assurance non-vie. Mots clés Assurance non-vie, Modèle linéaire généralisé, Modèle additif généralisé, Machine Learning, Interprétabilité, Modèle Glass Box.
Abstract
In the face of the ever-increasing competition and mounting regulatory pressure, actuarial precision and accuracy shape the art of setting the price in the non-life insurance sector. Generalized linear models are the standard method in pricing of non-life insurance products, leading to a multiplicative tariff that is immediately interpretable and operationally efficient. In recent years, the advent of Machine Learning has been termed the next frontier of innovation and productivity, focusing on predictive power and capturing the inherent non-linearity of the data. However, the high accuracy of complex models comes at the cost of interpretability. Beyond the separate analysis of the generalized linear models and Machine Learning methods, the aim of this master thesis is to bring these two classes of models with their complementing properties together. In other words, the objective is to propose a model that achieves high predictive accuracy while retaining much of the intelligibility of linear models. Working with insurer data, we apply the generalized additive model which explicitly decomposes a complex function into one-dimensional building-blocks, usually the spline functions, and we extend the framework to Machine Learning components. Rather than interpreting Machine Learning models, we construct models that are intrinsically interpretable, the Glass Box models. Our experiments show the potential of this approach in the field of non-life insurance pricing. Keywords Non-life insurance, Generalized linear model, Generalized additive model, Machine Learning, Interpretability, Glass Box model.
Mémoire complet