Mémoires d'Actuariat
Mise en oeuvre d’un modèle de provisionnement individuel en assurance automobile et comparaison avec les méthodes agrégées classiques
Auteur(s) YAYA H.
Société Direct Assurances
Année 2023
Confidentiel jusqu'au 04/07/2025
Résumé
Mots clés : Provisionnement individuel, Apprentissage statistique, Modèles linéaires généralisés, XGBoost, Forêts aléatoires, Elastic Net, Chain-Ladder, Mack. Les méthodes de provisionnement individuel présentent de plus en plus un véritable attrait pour les actuaires responsables de l’inventaire des compagnies d’assurance. Contrairement aux méthodes agrégées classiques qui donnent l’estimation de la charge totale (Chain-Ladder, Bornhuetter-Ferguson, Mack, …), ces méthodes ont l’avantage de fournir des estimations détaillées sinistre par sinistre. Dans ce mémoire, nous nous intéressons ainsi à la mise en œuvre d’un modèle de provisionnement individuel dont les résultats seront confrontés aux méthodes agrégées Chain-Ladder. Notre objectif est de mieux tirer parti d’informations individuelles omniprésentes et disponibles dans les bases des assureurs. Nous utiliserons notamment une base de données réelles d’une garantie responsabilité civile matérielle. Cette base comporte de nombreuses variables descriptives sur les sinistres : le lieu de survenance du sinistre, l’âge du véhicule sinistré ou encore la typologie du sinistre. Le point de départ de notre étude est un mémoire d’actuariat, celui de Damien Fabre Rudelle (2018) qui lui-même reprend l’approche développée par Harej et al. (2017) dans leur article de reporting intitulé « Individual claim development with machine learning ». C’est cette approche qui sera détaillée dans ce mémoire, de sa compréhension jusqu’à la mise en place des algorithmes sur des données réelles.
Abstract
Keywords: Individual claim reserving, Machine Learning, Generalized Linear Models, XGBoost, Random forest, Elastic Net, Chain-Ladder, Mack. Individual claim reserving methods increasingly interest actuaries from reserving departments. Indeed, while traditional aggregate methods evaluate a statistical amount of reserve, based on the calculation of the ultimate cost by accidental year (Chain-Ladder, Bornhuetter-Ferguson, Mack, …), these methods provide an accurate prediction of the ultimate year cost case by case. In this paper, we will focus on the implementation of an individual claim reserving method whose results will be compared with aggregate reserving methods such as Chain-Ladder. We aim at using the full potential of individual data that is omnipresent and available in insurers databases. Therefore, we will base our work on a dataset about property damage of a general liability policy cover. It includes detailed claim-level data with many explanatory variables, such as the age of the damaged vehicle, the claim’s place of occurrence or the type of claim. The starting point of this study is an actuarial thesis from Damien Fabre Rudelle (2018) which itself takes up the approach initiated by Harej and al. (2017) in their report entitled « Individual claim development with machine learning ». This approach will be detailed throughout our report, from its understanding to the implementation of the algorithms on real data.
Auteur(s) YAYA H.
Société Direct Assurances
Année 2023
Confidentiel jusqu'au 04/07/2025
Résumé
Mots clés : Provisionnement individuel, Apprentissage statistique, Modèles linéaires généralisés, XGBoost, Forêts aléatoires, Elastic Net, Chain-Ladder, Mack. Les méthodes de provisionnement individuel présentent de plus en plus un véritable attrait pour les actuaires responsables de l’inventaire des compagnies d’assurance. Contrairement aux méthodes agrégées classiques qui donnent l’estimation de la charge totale (Chain-Ladder, Bornhuetter-Ferguson, Mack, …), ces méthodes ont l’avantage de fournir des estimations détaillées sinistre par sinistre. Dans ce mémoire, nous nous intéressons ainsi à la mise en œuvre d’un modèle de provisionnement individuel dont les résultats seront confrontés aux méthodes agrégées Chain-Ladder. Notre objectif est de mieux tirer parti d’informations individuelles omniprésentes et disponibles dans les bases des assureurs. Nous utiliserons notamment une base de données réelles d’une garantie responsabilité civile matérielle. Cette base comporte de nombreuses variables descriptives sur les sinistres : le lieu de survenance du sinistre, l’âge du véhicule sinistré ou encore la typologie du sinistre. Le point de départ de notre étude est un mémoire d’actuariat, celui de Damien Fabre Rudelle (2018) qui lui-même reprend l’approche développée par Harej et al. (2017) dans leur article de reporting intitulé « Individual claim development with machine learning ». C’est cette approche qui sera détaillée dans ce mémoire, de sa compréhension jusqu’à la mise en place des algorithmes sur des données réelles.
Abstract
Keywords: Individual claim reserving, Machine Learning, Generalized Linear Models, XGBoost, Random forest, Elastic Net, Chain-Ladder, Mack. Individual claim reserving methods increasingly interest actuaries from reserving departments. Indeed, while traditional aggregate methods evaluate a statistical amount of reserve, based on the calculation of the ultimate cost by accidental year (Chain-Ladder, Bornhuetter-Ferguson, Mack, …), these methods provide an accurate prediction of the ultimate year cost case by case. In this paper, we will focus on the implementation of an individual claim reserving method whose results will be compared with aggregate reserving methods such as Chain-Ladder. We aim at using the full potential of individual data that is omnipresent and available in insurers databases. Therefore, we will base our work on a dataset about property damage of a general liability policy cover. It includes detailed claim-level data with many explanatory variables, such as the age of the damaged vehicle, the claim’s place of occurrence or the type of claim. The starting point of this study is an actuarial thesis from Damien Fabre Rudelle (2018) which itself takes up the approach initiated by Harej and al. (2017) in their report entitled « Individual claim development with machine learning ». This approach will be detailed throughout our report, from its understanding to the implementation of the algorithms on real data.