Mémoires d'Actuariat
Estimation du coût de la sécheresse en France à l'aide de l'apprentissage automatique des données publiques
Auteur(s) PERON C.
Société Guy Carpenter
Année 2024
Confidentiel jusqu'au 24/01/2026
Résumé
Le retrait-gonflement des argiles en France est l'une des catastrophes naturelles les plus coûteuses dans le pays. Pour faire face à ce problème, la Caisse Centrale de Réassurance a mis en place une couverture qui indemnise 50% du coût total des sinistres liés à la subsidence pour les assureurs, ainsi que toutes les pertes au-delà d'un ratio sinistre sur prime de 200%. Cependant, la charge de l'assureur reste à 50%, ce qui les incite à provisionner de manière adéquate pour faire face à ces sinistres futurs. À ce jour, en raison de la complexité inhérente à ce phénomène, aucun consensus n'a encore été établi concernant l'estimation des coûts liés à ce phénomène. L'objectif de ce mémoire est donc de proposer une méthode d'estimation du coût du risque de sécheresse, qui se base sur les critères existants. Dans un premier temps, nous aborderons l'élaboration de la base de données nécessaires à l'estimation du coût. Lorsqu'il n'est pas possible d'utiliser exactement les mêmes données que celles employées pour reconnaître l'état de sécheresse d'une commune, nous prendrons des données publiques similaires. Ensuite, nous effectuerons une comparaison de modèles d'apprentissage automatique pour déterminer le modèle le plus performant. Ce modèle sera ensuite appliqué aux données sélectionnées afin de calculer la probabilité de reconnaissance d'une commune en état de sécheresse. Le but étant de proposer une méthode d'estimation du coût de la subsidence, nous expliquerons comment passer de ce modèle de reconnaissance à un modèle de coût. Enfin, nous expliquerons comment adapter ce modèle aux besoins des assureurs et examinerons l'évolution du régime en place.
Abstract
Shrink-swell clay in France is one of the most costly natural disasters in the country. To address this issue, the Caisse Centrale de Réassurance has implemented coverage that reimburses insurers for 50% of the total cost of subsidence-related claims, as well as all losses beyond a 200% claims-to-premium ratio. However, the insurer's burden remains at 50%, which encourages them to provision adequately for future claims. To date, due to the inherent complexity of this phenomenon, no consensus has been reached regarding the estimation of costs associated with it. Therefore, the objective of this paper is to propose a method for estimating the cost of drought risk based on existing criteria. Firstly, we will discuss the development of the necessary database for cost estimation. When it is not possible to use the exact same data used to recognize the drought status of a municipality, we will use similar public data. Next, we will compare machine learning models to determine the most effective model. This model will then be applied to the selected data to calculate the probability of recognizing a municipality in a drought state. The goal is to propose a method for estimating the cost of subsidence, so we will explain how to transition from this recognition model to a cost model. Finally, we will explain how to adapt this model to the needs of insurers and examine the evolution of the current regime.
Auteur(s) PERON C.
Société Guy Carpenter
Année 2024
Confidentiel jusqu'au 24/01/2026
Résumé
Le retrait-gonflement des argiles en France est l'une des catastrophes naturelles les plus coûteuses dans le pays. Pour faire face à ce problème, la Caisse Centrale de Réassurance a mis en place une couverture qui indemnise 50% du coût total des sinistres liés à la subsidence pour les assureurs, ainsi que toutes les pertes au-delà d'un ratio sinistre sur prime de 200%. Cependant, la charge de l'assureur reste à 50%, ce qui les incite à provisionner de manière adéquate pour faire face à ces sinistres futurs. À ce jour, en raison de la complexité inhérente à ce phénomène, aucun consensus n'a encore été établi concernant l'estimation des coûts liés à ce phénomène. L'objectif de ce mémoire est donc de proposer une méthode d'estimation du coût du risque de sécheresse, qui se base sur les critères existants. Dans un premier temps, nous aborderons l'élaboration de la base de données nécessaires à l'estimation du coût. Lorsqu'il n'est pas possible d'utiliser exactement les mêmes données que celles employées pour reconnaître l'état de sécheresse d'une commune, nous prendrons des données publiques similaires. Ensuite, nous effectuerons une comparaison de modèles d'apprentissage automatique pour déterminer le modèle le plus performant. Ce modèle sera ensuite appliqué aux données sélectionnées afin de calculer la probabilité de reconnaissance d'une commune en état de sécheresse. Le but étant de proposer une méthode d'estimation du coût de la subsidence, nous expliquerons comment passer de ce modèle de reconnaissance à un modèle de coût. Enfin, nous expliquerons comment adapter ce modèle aux besoins des assureurs et examinerons l'évolution du régime en place.
Abstract
Shrink-swell clay in France is one of the most costly natural disasters in the country. To address this issue, the Caisse Centrale de Réassurance has implemented coverage that reimburses insurers for 50% of the total cost of subsidence-related claims, as well as all losses beyond a 200% claims-to-premium ratio. However, the insurer's burden remains at 50%, which encourages them to provision adequately for future claims. To date, due to the inherent complexity of this phenomenon, no consensus has been reached regarding the estimation of costs associated with it. Therefore, the objective of this paper is to propose a method for estimating the cost of drought risk based on existing criteria. Firstly, we will discuss the development of the necessary database for cost estimation. When it is not possible to use the exact same data used to recognize the drought status of a municipality, we will use similar public data. Next, we will compare machine learning models to determine the most effective model. This model will then be applied to the selected data to calculate the probability of recognizing a municipality in a drought state. The goal is to propose a method for estimating the cost of subsidence, so we will explain how to transition from this recognition model to a cost model. Finally, we will explain how to adapt this model to the needs of insurers and examine the evolution of the current regime.