Mémoires d'Actuariat

Impact de l'ajout d' Open Data dans la modélisation de la garantie climatique en MRH.
Auteur(s) NIKIEMA K.
Société AXA FRANCE TARD
Année 2023
Confidentiel jusqu'au 08/09/2025

Résumé
Face aux défis posés par le changement climatique et à l’essor des Open Data, ce mémoire se concentre sur l’impact de l’intégration de ces données dans la modélisation de la garantie climatique des propriétaires de maison en Multirisques Habitation (MRH). Cette garantie prend en charge les sinistres issus d’événements climatiques ne faisant pas l’objet d’un arrêté de catastrophe naturelle. Le ratio Sinistres sur Cotisations (S/C) de cette garantie excède 180 % pour les propriétaires de maison, qui forment plus de 90 % du portefeuille. Ainsi, l'étude vise à améliorer les performances du modèle pour obtenir des ratios S/C plus favorables. C’est dans cette optique que la base de Demandes de Valeurs Foncières (DVF), qui fournit les valeurs foncières des transactions immobilières en France, sera explorée. Cette étude de la base DVF vise à optimiser particulièrement le modèle de coût moyen. En effet, les bases de données internes de la MRH ne contiennent aucune donnée sur la valeur immobilière des habitations. Dans le cadre de la modélisation, les Modèles Linéaires Généralisés pénalisés (GLM) de type LASSO, reconnus pour leur efficacité, seront privilégiés. De plus, une approche zonière, particulièrement pertinente en MRH, sera adoptée. C’est à la suite de ce zonage que les données ouvertes seront ajoutées, ce qui permettra l’évaluation de leur impact sur les performances des modèles. Par ailleurs, dans le but d’optimiser davantage la modélisation et d’apporter une dimension supplémentaire à l’analyse, l’étude envisage d’explorer le potentiel des forêts aléatoires, une méthode d’apprentissage statistique avancée. Finalement, ce mémoire cherche à apporter une nouvelle perspective sur la modélisation de la garantie climatique en intégrant des données ouvertes, tout en combinant différents types de méthodologies.

Abstract
Faced with the challenges of climate change and the rise of Open Data, this thesis examines the impact of integrating these data into the modelling of homeowners’ climate cover in Home Multi-Risk Insurance (MRH). This insurance covers damages from climatic events not covered by a natural disaster decree. The Claims to Contributions Ratio for this insurance exceeds 180% for homeowners, constituting over 90% of the portfolio. Thus, the study aims to enhance the model's performance to achieve more favorable C/P ratios. In this perspective, the base of Property Value Requests (DVF), providing property values from real estate transactions in France, will be explored. This study of the DVF database aims to optimize the average cost model, given the absence of property value data in the MRH's internal databases. In the modeling framework, Penalized Generalized Linear Models (GLM) of the LASSO type, recognized for their efficiency, will be favored. Additionally, a zoning approach, particularly relevant in MRH, will be adopted. Following this zoning, open data will be added, allowing the assessment of their impact on model performance. Furthermore, to further optimize the modeling and introduce an additional dimension to the analysis, the study considers exploring the potential of random forests, an advanced statistical learning method. Ultimately, this thesis seeks to provide a new perspective on climate insurance modeling by integrating open data while combining different methodologies.