Mémoires d'Actuariat
Illustration des techniques de Machine Learning dans le cadre de la refonte d’un zonier dégât des eaux
Auteur(s) SOUPLET G.
Société MMA
Année 2023
Confidentiel jusqu'au 10/11/2025
Résumé
Le secteur de l'assurance professionnelle est très concurrentiel et les acteurs du marché doivent réussir à conserver leur part de marché tout en maintenant un équilibre financier. Une tarification adaptée et segmentée permet d’allier ces deux volets par un tarif attractif mais juste. Parmi les outils de segmentation du tarif, l’identification du risque en fonction des zones géographiques est un des outils importants permettant d’atteindre ces objectifs. Depuis quelques années, France Assureurs présente dans ces rapports annuels une hausse des prestations sur la garantie dégâts des eaux pour l’ensemble des acteurs. L’offre proposée par MMA pour assurer les professionnels n’échappe pas à ce constat et présente en effet des résultats largement dégradés sur cette garantie depuis plusieurs années. Pour contribuer au rééquilibrage tarifaire de la garantie, la révision du zonier actuel est l’une des solutions étudiées dans le cadre de ce mémoire. Les technologies de Data Science sont devenues des éléments clés pour la prise de décisions stratégiques dans le secteur de l'assurance. Ainsi l’objectif de ce mémoire est de comparer dans le cadre de la constitution d’un nouveau zonier à l’aide de diverses techniques de Machine Learning basées sur l’agrégation d’arbres comme le Random Forest, le Gradient Boosting ainsi que le XG Boost ; avec des méthodes usuelles de modélisation que sont les modèles linéaires généralisés. L’utilisation de données exogènes directement dans les modélisations rend possible l’identification du niveau de risque géographique sur l’ensemble du territoire sans nécessiter d’extrapoler le résultat du modèle sur les zones géographiques inconnues du portefeuille de contrat. La mise en lumière et la comparaison des modèles entre eux permet de conclure sur l’usage du modèle optimal à la fois d’un point de vue performance de modélisation mais également en tenant compte de critères d’exécution comme le temps de traitement algorithmique ainsi que de sa pertinence finale pour améliorer la segmentation tarifaire de la garantie. Mots clés : Assurance professionnelle, dégâts des eaux, zonier, données météorologiques, modèle linéaire généralisé, Data Science
Abstract
The professional insurance sector is highly competitive and market players must succeed in maintaining their market share while maintaining financial balance. An appropriate and segmented pricing policy allows to combine these two aspects with an attractive but fair rate. Among the pricing segmentation tools, the identification of risks based on geographical areas is one of the prominent tools to achieve these goals. For several years now, France Assureurs has reported an increase in claims related to water damage coverage for all actors in its annual reports. The offer proposed by MMA to insure professionals is not immune to this trend and has indeed shown largely degraded results on this coverage for several years. To contribute to the rebalancing of the pricing for this coverage, a revision of the current zoning system is one of the first solutions being studied. Data Science technologies have become key elements in strategic decision-making in the insurance sector. Thus, the objective of this thesis is to compare various Machine Learning techniques based on tree aggregation such as Random Forest, Gradient Boosting, and XGBoost ; to the classic models such as generalized linear models in the creation of a new zoning system. The use of exogenous data directly in the modeling makes it possible to identify the level of geographic risk over the entire territory without requiring extrapolation of the model result to unknown geographic areas of the contract portfolio. Highlighting and comparing the models allows us to conclude on the optimal use of the model from a modeling performance perspective and taking into account execution criteria such as algorithm processing time as well as as well as its final relevance for improving the price segmentation of the guarantee. Keywords : Professional insurance, water damage, zoning system, weather data, generalized linear model, data science.
Auteur(s) SOUPLET G.
Société MMA
Année 2023
Confidentiel jusqu'au 10/11/2025
Résumé
Le secteur de l'assurance professionnelle est très concurrentiel et les acteurs du marché doivent réussir à conserver leur part de marché tout en maintenant un équilibre financier. Une tarification adaptée et segmentée permet d’allier ces deux volets par un tarif attractif mais juste. Parmi les outils de segmentation du tarif, l’identification du risque en fonction des zones géographiques est un des outils importants permettant d’atteindre ces objectifs. Depuis quelques années, France Assureurs présente dans ces rapports annuels une hausse des prestations sur la garantie dégâts des eaux pour l’ensemble des acteurs. L’offre proposée par MMA pour assurer les professionnels n’échappe pas à ce constat et présente en effet des résultats largement dégradés sur cette garantie depuis plusieurs années. Pour contribuer au rééquilibrage tarifaire de la garantie, la révision du zonier actuel est l’une des solutions étudiées dans le cadre de ce mémoire. Les technologies de Data Science sont devenues des éléments clés pour la prise de décisions stratégiques dans le secteur de l'assurance. Ainsi l’objectif de ce mémoire est de comparer dans le cadre de la constitution d’un nouveau zonier à l’aide de diverses techniques de Machine Learning basées sur l’agrégation d’arbres comme le Random Forest, le Gradient Boosting ainsi que le XG Boost ; avec des méthodes usuelles de modélisation que sont les modèles linéaires généralisés. L’utilisation de données exogènes directement dans les modélisations rend possible l’identification du niveau de risque géographique sur l’ensemble du territoire sans nécessiter d’extrapoler le résultat du modèle sur les zones géographiques inconnues du portefeuille de contrat. La mise en lumière et la comparaison des modèles entre eux permet de conclure sur l’usage du modèle optimal à la fois d’un point de vue performance de modélisation mais également en tenant compte de critères d’exécution comme le temps de traitement algorithmique ainsi que de sa pertinence finale pour améliorer la segmentation tarifaire de la garantie. Mots clés : Assurance professionnelle, dégâts des eaux, zonier, données météorologiques, modèle linéaire généralisé, Data Science
Abstract
The professional insurance sector is highly competitive and market players must succeed in maintaining their market share while maintaining financial balance. An appropriate and segmented pricing policy allows to combine these two aspects with an attractive but fair rate. Among the pricing segmentation tools, the identification of risks based on geographical areas is one of the prominent tools to achieve these goals. For several years now, France Assureurs has reported an increase in claims related to water damage coverage for all actors in its annual reports. The offer proposed by MMA to insure professionals is not immune to this trend and has indeed shown largely degraded results on this coverage for several years. To contribute to the rebalancing of the pricing for this coverage, a revision of the current zoning system is one of the first solutions being studied. Data Science technologies have become key elements in strategic decision-making in the insurance sector. Thus, the objective of this thesis is to compare various Machine Learning techniques based on tree aggregation such as Random Forest, Gradient Boosting, and XGBoost ; to the classic models such as generalized linear models in the creation of a new zoning system. The use of exogenous data directly in the modeling makes it possible to identify the level of geographic risk over the entire territory without requiring extrapolation of the model result to unknown geographic areas of the contract portfolio. Highlighting and comparing the models allows us to conclude on the optimal use of the model from a modeling performance perspective and taking into account execution criteria such as algorithm processing time as well as as well as its final relevance for improving the price segmentation of the guarantee. Keywords : Professional insurance, water damage, zoning system, weather data, generalized linear model, data science.