Mémoires d'Actuariat

Utilisation des SHAP values pour une tarification du produit RC Industries et Commerces à la maille NAF
Auteur(s) FERON S.
Société AXA France IARD
Année 2023
Confidentiel jusqu'au 24/03/2025

Résumé
L’objectif de ce mémoire est de revoir la tarification du produit Responsabilité Civile Entreprises sur le périmètre Industries et Commerces en optimisant le tarif par une segmentation plus fine des activités et une meilleure connaissance du risque. La Responsabilité Civile Entreprises est une branche d’intensité à déroulement long. Le faible volume de sinistres, la charge importante de chaque sinistre pour laquelle la modélisation d’un coût moyen est moins pertinente que sur une branche de fréquence, ainsi que la définition de l’historique représentent une première difficulté. Le nombre de modalités de la variable code NAF (Nomenclature d’Activités Française qui est la nomenclature des activités économiques productives, élaborée pour faciliter l’organisation de l’information économique et sociale) qui ne permet pas son utilisation dans un modèle linéaire est une seconde difficulté dont nous devons nous affranchir. Le but de nos travaux est donc de répondre simplement à une demande complexe de la direction technique et des souscripteurs : obtenir un obtenir un taux à appliquer au chiffre d’affaires des entreprises différencié selon les 300 codes NAF, segmenté selon les variables explicatives. Les travaux porteront sur la prédiction de la charge sinistres en exploitant les SHAP values (SHapley Additive exPlanations), dérivées des valeurs de Shapley utilisées dans la théorie des jeux, en complément d’un modèle linéaire généralisé afin de tester la faisabilité de cette méthode pour affiner et différencier nos résultats.

Abstract
The objective of this study is to review the pricing of the Corporate Liability product dedicated to industries, wholesale and retail businesses. This work is done by optimizing the tariff by better segmentation of activities and knowledge of the risk. Corporate Liability is a long-term branch of intensity. The low volume of claims, the high amount of each claim for which the use of an average cost is less relevant than on a frequency branch, as well as the definition of the history represent a first difficulty. The number of modalities of the NAF code variable (Nomenclature d'Activités Française which is the nomenclature of productive economic activities, developed to facilitate the organization of economic and social information) is a second difficulty because it cannot be used in a linear model. The purpose of our work is therefore to help the technical management and subscribers to obtain a rate that can be applied to the turnover of companies. This rate should be determined for more than 300 NAF codes. Some explanatory variables of the risk will be added in addition of this rate to calculate the tariff. 2 The work will focus on predicting claims cost by exploiting SHAP values (SHapley Additive exPlanations). SHAP Values are derived from Shapley values used in game theory. Additionally, the feasibility of this method was tested with a linear model to refine and differentiate our results.