Mémoires d'Actuariat

Interprétabilité des Modèles de Tarification en Actuariat : application à l'assurance automobile.
Auteur(s) FEUKAM KOUHOUE F.
Société Institut Europlace de Finance
Année 2023

Résumé
Avec l’avènement de nouvelles technologies couplé aux attentes sans cesse grandissantes des assurés -volonté d’hyperpersonnalisation de la relation client (assuré-assureur)-, la transformation numérique du secteur de l’assurance a beaucoup évolué au cours de ces deux dernières décennies et s’est vue fortement accélérée durant la récente crise sanitaire. Cette révolution digitale permet une collecte massive de données, offrant ainsi aux assureurs, la possibilité d’une segmentation beaucoup plus fine pour repérer les risques émergents de leurs portefeuilles et mieux ajuster leurs stratégies de gestion du risque. Avec cet essor de données massives, se sont simultanément développés de nouveaux algorithmes puissants d’apprentissage statistique permettant d’obtenir des modèles prédictifs beaucoup plus précis que par le passé : notamment les réseaux de neurones et les modèles par agrégation, etc. Cependant, bien qu’on leur reconnaisse un meilleur pouvoir prédictif, l’intégration de ces nouveaux modèles de tarification dans la modélisation actuarielle reste modérée dans le secteur français de l’assurance. Trois principales raisons justifient ce fait : en premier lieu, le manque d’interprétabilité lié au caractère "boîte-noire" de ces modèles −ce qui s’oppose à l’exigence réglementaire de transparence du processus de tarification exigée par l’ACPR−; en deuxième lieu, la complexité liée à la mise en œuvre de ces nouveaux modèles ; en dernier lieu, les problèmes d’éthique et de gouvernance liés à la non transparence de ces modèles. Pour lever le voile sur ces modèles et les rendre plus interprétables, depuis quelques années on assiste à une prolifération d’articles de recherche sur le sujet de l’intelligence artificielle interprétable (XAI). Dans ce contexte, ce mémoire vise à explorer et à illustrer l’usage des différentes méthodes d’interprétabilité les plus répandues dans la littérature indispensables à l’interprétabilité des modèles opaques d’apprentissage statistique. Nous étudions également les enjeux des données télématiques dans l’amélioration de la précision des modèles tarification en assurance automobile. Mots clefs: GLM, LocalGLMnet, Random Forest, Model Reliance (MR), SFIMP, PDP, ALE, ICE, H-statistique, Indices de Sobol, SHAP, LIME, RGPD, ACPR, XAI, Tarification automobile, Données télématiques de conduite.

Abstract
With the advent of new technologies coupled with the ever-increasing expectations of policyholders −a desire for hyper-personalization of the customer relationship (policyholder-insurer)− the digital transformation of the insurance sector has evolved significantly over the last two decades and was greatly accelerated during the recent health crisis. This digital revolution allows for massive data collection, thus offering insurers the possibility of a much finer segmentation to identify emerging risks in their portfolios and better adjust their risk management strategies. With the rise of massive data, new powerful and self-learning algorithms have simultaneously been developed to obtain much more accurate predictive models than in the past: notably neural networks and aggregation models, etc. However, although they are recognized as having better predictive power, the integration of these new so-called machine learning models into actuarial claims modeling remains moderate in the French insurance industry. There are three main reasons for this: firstly, the lack of interpretability linked to the "black box" nature of these models –which is contrary to the regulatory requirement of transparency in the pricing process required by the ACPR, or the RGPD−; secondly, the complexity of implementing and explaining these new models −the acculturation of stakeholders still takes time− and finally, the ethical and governance problems linked to the lack of transparency of these models. To lift the veil on these black boxes and make them more interpretable, in recent years there has been a proliferation of research articles on the subject of interpretable artificial intelligence (XAI). In this context, this thesis aims to explore and illustrate the use of the various interpretability methods most widely used in the literature, which are essential for the interpretability of opaque statistical learning models. We also study the role of telematic data in improving the accuracy of automobile insurance pricing models. Keywords: GLM, LocalGLMnet, Random Forest, Model Reliance (MR), SFIMP, PDP, ALE, ICE, H-statistics, Sobol indices, SHAP, LIME, RGPD, ACPR, XAI, Automobile pricing, Telematics driving data.

Mémoire complet