Mémoires d'Actuariat

Impact de la variable métier su la segmentationtarifaire des contrats de prévoyance
Auteur(s) BELLUGEON M.
Société DIOT-SIACI
Année 2022
Confidentiel jusqu'au 14/03/2024

Résumé
Mots-clés : Absentéisme, classification, clustering, baromètre sectoriel, distance d’arbre, distance TF-IDF, segmentation L’objectif de ce mémoire est d’obtenir un modèle prédictif de l’absentéisme intégrant au mieux la variable métier et d’analyser les effets de cette variable sur les performances du modèle ainsi que sur la tarification des contrats de prévoyance associés. Dans un premier temps, nous nous intéressons à l’analyse de la variable métier dans le but d’obtenir une mesure de distance pertinente entre les métiers. Pour ce faire, deux pistes principales sont explorées : l’adaptation de méthodes d’analyse textuelle et l’adaptation de modèles markoviens. Dans un second temps, nous réinjectons les résultats de cette étude dans un modèle actuariel. Nous calibrons un modèle tarifaire fonde sur une approche fréquence/sévérité sur nos données et cherchons à identifier les éventuels effets de cette nouvelle méthode de comparaison des métiers. Nous comparons ainsi les performances et les résultats de trois modèles, l’un ne prenant pas en compte la variable métier, l’autre utilisant la comparaison binaire entre métiers et le dernier en utilisant la mesure de distance entre métiers obtenue lors de la première partie. L’analyse croisée de ces différents modèles permet ainsi de confirmer l’importance de la variable métier dans la modélisation ainsi que l’efficacité de la méthodologie mise en œuvre lors de l’élaboration de la nouvelle mesure de distance entre métiers. A l’issue de ce mémoire, nous disposons finalement d’une nouvelle mesure de distance entre métier et d’une nouvelle variable catégorielle à cinq modalités permettant de rendre compte du métier, au même niveau de granularité que le niveau 1 du PCS. Cette variable permet d’améliorer la qualité du modèle de tarification et de segmentation calibre sur nos données, tout en conservant la cohérence avec les deux autres modèles, démontrant ainsi sa pertinence dans la modélisation et validant l’esprit de sa construction.

Abstract
Keywords: Absenteeism, classification, clustering, sector barometer, tree distance, TF-IDF distance, segmentation The aim of this paper is to obtain a predictive model of absenteeism that best integrates the business variable and to analyze the effects of this variable on the model’s performance, as well as on the pricing of the associated insurance contracts. It is organized into two distinct parts. First, we focus on the analysis of the business variable to obtain a relevant measure of distance between businesses. To achieve this, two main avenues are explored: the adaptation of textual analysis methods and the adaptation of Markov models. Secondly, we use the results of this study in an actuarial model. We calibrate a rate model based on a frequency/severity approach on our data and seek to identify any possible effect of this new method of job comparison. We compare the performances and results of three models, one of which takes no account of the occupation variable, another using the binary comparison between trades, and the last using the distance measure between trades obtained in the first part. Cross-analysis of these different models thus enables us to confirm the importance of the business variable in modeling, as well as the effectiveness of the methodology implemented in the development of the new inter-business distance measure. We finally have a new measure of distance between trades and a new five-modality categorical variable to account for the trade, at the same level of granularity as PCS level 1. This variable improves the quality of the calibrated pricing and segmentation model calibrated on our data, while maintaining consistency with the other two other models, thus demonstrating its relevance to the model and validating the idea of its construction.

Mémoire complet