Mémoires d'Actuariat
Mise à jour des hypothèses de fréquence en risque incapacité au Portugal : l’utilisation d’une modélisation GLM est-elle encore optimale ?
Auteur(s) GALLON M.
Société AXA Partners Credit & Lifestyle Protection
Année 2023
Confidentiel jusqu'au 26/06/2025
Résumé
Ce mémoire porte sur l’étude de la fréquence incapacité au Portugal et du choix du Modèle Linéaire Généralisé (GLM) pour le faire. En effet après étude des spécificités du marché (fréquence d’accident plus élevée pour les hommes que pour les femmes, crise économique de 2013 qui entraîne la hausse de la conscience des Portugais pour les produits d’assurances dont ils disposent), des données, du modèle GLM Poisson sous les contraintes de l’entreprise (seulement l’âge, le genre et le produit peuvent être des variables explicatives) et de ses résultats, il s’observe diverses limites (une croissance de la fréquence incapacité avec les années pour les principaux produits vendus n’est pas modélisée par le modèle qui stagne à un niveau bien en-dessous). C’est ainsi qu’il est vu par la suite si les limites observées viennent du manque de variables explicatives ou bien du modèle GLM en lui-même. Pour cela, une deuxième modélisation GLM enrichie de variables explicatives en lien avec les observations du marché est calibrée, ainsi qu’un algorithme de Machine Learning, un Gradient Boosting. Il s’obtient que ce soit bien l’absence de variables explicatives qui manquait pour produire un GLM sans les défauts observés, mais les résultats du Gradient Boosting sont encourageants et méritent de nous questionner sur l’avenir des modèles de fréquence classiques.
Abstract
This thesis deals with the study of the frequency of disability in Portugal and the choice of the Generalised Linear Model (GLM) to do so. After studying the specific features of the market (higher accident frequency for men than for women, 2013 economic crisis leading to an increase in Portuguese awareness of the insurance products available to them), the data, the GLM Poisson model under the constraints of the company (only age, gender and product can be explanatory variables) and its results, there are various limitations (an increase in the frequency of disability over the years for the main products sold is not modelled by the model, which stagnates at a much lower level). It is then seen whether the observed limitations stem from a lack of explanatory variables or from the GLM model itself. To do this, a second GLM model enriched with explanatory variables linked to market observations is calibrated, along with a Gradient Boosting Machine Learning algorithm. It turns out that it was the absence of explanatory variables that was lacking to produce a GLM without the observed flaws, but the Gradient Boosting results are encouraging and raise questions about the future of traditional frequency models.
Auteur(s) GALLON M.
Société AXA Partners Credit & Lifestyle Protection
Année 2023
Confidentiel jusqu'au 26/06/2025
Résumé
Ce mémoire porte sur l’étude de la fréquence incapacité au Portugal et du choix du Modèle Linéaire Généralisé (GLM) pour le faire. En effet après étude des spécificités du marché (fréquence d’accident plus élevée pour les hommes que pour les femmes, crise économique de 2013 qui entraîne la hausse de la conscience des Portugais pour les produits d’assurances dont ils disposent), des données, du modèle GLM Poisson sous les contraintes de l’entreprise (seulement l’âge, le genre et le produit peuvent être des variables explicatives) et de ses résultats, il s’observe diverses limites (une croissance de la fréquence incapacité avec les années pour les principaux produits vendus n’est pas modélisée par le modèle qui stagne à un niveau bien en-dessous). C’est ainsi qu’il est vu par la suite si les limites observées viennent du manque de variables explicatives ou bien du modèle GLM en lui-même. Pour cela, une deuxième modélisation GLM enrichie de variables explicatives en lien avec les observations du marché est calibrée, ainsi qu’un algorithme de Machine Learning, un Gradient Boosting. Il s’obtient que ce soit bien l’absence de variables explicatives qui manquait pour produire un GLM sans les défauts observés, mais les résultats du Gradient Boosting sont encourageants et méritent de nous questionner sur l’avenir des modèles de fréquence classiques.
Abstract
This thesis deals with the study of the frequency of disability in Portugal and the choice of the Generalised Linear Model (GLM) to do so. After studying the specific features of the market (higher accident frequency for men than for women, 2013 economic crisis leading to an increase in Portuguese awareness of the insurance products available to them), the data, the GLM Poisson model under the constraints of the company (only age, gender and product can be explanatory variables) and its results, there are various limitations (an increase in the frequency of disability over the years for the main products sold is not modelled by the model, which stagnates at a much lower level). It is then seen whether the observed limitations stem from a lack of explanatory variables or from the GLM model itself. To do this, a second GLM model enriched with explanatory variables linked to market observations is calibrated, along with a Gradient Boosting Machine Learning algorithm. It turns out that it was the absence of explanatory variables that was lacking to produce a GLM without the observed flaws, but the Gradient Boosting results are encouraging and raise questions about the future of traditional frequency models.