Mémoires d'Actuariat
Mise en place d'un zonier dans la mesure de performance d'un régime santé
Auteur(s) SAMASSA F.
Société Crédit Agricole Assurances
Année 2023
Confidentiel jusqu'au 14/06/2025
Résumé
Ce mémoire présente une stratégie de conseil visant pour se démarquer de la concurrence et à développer de l’activité de la complémentaire santé collective au sein du Crédit Agricole Assurance. Cette approche consiste à évaluer l’efficacité d’une couverture santé en analysant le reste à charge moyen résultant des prestations, en tenant compte la situation géographique par un zonier. Le zonier est défini à l’aide d’un modèle linéaire généralisé, comparé avec deux procédés de machine learning basés sur des arbres de régression : la forêt aléatoire et le gradient boosting. Chacune de ces méthodes est utilisée pour estimer le cout moyen à partir des paramètres tarifaires conventionnels du portefeuille et des variables externes visant à partiellement expliquer l’impact géographique. La méthode offrant la meilleure estimation minimise le bruit résiduel et ainsi isole le mieux l’effet géographique non expliqué par les variables du modèle. L’effet géographique total est obtenu en combinant les résidus avec les effets géographiques des variables externes. Une classification hiérarchique ascendante est utilisée pour regrouper les effets géographiques en un découpage zonal. Cependant, l’utilisation de données départementales peut induire une perte de fiabilité dans certains départements en raison de faibles effectifs. Pour pallier ce problème, le coût moyen des prestations dans les départements moins ables est estimé en utilisant une méthode de lissage spatial basée sur la théorie de crédibilité. Cette approche pondère les coûts moyens des départements voisins en fonction de leurs effectifs respectifs. Le zonier obtenu a été intégré dans un outil d’aide au conseil présenté dans ce mémoire avec un cas pratique pour illustrer une de ses utilisations. Mots clés : Assurance santé collective, notation, grille de garanties, variables externes, modèles linéaires généralisés, forêts aléatoires, bagging, gradient boosting, classification hiérarchique ascendante, zonier.
Abstract
This paper presents a consulting strategy aimed at distinguishing itself from competition and fostering the development of collective supplementary health insurance within Crédit Agricole Assurance. This approach involves assessing the effectiveness of health coverage by analyzing the average out-of-pocket expenses resulting from benefits, taking into account the geographical situation through a zoning system. The zoning is defined using a generalized linear model, compared with two machine learning techniques based on regression trees : random forest and gradient boosting. Each of these methods is used to estimate the average cost based on conventional tariff parameters of the portfolio and external variables aimed at partially explaining the geographical impact. The method offering the best estimate minimizes residual noise and thus isolates the geographical effect not explained by the model’s variables. The total geographical effect is obtained by combining the residuals with the geographical effects of external variables. An ascending hierarchical classification is used to group the geographical effects into a zoning structure. However, the use of departmental data may lead to a loss of reliability in certain departments due to low sample sizes. To address this issue, the average cost of benefits in less reliable departments is estimated using a spatial smoothing method based on credibility theory. This approach weighs the average costs of neighboring departments based on their respective sample sizes. The obtained zoning structure has been integrated into a consulting support tool presented in this paper, along with a practical case to illustrate one of its applications. Keywords : collective health insurance, rating, benefit grid, external variables, generalized linear models, random forests, bagging, gradient boosting, ascending hierarchical clustering, zoning.
Auteur(s) SAMASSA F.
Société Crédit Agricole Assurances
Année 2023
Confidentiel jusqu'au 14/06/2025
Résumé
Ce mémoire présente une stratégie de conseil visant pour se démarquer de la concurrence et à développer de l’activité de la complémentaire santé collective au sein du Crédit Agricole Assurance. Cette approche consiste à évaluer l’efficacité d’une couverture santé en analysant le reste à charge moyen résultant des prestations, en tenant compte la situation géographique par un zonier. Le zonier est défini à l’aide d’un modèle linéaire généralisé, comparé avec deux procédés de machine learning basés sur des arbres de régression : la forêt aléatoire et le gradient boosting. Chacune de ces méthodes est utilisée pour estimer le cout moyen à partir des paramètres tarifaires conventionnels du portefeuille et des variables externes visant à partiellement expliquer l’impact géographique. La méthode offrant la meilleure estimation minimise le bruit résiduel et ainsi isole le mieux l’effet géographique non expliqué par les variables du modèle. L’effet géographique total est obtenu en combinant les résidus avec les effets géographiques des variables externes. Une classification hiérarchique ascendante est utilisée pour regrouper les effets géographiques en un découpage zonal. Cependant, l’utilisation de données départementales peut induire une perte de fiabilité dans certains départements en raison de faibles effectifs. Pour pallier ce problème, le coût moyen des prestations dans les départements moins ables est estimé en utilisant une méthode de lissage spatial basée sur la théorie de crédibilité. Cette approche pondère les coûts moyens des départements voisins en fonction de leurs effectifs respectifs. Le zonier obtenu a été intégré dans un outil d’aide au conseil présenté dans ce mémoire avec un cas pratique pour illustrer une de ses utilisations. Mots clés : Assurance santé collective, notation, grille de garanties, variables externes, modèles linéaires généralisés, forêts aléatoires, bagging, gradient boosting, classification hiérarchique ascendante, zonier.
Abstract
This paper presents a consulting strategy aimed at distinguishing itself from competition and fostering the development of collective supplementary health insurance within Crédit Agricole Assurance. This approach involves assessing the effectiveness of health coverage by analyzing the average out-of-pocket expenses resulting from benefits, taking into account the geographical situation through a zoning system. The zoning is defined using a generalized linear model, compared with two machine learning techniques based on regression trees : random forest and gradient boosting. Each of these methods is used to estimate the average cost based on conventional tariff parameters of the portfolio and external variables aimed at partially explaining the geographical impact. The method offering the best estimate minimizes residual noise and thus isolates the geographical effect not explained by the model’s variables. The total geographical effect is obtained by combining the residuals with the geographical effects of external variables. An ascending hierarchical classification is used to group the geographical effects into a zoning structure. However, the use of departmental data may lead to a loss of reliability in certain departments due to low sample sizes. To address this issue, the average cost of benefits in less reliable departments is estimated using a spatial smoothing method based on credibility theory. This approach weighs the average costs of neighboring departments based on their respective sample sizes. The obtained zoning structure has been integrated into a consulting support tool presented in this paper, along with a practical case to illustrate one of its applications. Keywords : collective health insurance, rating, benefit grid, external variables, generalized linear models, random forests, bagging, gradient boosting, ascending hierarchical clustering, zoning.