Mémoires d'Actuariat
Confrontation de modèles prédictifs dans le but de quantifier les impacts de la crise sanitaire sur l’incidence du risque incapacité
Auteur(s) JULIEN N.
Société AG2R La Mondiale
Année 2023
Confidentiel jusqu'au 23/05/2025
Résumé
En 2020, l’apparition de la crise sanitaire, est venue bouleverser la vie des entreprises et de leurs salariés. Elles ont dû faire face à des défis économiques et sociaux émergents. En particulier, la pandémie a engendré une hausse brutale de l’absentéisme. Les conséquences pour les organismes assureurs sont multiples (prestations payées, provisions à constituer, …). L’idée à travers ce mémoire est donc d’envisager une nouvelle norme tarifaire. Après une analyse de suivi du portefeuille menée sur divers indicateurs, seule la loi d’incidence d’une tarification « coût × fréquence » nous intéresse. Les données utilisées proviennent du processus de Déclaration Sociale Nominative (DSN) ce qui permet de résoudre les limites des anciens systèmes d’information. Les travaux sous-tendant ce mémoire débutent par la construction d’une base de données fiable puis d’une opposition entre différents modèles prédictifs. Pour le premier, on construit un modèle de régression paramétrique à l’aide de GLM. Ensuite, diverses méthodes de Machine Learning sont testées, où seuls les modèles d’apprentissage XGBoost sont retenus. Le dernier modèle prédictif utilisé est un progiciel nommé Akur8 reposant sur des GAM automatisés. Différents critères permettent de retenir le modèle le plus performant. Enfin, une analyse exhaustive des résultats entre un modèle durant la crise sanitaire et un sur les années antérieures, sans choc majeur de sinistralité, donne réponse à la problématique. Finalement, les résultats permettent de mieux appréhender les conséquences de cette pandémie sur le risque incapacité. En effet, la fréquence d’arrêts est marquée par une hausse générale sur l’ensemble du portefeuille. Néanmoins, l’analyse des profils types démontre que certaines catégories de population ont été plus exposées que d’autres aux impacts de la crise sanitaire.
Abstract
In 2020, the emergence of the health crisis turned the lives of companies and their employees upside down. They had to face up to emerging economic and social challenges. In particular, the pandemic led to a sharp rise in absenteeism. The consequences for insurers are manifold (benefits paid, provisions to be set aside, etc.). The idea behind this thesis is therefore to consider a new tariff standard. Following a portfolio monitoring analysis carried out on various indicators, we are only interested in the incidence law of a "cost × frequency" pricing system. The data used comes from the "Déclaration Sociale Nominative" (DSN) process, thus overcoming the limitations of older information systems. The work underlying this dissertation begins with the construction of a reliable database, followed by an opposition between different predictive models. For the first, a parametric regression model is built, using GLMs. Next, various Machine Learning methods are tested, where only XGBoost learning models are retained. The last predictive model used is a software package called Akur8 based on automated GAMs. Various criteria are used to select the best-performing model. Finally, an exhaustive analysis of the results between a model used during the health crisis and one used in previous years, without major claims shock, provides an answer to the problem. Finally, the results provide a clearer picture of the pandemic's impact on disability risk. Indeed, the incidence of work stoppage is marked by a general increase across the entire portfolio. Nevertheless, analysis of typical profiles shows that certain categories of the population were more exposed than others to the impact of the health crisis.
Auteur(s) JULIEN N.
Société AG2R La Mondiale
Année 2023
Confidentiel jusqu'au 23/05/2025
Résumé
En 2020, l’apparition de la crise sanitaire, est venue bouleverser la vie des entreprises et de leurs salariés. Elles ont dû faire face à des défis économiques et sociaux émergents. En particulier, la pandémie a engendré une hausse brutale de l’absentéisme. Les conséquences pour les organismes assureurs sont multiples (prestations payées, provisions à constituer, …). L’idée à travers ce mémoire est donc d’envisager une nouvelle norme tarifaire. Après une analyse de suivi du portefeuille menée sur divers indicateurs, seule la loi d’incidence d’une tarification « coût × fréquence » nous intéresse. Les données utilisées proviennent du processus de Déclaration Sociale Nominative (DSN) ce qui permet de résoudre les limites des anciens systèmes d’information. Les travaux sous-tendant ce mémoire débutent par la construction d’une base de données fiable puis d’une opposition entre différents modèles prédictifs. Pour le premier, on construit un modèle de régression paramétrique à l’aide de GLM. Ensuite, diverses méthodes de Machine Learning sont testées, où seuls les modèles d’apprentissage XGBoost sont retenus. Le dernier modèle prédictif utilisé est un progiciel nommé Akur8 reposant sur des GAM automatisés. Différents critères permettent de retenir le modèle le plus performant. Enfin, une analyse exhaustive des résultats entre un modèle durant la crise sanitaire et un sur les années antérieures, sans choc majeur de sinistralité, donne réponse à la problématique. Finalement, les résultats permettent de mieux appréhender les conséquences de cette pandémie sur le risque incapacité. En effet, la fréquence d’arrêts est marquée par une hausse générale sur l’ensemble du portefeuille. Néanmoins, l’analyse des profils types démontre que certaines catégories de population ont été plus exposées que d’autres aux impacts de la crise sanitaire.
Abstract
In 2020, the emergence of the health crisis turned the lives of companies and their employees upside down. They had to face up to emerging economic and social challenges. In particular, the pandemic led to a sharp rise in absenteeism. The consequences for insurers are manifold (benefits paid, provisions to be set aside, etc.). The idea behind this thesis is therefore to consider a new tariff standard. Following a portfolio monitoring analysis carried out on various indicators, we are only interested in the incidence law of a "cost × frequency" pricing system. The data used comes from the "Déclaration Sociale Nominative" (DSN) process, thus overcoming the limitations of older information systems. The work underlying this dissertation begins with the construction of a reliable database, followed by an opposition between different predictive models. For the first, a parametric regression model is built, using GLMs. Next, various Machine Learning methods are tested, where only XGBoost learning models are retained. The last predictive model used is a software package called Akur8 based on automated GAMs. Various criteria are used to select the best-performing model. Finally, an exhaustive analysis of the results between a model used during the health crisis and one used in previous years, without major claims shock, provides an answer to the problem. Finally, the results provide a clearer picture of the pandemic's impact on disability risk. Indeed, the incidence of work stoppage is marked by a general increase across the entire portfolio. Nevertheless, analysis of typical profiles shows that certain categories of the population were more exposed than others to the impact of the health crisis.