Mémoires d'Actuariat
Estimation des sinistres tardif en arrêt de travail
Auteur(s) ROUAMBA L.
Société Malakoff Humanis
Année 2023
Confidentiel jusqu'au 12/01/2025
Résumé
Les assureurs dans le but de maintenir leurs activités, se doivent de bien d’estimer les provisions pour faire face à leurs engagements futurs. Pour évaluer ces réserves ou provisions, ils utilisent des méthodes qui agrègent un nombre de données. Elles sont robustes et appréciées du fait de leur simplicité d’interprétation et d’utilisation. Bien que ces méthodes soient assez efficaces, nous nous retrouvons souvent avec une volatilité des provisions d’une année à l’autre. Ces estimations se doivent de plus en plus précises et fiables notamment avec les nouvelles normes assurantielles et comptables comme Solvabilité 2 et IFRS17. Le montant à provisionner doit être estimer en vision ≪Best Estimate≫ permettant de couvrir aussi bien les sinistres déjà connus ou RBNS et les sinistres inconnus ou IBNR. Avec le développement des systèmes de gestions des assureurs, de grandes quantités de données sont recueillies qui renseignent un maximum d’informations qui caractérisent les sinistres. Les assureurs se doivent de prendre en compte ces informations caractérisques pour mieux évaluer leurs charges. Le machine learning se veut une solution efficiente et adaptée à l’exploitation de ces données. Ce mémoire a pour objet de réfléchir sur le provisionnement des risques Arrêt de Travail, à savoir l’incapacité et l’invalidité sur un portefeuille de Conventions Collectives Nationales, plus particulièrement l’estimation des sinistres tardifs. Dans un premier temps, nous présenterons le contexte de l’étude puis un rappel des méthodes de provisionnement classiques. Dans une seconde partie, la méthode de provisionnement individuel retenue est présentée. Nous expliciterons les hypothèses et les correctifs par rapport à la méthode initiale de Baudry & Robert. Un rappel des notions sur le machine learning et l’algorithme XGBoost est proposé au lecteur. Nous terminerons en présentant les données à notre disposition, le tout suivi de l’application de différentes méthodes pour déterminer le nombre de sinistres inconnus pour le risque invalidité et la provision invalidité pour le risque incapacité. Mots-clés : Provisionnement, Arrêt de Travail, Sinistres tardifs, Incurred But Not Reported (IBNR), Reported But Not Settled (RBNS), Chain Ladder, Mack, Schnieper, Machine learning, XGBoost.
Abstract
Insurers need to properly estimate their reserves to meet future liabilities. To evaluate these reserves, they use methods that aggregate data. These methods are quite robust and very popular due to their simplicity of interpretation and use. Although these methods are quite effective, we often end up with quite volatile reserves. With the new insurance and accounting standards such as Solvency 2 and IFRS17, insurers have a duty to determine their reserves more accurately and reliably. The amount of the reserve must be estimated in a Best Estimate vision, allowing to cover both the already known claims or RBNS and the unknown claims or IBNR. With the development of insurers’ management systems, large quantities of data are collected which provide a maximum of information characterizing claims. Insurers have to take this characteristic information into account when assessing their costs. Machine learning is an efficient and suitable solution for the analysis of all this data. The purpose of this thesis is to reflect on the reserving of work stoppage guarantees, i.e. incapacity and invalidity on a portfolio of National Collective Agreements, more particularly the estimation of our late claims. First, we will present the context of our study and then a reminder of the classic provisioning methods. In a second part, the individual reserving method used is presented. We will explain the hypothèses and the corrections compared to the initial method of Baudry & Robert. A reminder of the notions on machine learning and the XGBoost algorithm is proposed to the reader. We conclude by presenting the data at our disposal, followed by the application of different methods to determine the number of unknown claims for the disability risk and the disability provision for the disability risk. Keywords : Reserving, Temporary disability, permanent disability, Late claims, Incurred But Not Reported (IBNR), Reported But Not Settled (RBNS), Chain Ladder, Mack, Schnieper, Machine learning, XGBoost.
Auteur(s) ROUAMBA L.
Société Malakoff Humanis
Année 2023
Confidentiel jusqu'au 12/01/2025
Résumé
Les assureurs dans le but de maintenir leurs activités, se doivent de bien d’estimer les provisions pour faire face à leurs engagements futurs. Pour évaluer ces réserves ou provisions, ils utilisent des méthodes qui agrègent un nombre de données. Elles sont robustes et appréciées du fait de leur simplicité d’interprétation et d’utilisation. Bien que ces méthodes soient assez efficaces, nous nous retrouvons souvent avec une volatilité des provisions d’une année à l’autre. Ces estimations se doivent de plus en plus précises et fiables notamment avec les nouvelles normes assurantielles et comptables comme Solvabilité 2 et IFRS17. Le montant à provisionner doit être estimer en vision ≪Best Estimate≫ permettant de couvrir aussi bien les sinistres déjà connus ou RBNS et les sinistres inconnus ou IBNR. Avec le développement des systèmes de gestions des assureurs, de grandes quantités de données sont recueillies qui renseignent un maximum d’informations qui caractérisent les sinistres. Les assureurs se doivent de prendre en compte ces informations caractérisques pour mieux évaluer leurs charges. Le machine learning se veut une solution efficiente et adaptée à l’exploitation de ces données. Ce mémoire a pour objet de réfléchir sur le provisionnement des risques Arrêt de Travail, à savoir l’incapacité et l’invalidité sur un portefeuille de Conventions Collectives Nationales, plus particulièrement l’estimation des sinistres tardifs. Dans un premier temps, nous présenterons le contexte de l’étude puis un rappel des méthodes de provisionnement classiques. Dans une seconde partie, la méthode de provisionnement individuel retenue est présentée. Nous expliciterons les hypothèses et les correctifs par rapport à la méthode initiale de Baudry & Robert. Un rappel des notions sur le machine learning et l’algorithme XGBoost est proposé au lecteur. Nous terminerons en présentant les données à notre disposition, le tout suivi de l’application de différentes méthodes pour déterminer le nombre de sinistres inconnus pour le risque invalidité et la provision invalidité pour le risque incapacité. Mots-clés : Provisionnement, Arrêt de Travail, Sinistres tardifs, Incurred But Not Reported (IBNR), Reported But Not Settled (RBNS), Chain Ladder, Mack, Schnieper, Machine learning, XGBoost.
Abstract
Insurers need to properly estimate their reserves to meet future liabilities. To evaluate these reserves, they use methods that aggregate data. These methods are quite robust and very popular due to their simplicity of interpretation and use. Although these methods are quite effective, we often end up with quite volatile reserves. With the new insurance and accounting standards such as Solvency 2 and IFRS17, insurers have a duty to determine their reserves more accurately and reliably. The amount of the reserve must be estimated in a Best Estimate vision, allowing to cover both the already known claims or RBNS and the unknown claims or IBNR. With the development of insurers’ management systems, large quantities of data are collected which provide a maximum of information characterizing claims. Insurers have to take this characteristic information into account when assessing their costs. Machine learning is an efficient and suitable solution for the analysis of all this data. The purpose of this thesis is to reflect on the reserving of work stoppage guarantees, i.e. incapacity and invalidity on a portfolio of National Collective Agreements, more particularly the estimation of our late claims. First, we will present the context of our study and then a reminder of the classic provisioning methods. In a second part, the individual reserving method used is presented. We will explain the hypothèses and the corrections compared to the initial method of Baudry & Robert. A reminder of the notions on machine learning and the XGBoost algorithm is proposed to the reader. We conclude by presenting the data at our disposal, followed by the application of different methods to determine the number of unknown claims for the disability risk and the disability provision for the disability risk. Keywords : Reserving, Temporary disability, permanent disability, Late claims, Incurred But Not Reported (IBNR), Reported But Not Settled (RBNS), Chain Ladder, Mack, Schnieper, Machine learning, XGBoost.