Mémoires d'Actuariat
Classification a priori de sinistres pour le provisionnement individuel
Auteur(s) CHARTREL A.
Société KPMG
Année 2022
Résumé
L'estimation des provisions pour sinistres à payer en assurance non-vie repose à l'heure actuelle majoritairement sur des données agrégées. Cependant, la disponibilité croissante de données de sinistres individuelles suscite un grand intérêt pour le provisionnement ligne à ligne. Plusieurs modèles, simulant à la fois les sinistres connus et encore inconnus de l'assureur, peuvent être raffinés par l'ajout en amont d'une classification des sinistres pour constituer des groupes de sinistres au développement semblable. Deux méthodes de classification s'appuyant sur l'apprentissage statistique sont mises en place. La première s'appuie sur l'algorithme des k-moyennes et n'est pas supervisée, tandis que la seconde l'est et repose sur un arbre de classification. Une classification manuelle proche des méthodes traditionnelles des gestionnaires est ajoutée pour fournir un point de comparaison basique. Les modèles de provisionnement individuel sont lancés séparément sur chaque classe. Les résultats sont évalués à partir de backtesting à horizon court, et les charges ultimes sont confrontées à des valeurs issues de méthodes classiques et de jugements d'experts, puis comparées entre elles. Les analyses et les réflexions menées au cours du travail contribuent à approfondir la compréhension des modèles de provisionnement individuel utilisés, de leurs avantages et de leurs limites et permettent de discuter l'intérêt de procéder à une classification.
Abstract
In property and casualty insurance, the estimation of provisions for claims is today mostly based on aggregated data. However, the interest in micro-reserving is increasing due to the large volume of individual claim data available. Several models are able to simulate claims both known by the insurer and not yet reported. They can be refined by adding beforehand a classification of claims that forms groups in which the developments of claims are homogeneous. Two classification methods based on machine learning are implemented. The first one relies on the k-means algorithm that is unsupervised. The second one is supervised and uses a tree. A handmade classification, close to what claims managers may do, is added to provide a basic comparison. Micro-reserving models are run separately on each class. Results are then evaluated with backtesting for short horizon and ultimate incurred are confronted with values obtained with classical methods and experts' judgements, then compared to one another. The analyses and reflections led through this work contribute to enriching the comprehension of the used micro-reserving models including their advantages and limits. It allows to discuss the interest of adding a classification.
Mémoire complet
Auteur(s) CHARTREL A.
Société KPMG
Année 2022
Résumé
L'estimation des provisions pour sinistres à payer en assurance non-vie repose à l'heure actuelle majoritairement sur des données agrégées. Cependant, la disponibilité croissante de données de sinistres individuelles suscite un grand intérêt pour le provisionnement ligne à ligne. Plusieurs modèles, simulant à la fois les sinistres connus et encore inconnus de l'assureur, peuvent être raffinés par l'ajout en amont d'une classification des sinistres pour constituer des groupes de sinistres au développement semblable. Deux méthodes de classification s'appuyant sur l'apprentissage statistique sont mises en place. La première s'appuie sur l'algorithme des k-moyennes et n'est pas supervisée, tandis que la seconde l'est et repose sur un arbre de classification. Une classification manuelle proche des méthodes traditionnelles des gestionnaires est ajoutée pour fournir un point de comparaison basique. Les modèles de provisionnement individuel sont lancés séparément sur chaque classe. Les résultats sont évalués à partir de backtesting à horizon court, et les charges ultimes sont confrontées à des valeurs issues de méthodes classiques et de jugements d'experts, puis comparées entre elles. Les analyses et les réflexions menées au cours du travail contribuent à approfondir la compréhension des modèles de provisionnement individuel utilisés, de leurs avantages et de leurs limites et permettent de discuter l'intérêt de procéder à une classification.
Abstract
In property and casualty insurance, the estimation of provisions for claims is today mostly based on aggregated data. However, the interest in micro-reserving is increasing due to the large volume of individual claim data available. Several models are able to simulate claims both known by the insurer and not yet reported. They can be refined by adding beforehand a classification of claims that forms groups in which the developments of claims are homogeneous. Two classification methods based on machine learning are implemented. The first one relies on the k-means algorithm that is unsupervised. The second one is supervised and uses a tree. A handmade classification, close to what claims managers may do, is added to provide a basic comparison. Micro-reserving models are run separately on each class. Results are then evaluated with backtesting for short horizon and ultimate incurred are confronted with values obtained with classical methods and experts' judgements, then compared to one another. The analyses and reflections led through this work contribute to enriching the comprehension of the used micro-reserving models including their advantages and limits. It allows to discuss the interest of adding a classification.
Mémoire complet