Mémoires d'Actuariat
Construction d’un véhiculier à l’aide de méthodes de machine learning et mesure de l’impact tarifaire
Auteur(s) SECK O.
Société Aviva Assurances
Année 2023
Confidentiel jusqu'au 24/02/2025
Résumé
Afin de se démarquer dans un marché concurrentiel, les assureurs sont constamment à la recherche de méthodes innovantes leur permettant d’améliorer la compréhension et la segmentation de leurs risques. Avec l’arrivée des véhicules autonomes, l’importance de « l’aspect véhicule » va probablement croître dans la tarification au détriment de « l’aspect conducteur ». Se munir d’un véhiculier revient ainsi à disposer d’un levier de différenciation vis-à-vis de la concurrence et d’affiner le suivi du risque sous-jacent. Le véhiculier peut permettre de prendre en compte plus d’informations sur les véhicules que ce qui serait considéré dans un simple Modèle Linéaire Généralisé. La problématique sera de mesurer l’apport des données véhicules dans un modèle de tarification automobile par la création d’un véhiculier pour la garantie dommage à l’aide des méthodes de machine learning. La méthode de tarification de la garantie dommage décomposant la prime pure en modèle de sévérité / modèle de fréquence, des véhiculiers seront distinctivement réalisés sur ces deux composantes. Plusieurs méthodes de machine learning, comme le Random Forest et le XGBoost, seront mises en œuvre sur les résidus des Modèles Linéaires Généralisés hors variables véhicules. Afin d’appréhender les similarités entre chaque véhicule, une cartographie sera créée à l’aide des méthodes de représentations spatiales permettant ainsi l’identification des voisins par la triangulation de Delaunay. Une classification du score obtenu sera réalisée afin de créer les véhiculiers. Enfin, une fois introduits dans les modèles tarifaires, l’apport et l’impact des véhiculiers sur la tarification seront étudiés. Mots clés : Tarification, Automobile, IARD, GLM, Véhiculier, Random Forest, XGBoost, ACP, AFDM, Triangulation de Delaunay, Classification, CAH.
Abstract
To stand out in a competitive market, insurers are constantly looking for innovative ways, which allow them to improve their understanding and classification of their risks. With the advent of autonomous vehicles, the importance of the « vehicle aspect » will probably increase at the expense of the « driver aspect ». The use of a set of more refined vehicles rates groups can be an interesting way to stay competitive as it might bring a better classification of the vehicles. Classifying the vehicles into rates group may allow to consider more vehicle information than what would be considered into a simple Generalized Linear Model. This is what this paper propose to study. Several machine learning methods such as Random Forest and XGBoost, will be implemented on the residuals of Generalized Linear Models excluding vehicle variables. In order to understand the similarities between each vehicle, a map will be created using spatial representation methods, allowing the identification of neighbors by Delaunay triangulation. A classification of the obtained score will be carried out, allowing the creation of vehicles classification. Finally, once introduced into the pricing models, the contribution and impact of the vehicles classification on pricing will be studied. Key Words : Pricing, Automobile, General Insurance, GLM, vehicule classification, Random Forest, XGBoost, PCA, MDFA, Delaunay Triangulation, Classification, CAH.
Auteur(s) SECK O.
Société Aviva Assurances
Année 2023
Confidentiel jusqu'au 24/02/2025
Résumé
Afin de se démarquer dans un marché concurrentiel, les assureurs sont constamment à la recherche de méthodes innovantes leur permettant d’améliorer la compréhension et la segmentation de leurs risques. Avec l’arrivée des véhicules autonomes, l’importance de « l’aspect véhicule » va probablement croître dans la tarification au détriment de « l’aspect conducteur ». Se munir d’un véhiculier revient ainsi à disposer d’un levier de différenciation vis-à-vis de la concurrence et d’affiner le suivi du risque sous-jacent. Le véhiculier peut permettre de prendre en compte plus d’informations sur les véhicules que ce qui serait considéré dans un simple Modèle Linéaire Généralisé. La problématique sera de mesurer l’apport des données véhicules dans un modèle de tarification automobile par la création d’un véhiculier pour la garantie dommage à l’aide des méthodes de machine learning. La méthode de tarification de la garantie dommage décomposant la prime pure en modèle de sévérité / modèle de fréquence, des véhiculiers seront distinctivement réalisés sur ces deux composantes. Plusieurs méthodes de machine learning, comme le Random Forest et le XGBoost, seront mises en œuvre sur les résidus des Modèles Linéaires Généralisés hors variables véhicules. Afin d’appréhender les similarités entre chaque véhicule, une cartographie sera créée à l’aide des méthodes de représentations spatiales permettant ainsi l’identification des voisins par la triangulation de Delaunay. Une classification du score obtenu sera réalisée afin de créer les véhiculiers. Enfin, une fois introduits dans les modèles tarifaires, l’apport et l’impact des véhiculiers sur la tarification seront étudiés. Mots clés : Tarification, Automobile, IARD, GLM, Véhiculier, Random Forest, XGBoost, ACP, AFDM, Triangulation de Delaunay, Classification, CAH.
Abstract
To stand out in a competitive market, insurers are constantly looking for innovative ways, which allow them to improve their understanding and classification of their risks. With the advent of autonomous vehicles, the importance of the « vehicle aspect » will probably increase at the expense of the « driver aspect ». The use of a set of more refined vehicles rates groups can be an interesting way to stay competitive as it might bring a better classification of the vehicles. Classifying the vehicles into rates group may allow to consider more vehicle information than what would be considered into a simple Generalized Linear Model. This is what this paper propose to study. Several machine learning methods such as Random Forest and XGBoost, will be implemented on the residuals of Generalized Linear Models excluding vehicle variables. In order to understand the similarities between each vehicle, a map will be created using spatial representation methods, allowing the identification of neighbors by Delaunay triangulation. A classification of the obtained score will be carried out, allowing the creation of vehicles classification. Finally, once introduced into the pricing models, the contribution and impact of the vehicles classification on pricing will be studied. Key Words : Pricing, Automobile, General Insurance, GLM, vehicule classification, Random Forest, XGBoost, PCA, MDFA, Delaunay Triangulation, Classification, CAH.