Mémoires d'Actuariat
Algorithme de clustering appliqué à la tarification d'un produit d'assurance MPCI
Auteur(s) VATRY A.
Société PartnerRe
Année 2023
Confidentiel jusqu'au 03/02/2025
Résumé
La tarification d’un produit d’assurance agricole avec un prix unique à l’échelle nationale engendre un risque d’antisélection, en particulier lorsque le pays étudié possède différentes régions agroclimatiques avec des résultats bien distincts. En effet, les agriculteurs des régions défavorables sont plus enclins à s’assurer que les autres. Pour limiter cet effet, il faut donc diviser le territoire en zones aux résultats homogènes. La méthode du burning cost, habituellement utilisée en tarification, se heurte alors à de nombreuses difficultés : le choix de l’échelle étudiée, l’obligation de proposer un tarif à des régions dont les données sont insuffisantes, la nécessité d’un critère objectif pour distinguer les zones, enfin et surtout, l’importance de la cohérence géographique qui en résulte. Pour répondre à ces enjeux, un protocole de tarification bien précis a été développé. Il exploite à la fois la méthode du burning cost, la connaissance des experts et une méthode de segmentation par apprentissage non-supervisé : l’algorithme des k moyennes. Cette méthodologie concilie de manière très satisfaisante les résultats actuariels et les informations agroclimatiques disponibles, tout en limitant au maximum l’impact de certaines décisions subjectives. Mots clés : Agriculture, zones agroclimatiques, burning costs, taux de pertes, segmentation, clustering, apprentissage non-supervisé, algorithme des k moyennes, antisélection
Abstract
Pricing an agricultural insurance product with a unique price at national level generates a risk of adverse selection especially when the studied country has different agroclimatic regions with very distinct results. Farmers in unfavorable regions are indeed more inclined to underwrite insurance than others. Dividing the territory into zones with homogeneous results is thus necessary to reduce this phenomenon. However, in this case, the burning cost method, commonly used in pricing, comes up against many difficulties: defining the right level of details, proposing a price for all regions even when data is insufficient, establishing an objective criterion to distinguish the zones, and last but not least, obtaining results which make sense in terms of geography. To meet these challenges, a specific pricing method has been developed. The protocol simultaneously capitalises on the burning cost method, the knowledge of experts and an unsupervised learning clustering method: the k-means algorithm. This methodology reconciles in a very satisfactory way the actuarial results and the available agroclimatic information, while limiting at most the impact of subjective decisions. Key words: Agriculture, agroclimatic zones, burning costs, loss costs, clustering, unsupervised learning, k-means algorithm, adverse selection
Auteur(s) VATRY A.
Société PartnerRe
Année 2023
Confidentiel jusqu'au 03/02/2025
Résumé
La tarification d’un produit d’assurance agricole avec un prix unique à l’échelle nationale engendre un risque d’antisélection, en particulier lorsque le pays étudié possède différentes régions agroclimatiques avec des résultats bien distincts. En effet, les agriculteurs des régions défavorables sont plus enclins à s’assurer que les autres. Pour limiter cet effet, il faut donc diviser le territoire en zones aux résultats homogènes. La méthode du burning cost, habituellement utilisée en tarification, se heurte alors à de nombreuses difficultés : le choix de l’échelle étudiée, l’obligation de proposer un tarif à des régions dont les données sont insuffisantes, la nécessité d’un critère objectif pour distinguer les zones, enfin et surtout, l’importance de la cohérence géographique qui en résulte. Pour répondre à ces enjeux, un protocole de tarification bien précis a été développé. Il exploite à la fois la méthode du burning cost, la connaissance des experts et une méthode de segmentation par apprentissage non-supervisé : l’algorithme des k moyennes. Cette méthodologie concilie de manière très satisfaisante les résultats actuariels et les informations agroclimatiques disponibles, tout en limitant au maximum l’impact de certaines décisions subjectives. Mots clés : Agriculture, zones agroclimatiques, burning costs, taux de pertes, segmentation, clustering, apprentissage non-supervisé, algorithme des k moyennes, antisélection
Abstract
Pricing an agricultural insurance product with a unique price at national level generates a risk of adverse selection especially when the studied country has different agroclimatic regions with very distinct results. Farmers in unfavorable regions are indeed more inclined to underwrite insurance than others. Dividing the territory into zones with homogeneous results is thus necessary to reduce this phenomenon. However, in this case, the burning cost method, commonly used in pricing, comes up against many difficulties: defining the right level of details, proposing a price for all regions even when data is insufficient, establishing an objective criterion to distinguish the zones, and last but not least, obtaining results which make sense in terms of geography. To meet these challenges, a specific pricing method has been developed. The protocol simultaneously capitalises on the burning cost method, the knowledge of experts and an unsupervised learning clustering method: the k-means algorithm. This methodology reconciles in a very satisfactory way the actuarial results and the available agroclimatic information, while limiting at most the impact of subjective decisions. Key words: Agriculture, agroclimatic zones, burning costs, loss costs, clustering, unsupervised learning, k-means algorithm, adverse selection