Mémoires d'Actuariat

Amélioration de la modélisation de la sinistralité dans une assurance caution
Auteur(s) AL SAYEGH P.
Société Parnasse Garanties
Année 2024
Confidentiel jusqu'au 21/01/2026

Résumé
Ce mémoire se concentre sur la détermination des probabilités de défaut et l'identification des variables clés dans la caution de prêts immobiliers. Lors de la souscription d'un prêt, une société d'assurance caution s'engage à rembourser le prêteur en cas de défaut de paiement de l'emprunteur, agissant ainsi comme créancier de substitution en cas de sinistre pour recouvrer la créance auprès de l'emprunteur. La probabilité de défaut et les variables pertinentes revêtent une importance cruciale pour la continuité de l'assurance et la solvabilité de l'entreprise. Elles contribuent à améliorer la modélisation de la sinistralité dans l'assurance caution et à déterminer le budget annuel de l'entreprise, marqué par l'inversion du cycle de production et la durée souvent prolongée des contrats, dépassant fréquemment les 20 ans. En utilisant des méthodes avancées telles que les modèles linéaires généralisés, les arbres de décision, les forêts aléatoires, les machines à vecteurs de support (SVM) et le XGBoost sur une base de données massive de 2,1 millions d'observations, l'étude vise à identifier la méthode la plus précise pour déterminer la probabilité de défaut et les variables pertinentes. Les résultats permettent de prédire avec précision le montant de l'avance que l'entreprise versera annuellement, éclairant ainsi la prise de décision pour le budget. Dans ce mémoire, XGBoost s'est avéré être la solution optimale, avec les variables pertinentes sélectionnées incluant le nom des banques prêteuses, le nominal, ainsi que l'ancienneté de la caution.

Abstract
This thesis focuses on determining default probabilities and identifying key variables in mortgage loan guarantees. When subscribing to a loan, a guarantee insurance company commits to reimbursing the lender in case of default by the borrower, acting as a substitute creditor in the event of a claim to recover the debt from the borrower. The probability of default and relevant variables hold crucial importance for the continuity of insurance and the solvency of the company. They contribute to improving the modeling of claims in guarantee insurance and determining the annual budget of the company, marked by the reversal of the production cycle and the often-extended duration of contracts, frequently exceeding 20 years. Using advanced methods such as generalized linear models, decision trees, random forests, support vector machines (SVM), and XGBoost on a massive database of 2.1 million observations, the study aims to identify the most accurate method for determining the probability of default and relevant variables. The results enable the precise prediction of the amount the company will annually pay in advance, thereby illuminating decision-making for the budget. In this thesis, XGBoost proved to be the optimal solution, with the selected relevant variables including the names of lending banks, the nominal amount, and the tenure of the guarantee.