Mémoires d'Actuariat
L'impact de l'agrégation des données sur différents indicateurs (commissions, BE, SCR…) en assurance emprunteur
Auteur(s) BOUCHE N.
Société GALEA & Associés
Année 2022
Confidentiel jusqu'au 12/01/2024
Résumé
Le secteur de l’assurance est confronté à une augmentation de la taille des bases de données et à une augmentation des calculs requis, engendrés par la directive "Solvabilité 2", comme le Best Estimate et le Solvency Capital Requirement. Ainsi, l’agrégation des données devient indispensable pour calculer dans des temps raisonnables ces deux notions. L’objectif de ce mémoire est d’étudier l’impact de l’agrégation des données en assurance emprunteur sur les indicateurs suivants : primes, charges de sinistres, commissions, Best Estimate, SCR Vie et SCR Santé. Mesurer l’impact de l’agrégation par rapport aux résultats des données réelles est primordial. Dans ce but et par soucis de confidentialité, trois types de portefeuilles emprunteurs ont été simulés à partir de données clients. Pour ce faire la méthode NORTA a été utilisée ; elle nécessite les distributions marginales et la matrice de corrélation des variables des bases réelles. Une fois établies, huit méthodes d’agrégation ont été appliquées aux données. Une méthode avec un taux de compression de plus de 97% a obtenu des résultats précis. Par ailleurs, il est ressorti de l’étude que d’avoir un taux de compression élevé ne signifie pas forcément que les résultats seront moins proches de la réalité. Le sujet se trouve essentiellement sur le choix de l’agrégation, en fonction de la précision souhaitée, mais aussi de ce que calcule l’assureur, ce qui peut faire évoluer l’exactitude des techniques de regroupement. Un gain de temps conséquent peut être fait, essentiellement, lors de l’application des différents chocs pour le calcul du SCR.
Abstract
Nowadays the insurance industry is facing unparalleled challenges as databases and computations become more and more complex, in particular with the " Solvency 2 " directive which requires the calculation of the Best Estimate and the Solvency Capital Requirement. Thus, the aggregation of data becomes necessary to calculate efficiently these two concepts. The goal of this thesis is to study the impact, in the loan insurance sector, of the aggregation of the data upon the following indicators : premiums, claims expenses, commissions, Best Estimate, Life SCR and Health SCR. Measuring the impact of aggregation on the results with real data is crucial. To this end and to ensure confidentiality, three types of loan portfolios were simulated using client data. To achieve this, the NORTA method was used ; it requires the marginal distributions and the correlation matrix of the variables of the real databases. Once established, eight aggregation methods were applied to the data. A method with a compression rate of more than 97% obtained accurate results. The study also showed that having a high compression rate doesn’t necessarily mean that the results will be less accurate. The issue is essentially about the choice of aggregation, depending on the desired accuracy, but also on what the insurer calculates, which can change the accuracy of the aggregation techniques. The computation time can be optimized mainly during the application of the different shocks for the calculation of the SCR.
Mémoire complet
Auteur(s) BOUCHE N.
Société GALEA & Associés
Année 2022
Confidentiel jusqu'au 12/01/2024
Résumé
Le secteur de l’assurance est confronté à une augmentation de la taille des bases de données et à une augmentation des calculs requis, engendrés par la directive "Solvabilité 2", comme le Best Estimate et le Solvency Capital Requirement. Ainsi, l’agrégation des données devient indispensable pour calculer dans des temps raisonnables ces deux notions. L’objectif de ce mémoire est d’étudier l’impact de l’agrégation des données en assurance emprunteur sur les indicateurs suivants : primes, charges de sinistres, commissions, Best Estimate, SCR Vie et SCR Santé. Mesurer l’impact de l’agrégation par rapport aux résultats des données réelles est primordial. Dans ce but et par soucis de confidentialité, trois types de portefeuilles emprunteurs ont été simulés à partir de données clients. Pour ce faire la méthode NORTA a été utilisée ; elle nécessite les distributions marginales et la matrice de corrélation des variables des bases réelles. Une fois établies, huit méthodes d’agrégation ont été appliquées aux données. Une méthode avec un taux de compression de plus de 97% a obtenu des résultats précis. Par ailleurs, il est ressorti de l’étude que d’avoir un taux de compression élevé ne signifie pas forcément que les résultats seront moins proches de la réalité. Le sujet se trouve essentiellement sur le choix de l’agrégation, en fonction de la précision souhaitée, mais aussi de ce que calcule l’assureur, ce qui peut faire évoluer l’exactitude des techniques de regroupement. Un gain de temps conséquent peut être fait, essentiellement, lors de l’application des différents chocs pour le calcul du SCR.
Abstract
Nowadays the insurance industry is facing unparalleled challenges as databases and computations become more and more complex, in particular with the " Solvency 2 " directive which requires the calculation of the Best Estimate and the Solvency Capital Requirement. Thus, the aggregation of data becomes necessary to calculate efficiently these two concepts. The goal of this thesis is to study the impact, in the loan insurance sector, of the aggregation of the data upon the following indicators : premiums, claims expenses, commissions, Best Estimate, Life SCR and Health SCR. Measuring the impact of aggregation on the results with real data is crucial. To this end and to ensure confidentiality, three types of loan portfolios were simulated using client data. To achieve this, the NORTA method was used ; it requires the marginal distributions and the correlation matrix of the variables of the real databases. Once established, eight aggregation methods were applied to the data. A method with a compression rate of more than 97% obtained accurate results. The study also showed that having a high compression rate doesn’t necessarily mean that the results will be less accurate. The issue is essentially about the choice of aggregation, depending on the desired accuracy, but also on what the insurer calculates, which can change the accuracy of the aggregation techniques. The computation time can be optimized mainly during the application of the different shocks for the calculation of the SCR.
Mémoire complet