Mémoires d'Actuariat
IA et éthique en assurance : une nouvelle solution pour atténuer la discrimination par proxy dans la modélisation du risque
Auteur(s) SAUCE M.
Société SCOR
Année 2023
Résumé
L’essor de l’intelligence artificielle connaît un intérêt croissant de la part du grand public et, au cours des dernières années, de nombreux articles de presse ont remis en cause son objectivité en accusant des algorithmes d’être racistes, sexistes, etc. Incitée par l’attention croissante des régulateurs sur l’utilisation éthique des données en assurance, la communauté actuarielle se doit de repenser les pratiques de tarification et de sélection du risque pour une assurance plus équitable. L’équité est un thème philosophique qui possède différentes définitions dans chaque juridiction, liées les unes aux autres, sans atteindre de consensus à ce jour. En Europe, la Charte des Droits Fondamentaux définit les lignes directrices sur la discrimination, et l’utilisation des données personnelles à caractère sensible dans les algorithmes est réglementée. Si le simple retrait des variable protégées empêche toute discrimination dite « directe », les modèles sont toujours capables de discriminer « indirectement » les individus grâce aux interactions latentes entre variables qui apportent de meilleures performances (et donc une meilleure quantification du risque, segmentation des prix, etc.). Après avoir posé l’état des lieux des concepts clés gravitant autour de la discrimination, nous illustrons la complexité de les quantifier. Nous proposons ensuite une méthode innovante, non rencontrée dans la littérature, permettant de réduire les risques de discrimination indirecte à partir de concepts mathématiques d’algèbre linéaire. Cette technique est illustrée sur un cas de sélection de risque concret en assurance vie, démontrant sa simplicité d’usage et ses performances prometteuses.
Abstract
The development of Machine Learning is experiencing growing interest from the general public, and in recent years there have been numerous press articles questioning its objectivity: racism, sexism … Driven by the growing attention of regulators on the ethical use of data in insurance, the actuarial community must rethink pricing and risk selection practices for fairer insurance. Equity is a philosophy concept that has many different definitions in every jurisdiction that influence each other without currently reaching consensus. In Europe, the Charter of Fundamental Rights defines guidelines on discrimination, and the use of sensitive personal data in algorithms is regulated. If the simple removal of the protected variables prevents any so-called ‘direct’ discrimination, models are still able to ‘indirectly’ discriminate between individuals thanks to latent interactions between variables, which bring better performance (and therefore a better quantification of risk, segmentation of prices, and so on). After introducing the key concepts related to discrimination, we illustrate the complexity of quantifying them. We then propose an innovative method, not yet met in the literature, to reduce the risks of indirect discrimination thanks to mathematical concepts of linear algebra. This technique is illustrated in a concrete case of risk selection in life insurance, demonstrating its simplicity of use and its promising performance.
Mémoire complet
Auteur(s) SAUCE M.
Société SCOR
Année 2023
Résumé
L’essor de l’intelligence artificielle connaît un intérêt croissant de la part du grand public et, au cours des dernières années, de nombreux articles de presse ont remis en cause son objectivité en accusant des algorithmes d’être racistes, sexistes, etc. Incitée par l’attention croissante des régulateurs sur l’utilisation éthique des données en assurance, la communauté actuarielle se doit de repenser les pratiques de tarification et de sélection du risque pour une assurance plus équitable. L’équité est un thème philosophique qui possède différentes définitions dans chaque juridiction, liées les unes aux autres, sans atteindre de consensus à ce jour. En Europe, la Charte des Droits Fondamentaux définit les lignes directrices sur la discrimination, et l’utilisation des données personnelles à caractère sensible dans les algorithmes est réglementée. Si le simple retrait des variable protégées empêche toute discrimination dite « directe », les modèles sont toujours capables de discriminer « indirectement » les individus grâce aux interactions latentes entre variables qui apportent de meilleures performances (et donc une meilleure quantification du risque, segmentation des prix, etc.). Après avoir posé l’état des lieux des concepts clés gravitant autour de la discrimination, nous illustrons la complexité de les quantifier. Nous proposons ensuite une méthode innovante, non rencontrée dans la littérature, permettant de réduire les risques de discrimination indirecte à partir de concepts mathématiques d’algèbre linéaire. Cette technique est illustrée sur un cas de sélection de risque concret en assurance vie, démontrant sa simplicité d’usage et ses performances prometteuses.
Abstract
The development of Machine Learning is experiencing growing interest from the general public, and in recent years there have been numerous press articles questioning its objectivity: racism, sexism … Driven by the growing attention of regulators on the ethical use of data in insurance, the actuarial community must rethink pricing and risk selection practices for fairer insurance. Equity is a philosophy concept that has many different definitions in every jurisdiction that influence each other without currently reaching consensus. In Europe, the Charter of Fundamental Rights defines guidelines on discrimination, and the use of sensitive personal data in algorithms is regulated. If the simple removal of the protected variables prevents any so-called ‘direct’ discrimination, models are still able to ‘indirectly’ discriminate between individuals thanks to latent interactions between variables, which bring better performance (and therefore a better quantification of risk, segmentation of prices, and so on). After introducing the key concepts related to discrimination, we illustrate the complexity of quantifying them. We then propose an innovative method, not yet met in the literature, to reduce the risks of indirect discrimination thanks to mathematical concepts of linear algebra. This technique is illustrated in a concrete case of risk selection in life insurance, demonstrating its simplicity of use and its promising performance.
Mémoire complet