Mémoires d'Actuariat
Détection de la fraude à l’international
Auteur(s) EL KHOURY L.
Société April International Care France
Année 2024
Confidentiel jusqu'au 18/06/2026
Résumé
La fraude dans le secteur de l'assurance santé pour les expatriés pose des défis complexes en raison du risque géographique. Les entreprises cherchent à réduire les cas de fraude grâce à des moyens innovants. Ce mémoire se concentre sur l'utilisation de la Data Science et des techniques avancées de machine learning (Isolation Forest, Local Outlier Factor, et K-Means) pour détecter les cas potentiels de fraude. L'objectif est de créer un outil d'alerte efficace pour intervenir avant l'acceptation des transactions. La mise en place de cet outil comporte plusieurs étapes, dont deux seront réalisées dans ce mémoire. Premièrement, des méthodes de machine learning non supervisées seront utilisées pour identifier des anomalies et générer une liste de transactions suspectes. Ensuite, cette liste sera analysée en profondeur par les équipes spécialisées en gestion de la fraude. Cette analyse permettra de créer une base de données labellisée, facilitant l'exploration des méthodes d'intelligence artificielle non supervisées et l'amélioration des modèles. Le projet commence avec ce mémoire, qui vise à établir une liste de remboursements suspects en se basant sur les données historiques du produit principal d'AICF et en appliquant des modèles de machine learning. Cette première étape de modélisation est cruciale pour le développement d'un outil sophistiqué de détection de fraude.
Abstract
Fraud in the health insurance sector for expatriates poses complex challenges due to geographical risk. Companies are seeking to reduce instances of fraud through innovative means. This thesis focuses on the use of Data Science and advanced machine learning techniques (Isolation Forest, Local Outlier Factor, and K-Means) to detect potential fraud cases. The goal is to create an effective alert tool to intervene before the acceptance of transactions. The implementation of this tool involves several steps, two of which will be carried out in this thesis. Firstly, unsupervised machine learning methods will be used to identify anomalies and generate a list of suspicious transactions. Then, this list will be thoroughly analyzed by specialized fraud management teams. This analysis will lead to the creation of a labeled database, facilitating the exploration of unsupervised artificial intelligence methods and model improvement. The project begins with this thesis, which aims to establish a list of suspicious reimbursements based on the historical data of AICF's main product and by applying machine learning models. This initial modeling step is crucial for the development of a sophisticated fraud detection tool.
Auteur(s) EL KHOURY L.
Société April International Care France
Année 2024
Confidentiel jusqu'au 18/06/2026
Résumé
La fraude dans le secteur de l'assurance santé pour les expatriés pose des défis complexes en raison du risque géographique. Les entreprises cherchent à réduire les cas de fraude grâce à des moyens innovants. Ce mémoire se concentre sur l'utilisation de la Data Science et des techniques avancées de machine learning (Isolation Forest, Local Outlier Factor, et K-Means) pour détecter les cas potentiels de fraude. L'objectif est de créer un outil d'alerte efficace pour intervenir avant l'acceptation des transactions. La mise en place de cet outil comporte plusieurs étapes, dont deux seront réalisées dans ce mémoire. Premièrement, des méthodes de machine learning non supervisées seront utilisées pour identifier des anomalies et générer une liste de transactions suspectes. Ensuite, cette liste sera analysée en profondeur par les équipes spécialisées en gestion de la fraude. Cette analyse permettra de créer une base de données labellisée, facilitant l'exploration des méthodes d'intelligence artificielle non supervisées et l'amélioration des modèles. Le projet commence avec ce mémoire, qui vise à établir une liste de remboursements suspects en se basant sur les données historiques du produit principal d'AICF et en appliquant des modèles de machine learning. Cette première étape de modélisation est cruciale pour le développement d'un outil sophistiqué de détection de fraude.
Abstract
Fraud in the health insurance sector for expatriates poses complex challenges due to geographical risk. Companies are seeking to reduce instances of fraud through innovative means. This thesis focuses on the use of Data Science and advanced machine learning techniques (Isolation Forest, Local Outlier Factor, and K-Means) to detect potential fraud cases. The goal is to create an effective alert tool to intervene before the acceptance of transactions. The implementation of this tool involves several steps, two of which will be carried out in this thesis. Firstly, unsupervised machine learning methods will be used to identify anomalies and generate a list of suspicious transactions. Then, this list will be thoroughly analyzed by specialized fraud management teams. This analysis will lead to the creation of a labeled database, facilitating the exploration of unsupervised artificial intelligence methods and model improvement. The project begins with this thesis, which aims to establish a list of suspicious reimbursements based on the historical data of AICF's main product and by applying machine learning models. This initial modeling step is crucial for the development of a sophisticated fraud detection tool.