Revenu doublé grâce à une segmentation client améliorée.

Revenu doublé grâce à une segmentation client améliorée.
Le Client est une agence de recouvrement de créances qui collecte des dettes dans divers secteurs et auprès de différents clients. Les principaux clients de l'agence sont les banques, le commerce de détail, les opérateurs télécoms et les entreprises publiques.
Plus de 1500 agents de collecte à travers le pays traitent environ 3,5 millions de débiteurs par mois, en contactant environ 2 millions d'entre eux chaque mois.
Le processus de recouvrement de créances comprend les étapes suivantes :
En collaboration avec le responsable Data Science de l’entreprise, dont le département avait déjà lancé la mise en œuvre de l’apprentissage automatique pour améliorer la prise de décision tout au long du cycle de recouvrement, il a été décidé que DataSqueeze explorerait le potentiel de l'analytique prédictive pour identifier les clients les plus susceptibles de rembourser.
La condition indispensable de la mission était de permettre les prédictions fonctionnant sur l'infrastructure SQL Server existante du client.
DataSqueeze a commencé à travailler sur un modèle de machine learning pour prédire la probabilité de promesse de paiement des comptes vérifiés. Des prédictions précises devraient permettre un ciblage des comptes plus prioritaire et ainsi (une augmentation des taux de recouvrement et une réduction des coûts).
Développer le modèle prédictif a inclus quelques étapes majeures, telles que la création d'un pipeline pour le traitement des données et la création de caractéristiques dans SQL Server, l'entraînement du modèle prédictif basé sur LightGBM, la construction d'un pipeline pour obtenir des prédictions.
L'équipe composée d'un ingénieur data et d'un scientifique des données a été assignée au projet, qui consistait en les étapes suivantes :
Étape | Portée du travail |
| 1. préparation des données | Analyse des données Purification des données Construire un pipeline de données pour le traitement/l'agrégation des données |
| 2. modélisation | Développement et test des modèles |
| 3. Déploiement | Déploiement dans SQL Server 2017, tests d'intégration |
À la suite du projet, nous avons fourni les livrables suivants au Client :
Le modèle prédictif livré par DataSqueeze prédit avec précision la probabilité de promesse de paiement d'un compte.
La performance du modèle a été mesurée par le score ROC_AUC. Le score ROC_AUC a atteint ≈0,775, ce qui représente une amélioration significative pour le Client.
Cela donne au Client la possibilité d'optimiser le temps des agents de recouvrement, leur permettant de cibler d'abord les comptes les plus prometteurs.