Chargement ...
Homepage

Construisez un modèle de scoring

Je viens d’être assigné à un projet passionnant au sein de “Prêt à dépenser”, une société financière spécialisée dans les crédits à la consommation pour des clients ayant peu ou pas d’historique de prêt. Ma mission est de développer un outil de “scoring crédit” qui permettra de calculer la probabilité qu’un client rembourse son prêt, afin de classer la demande en crédit accordé ou refusé.

L’outil de scoring sera utilisé par les chargés de relation client, qui ont besoin que le modèle soit facilement interprétable. Ils souhaitent également disposer d’une mesure de l’importance des variables qui influencent la décision du modèle.

Michaël, mon manager, m’a fourni un jeu de données comprenant un historique de prêts, des informations financières, et des données sur le comportement des emprunteurs (notamment s’ils ont fait défaut ou non). Il m’a aussi donné quelques directives supplémentaires par e-mail après notre réunion de briefing.

Je vais commencer par préparer les données, en utilisant éventuellement un kernel Kaggle pour accélérer le processus, tout en créant de nouvelles variables pertinentes pour améliorer le pouvoir prédictif du modèle. L’un des défis majeurs de ce projet sera de traiter le déséquilibre entre le nombre de bons et de mauvais clients, ainsi que de gérer le déséquilibre du coût métier entre un faux négatif (crédit accordé à un mauvais client) et un faux positif (refus de crédit à un bon client).

Je mettrai en place un score métier pour comparer les modèles, en optimisant le seuil de classification afin de minimiser les erreurs coûteuses. En parallèle, je m’assurerai que le modèle reste robuste en utilisant des méthodes de Cross-Validation et d’optimisation des hyperparamètres, comme le GridsearchCV. Pour finir, je comparerai les performances des modèles en utilisant des mesures techniques telles que l’AUC et l’accuracy.

Mon objectif est de développer un modèle non seulement performant, mais aussi compréhensible pour les équipes qui l’utiliseront. Je documenterai soigneusement mon travail dans un Notebook Jupyter, et préparerai une présentation claire et accessible pour l’équipe, en veillant à expliquer la méthode d’importance des variables, tant globalement que pour des cas spécifiques de clients.

Je suis prêt à relever ce défi et à contribuer au développement de cet outil de scoring crucial pour “Prêt à dépenser”.

Previous
All posts
Next

© Stéphanie ROULLAND 2024 | Tous droits réservés