Prédiction automatique de faux billets grâce à un modèle de machine learning optimisé et déployé dans une application interactive.
Dans le cadre d’un projet de formation, l’objectif était de construire une solution de machine learning capable de distinguer de véritables billets de faux billets, à partir de leurs caractéristiques géométriques. Le projet visait à maîtriser l’ensemble du cycle de la data science : traitement des données, sélection de modèle, optimisation, validation et mise à disposition d’une application utilisateur.
Après une phase d’analyse exploratoire approfondie (visualisations, corrélations, détection de multicolinéarité), les données ont été préparées et nettoyées en traitant notamment les valeurs manquantes via régression linéaire.
Plusieurs algorithmes de machine learning ont été testés (régression logistique, KNN, Random Forest, clustering K-means pour comparaison).
Le modèle KNN a été retenu pour sa performance équilibrée. Une recherche d’hyperparamètres par GridSearchCV a permis d’optimiser les résultats. Le modèle a ensuite été intégré dans une application interactive développée dans un notebook Voilà, offrant visualisation, prédiction et export des résultats enrichis.