Analyse des ventes et des profils clients d’une librairie suite à l’ouverture de la vente en ligne.
Analyser les ventes, les clients et les produits d’une librairie à partir de trois sources de données (clients, produits, transactions), en identifiant les tendances de consommation, les produits phares ou en difficulté, les typologies de clients, et les corrélations statistiques utiles à la prise de décision.
Après une phase d’analyse exploratoire approfondie (visualisations, corrélations, détection de multicolinéarité), les données ont été préparées et nettoyées en traitant notamment les valeurs manquantes via régression linéaire.
Plusieurs algorithmes de machine learning ont été testés (régression logistique, KNN, Random Forest, clustering K-means pour comparaison).
Le modèle KNN a été retenu pour sa performance équilibrée. Une recherche d’hyperparamètres par GridSearchCV a permis d’optimiser les résultats. Le modèle a ensuite été intégré dans une application interactive développée dans un notebook Voilà, offrant visualisation, prédiction et export des résultats enrichis.