Segmentation pays par clustering pour analyse de marché

Etude complète de 183 pays pour prioriser les opportunités d’exportation agroalimentaire.

Objectif du projet

Dans le cadre du développement à l’international d’une entreprise française d’agroalimentaire bio, l’objectif était d’identifier les marchés les plus porteurs à partir de données publiques. La mission consistait à réaliser une étude de marché fondée sur une analyse de données multicritères, puis à recommander des pays cibles sur des critères stratégiques.

Approche méthodologique

Le projet a démarré par une analyse PESTEL pour sélectionner huit variables économiques, démographiques et politiques influençant directement l’exportation de volaille biologique. Les données ont été collectées à partir de sources open data fiables (FAO, Banque mondiale), nettoyées, enrichies par feature engineering, et standardisées dans un environnement Python.

Une analyse en composantes principales (ACP) a permis de réduire la complexité du jeu de données tout en conservant une part importante de la variance initiale. Cette réduction a facilité la visualisation et optimisé la performance des algorithmes de clustering.

Deux méthodes de segmentation ont été testées : la classification ascendante hiérarchique (CAH) et K-means. Après validation des résultats via l’analyse des scores de silhouette, une segmentation en 6 clusters avec K-means a été retenue. Cette approche a permis d’identifier plusieurs profils de marchés distincts.

Pour hiérarchiser les opportunités, un score d’opportunité multicritères a été conçu, combinant pouvoir d’achat, stabilité politique, dépendance aux importations et autres facteurs stratégiques.

Compétences et outils mobilisés

  • Collecte et intégration de données open data (FAO, Banque mondiale)
  • Nettoyage de données et feature engineering sous Python
  • Analyse exploratoire de données (EDA)
  • Réduction de dimension par ACP (scikit-learn)
  • Clustering avancé (K-means, CAH)
  • Validation de modèle (méthode du coude, scores de silhouette)
  • Visualisation des résultats (matplotlib, seaborn)
  • Communication adaptée à une audience non technique (support COMEX)

💻 Environnement technique et bibliothèques​

Python Jupyter Notebook Pandas Numpy Scikit-learn Matplotlib Seaborn Plotly Express

🧠 Méthodes et techniques appliquées

Analyse PESTEL Feature Engineering ACP CAH K-means Silhouette Score