Segmentation pays par clustering pour analyse de marché

Etude complète de 183 pays pour prioriser les opportunités d’exportation agroalimentaire.

Objectif du projet

Dans le cadre du développement à l’international d’une entreprise française d’agroalimentaire bio, l’objectif était d’identifier les marchés les plus porteurs à partir de données publiques. La mission consistait à réaliser une étude de marché fondée sur une analyse de données multicritères, puis à recommander des pays cibles sur des critères stratégiques.

Approche méthodologique

Le projet a démarré par une analyse PESTEL pour sélectionner huit variables économiques, démographiques et politiques influençant directement l’exportation de volaille biologique. Les données ont été collectées à partir de sources open data fiables (FAO, Banque mondiale), nettoyées, enrichies par feature engineering, et standardisées dans un environnement Python.

Une analyse en composantes principales (ACP) a permis de réduire la complexité du jeu de données tout en conservant une part importante de la variance initiale. Cette réduction a facilité la visualisation et optimisé la performance des algorithmes de clustering.

Deux méthodes de segmentation ont été testées : la classification ascendante hiérarchique (CAH) et K-means. Après validation des résultats via l’analyse des scores de silhouette, une segmentation en 6 clusters avec K-means a été retenue. Cette approche a permis d’identifier plusieurs profils de marchés distincts.

Pour hiérarchiser les opportunités, un score d’opportunité multicritères a été conçu, combinant pouvoir d’achat, stabilité politique, dépendance aux importations et autres facteurs stratégiques.

Compétences et outils mobilisés

Collecte et intégration de données open data (FAO, Banque mondiale)
Nettoyage de données et feature engineering sous Python
Analyse exploratoire de données (EDA)
Réduction de dimension par ACP (scikit-learn)
Clustering avancé (K-means, CAH)
Validation de modèle (méthode du coude, scores de silhouette)
Visualisation des résultats (matplotlib, seaborn)
Communication adaptée à une audience non technique (support COMEX)

💻 Environnement technique et bibliothèques

Python Jupyter Notebook Pandas Numpy Scikit-learn Matplotlib Seaborn Plotly Express

🧠 Méthodes et techniques appliquées

Analyse PESTEL Feature Engineering ACP CAH K-means Silhouette Score