Produisez une étude de marché

Table des matières

Paramètres config

Objet de la mission :

Réaliser un partitionnement des pays mondiaux afin de cibler les pays les plus favorables à satisfaire notre objectif d'internationalisation de la vente de nos produits "poulet"
Haut de page    

Partie 1 : Préparation des données

1. Dataframe minimal

1.1 Données alimentaires

On importe les données suivantes, pour tous les pays et pour la dernière année disponible (2018), depuis le site de la FAO :

On crée le df minimal, df_mini, c'est-à-dire celui qui comprend les 4 variables exigéees :

Remarque:
-> On ne s'occupe que des 3 dernières variables pour le moment, c'est-à-dire celles relatives à l'alimentation

Haut de page    

1.2 Données de population

On vérifie que la somme des populations nationales est cohérent avec les chiffres officiels de la population mondiale en 2018 (≈ 7.6 milliards)

On constate que la somme donne un résultat trop important

-> on vérifie que les données de la Chine ne sont pas en double

Les données de la population de la Chine apparaissent 2 fois
-> On supprime les données correspondant au code pays 351

On vérifie à nouveau

Le résultat est maintenant cohérent

Haut de page    

1.3 Merge des données

On peut maintenant merger les données relatives à l'alimentation et à la population

Haut de page    

2. Dataframe enrichi

2.1 Continent

Haut de page    

2.2 Le PIB / habitant

Methode : left depuis df_global
-> nous permettra de détecter la présence éventuelle de valeurs nulles

Haut de page    

2.3 le niveau de sécurité (sécurité financière)

Pas de valeurs nulles pour notre variable risque

Haut de page    

2.4 La quantité de volaille consommée

Haut de page    

2.5 La part des importations nettes dans la quantité consommée

Remarque :

Haut de page    

2.6 Le niveau d'imposition

Ces 7 pays ne fournissent pas d'information sur leur taux d'imposition
-> on les exclut de l'analyse (on crée un df spécifique pour ces pays)

Haut de page    

3. Export des données

Haut de page    

Partie 2 : Partitionnement

1. Classification hiérarchique

Haut de page    

1.1 Analyse des données

Analyse bivariée