Loading [MathJax]/jax/output/CommonHTML/fonts/TeX/fontdata.js
Projet 7 - Effectuez une prédiction de revenus

▪ Mission 1 : Résumé des données

▪ Mission 2 : Diversité des revenus et indice de Gini

Table des matières

Paramètres config

Préparation des données

1. Distribution des revenus

On va chercher les pays correspondants à ces sigles.
On va pour cela se servir d'une table de correspondance code_pays / nom_pays, par exemple celle présente sur le site sql.sh

Traitement de 'XKX' et de 'PSE'

Les infos trouvées sur le site de la banque mondiale permettent de faire une estimation du gdpppp pour l'année 2008

Traitement de 'LTU'

On va estimer la valeur manquante pour le centile 41 grâce à la méthode interpolate
Rq : on garde la méthode linéaire (méthode pa défaut)

Haut de page    

2. Indices de Gini

On constate qu'il y a un pays de moins dans 'gini_data' que dans 'income_data'
-> il y a donc un pays présent dans le df des revenus qui n'apparait pas dans celui des coef. de Gini

Le pays correspondant est la province de Taïwan
Si cette province est manquante dans le dataset des indices de Gini, c'est peut-être parce que les provinces sont comptabilisées dans la Chine

On regarde le code_pays ISO3 de la Chine

On teste ce code dans le dataset des coef. de Gini

On extrait les codes des autres provinces pour voir s'ils apparaissent dans le dataset de Gini

On verifie la présence de ces code_pays dans le df Gini et dans le df Income

La Chine est donc référencée comme un seul pays

On supprime donc Taiwan du dataset des revenus et des coef. Gini

Haut de page    

3. Population

2 éléments à prendre en compte pour les différentes années:

On va utiliser les données de la FAO (on ajoutera aussi le nom des pays en français)

Il manque un pays dans le df pop

Il s'agit à nouveau du Kosovo.
Après des recherches, il s'avère que ce territoire est considéré comme indépendant par certaines institutions, ou comme faisant partie de la Serbie pour d'autres.

La FAO comptabilise la population du Kosovo avec celle de la Serbie :
-> on va régulariser en 2 temps :

Haut de page    

Mission 1 : Résumé des données initiales

Périmètre temporel et spatial de l'analyse

Haut de page    

Données concernant l'indice de Gini

On regarde si tous les pays ont au moins une valeur

On crée un df de ces 7 pays (nous rajouterons l'indice de Gini pour une année juste après)

Haut de page    

Données démographiques

Haut de page    

Type de quantiles utilisés

Les revenus sont distribués par centiles de la population
Exemple avec le quantile 1 pour la France

On peut lire cette ligne de la façon suivante : 1% de la population français dispose d'un revenu annuel moyen de 2958.3€

Haut de page    

Unité $PPP

Il s'agit d'un taux de conversion fictif qui permet la comparaison des pouvoirs d’achat des différentes monnaies.
Cette unité est fixée en définissant un panier de consommation "normalisé" c'est-à-dire identique dans tous les pays

Exemple : si ce panier de biens coûte 100 euros en France et 120 dollars aux Etats-Unis, la PPA sera de 1 euro = 1,20 dollar
(alors que le taux de change peut être de 1 euro = 1,4 dollar).

C'est donc une unité qui rend possible les comparaisons internationales en supprimant l'effet du taux de change

Haut de page    

Mission 2 : Diversité des revenus et indices de Gini

Calcul des indices de Gini

Haut de page    

Cartes mondiales des indices de gini

On constate que les écarts sont importants
-> Nous allons donc utiliser uniquement les valeurs de la Banque Mondiale

Haut de page    

Diversité des pays en terme de distribution des revenus

On définit un df des pays disposant de l'indice de Gini pour toutes les années de l'étude

Haut de page    

Courbes de Lorenz

Haut de page    

Evolution de l'indice de Gini

Sur les années de l'analyse (2004-2011)

Sur toutes les années disponibles

Haut de page    

Classement des pays par indice de Gini

Haut de page    

Carte mondiale des indices de Gini (valeur moyenne)

On va réaliser une dernière carte en prenant la valeur moyenne

Export des données

Haut de page