Categories

Archives

Les billets de May, 2017 (ordre chronologique)

Les immigrés cadres

Dans l’ancien département de la Seine (Paris et sa banlieue proche), où résident les cadres ?
La carte suivante s’intéresse aux personnes non immigrées : dans les zones en rouge, la population active est composée de plus de 70% de cadres et de professions intermédiaires, dans les zones en bleu, de moins de 34%.


Cliquez pour agrandir

On voit que Paris et l’Ouest ont une proportion importante de cadres et de professions intermédiaires.

Interessons-nous maintenant aux immigrés. La proportion de cadres et de professions intermédiaires dans la population active immigrée est plus faible. Mais grosso modo la distribution géographique ressemble à la précédente. Parmi les immigrés, il y a aussi plus de cadres à l’Ouest.

Cliquez pour agrandir

Les distributions géographiques sont proches, mais pas semblables. On peut voir qu’il y a certaines zones où semblent résider relativement plus de cadres immigrés (en proportion du total des actifs immigrés) que de cadres non-immigrés (en proportion du total des actifs natifs). Par exemple des zones où, parmi les immigrés actifs, il y a 45% de cadres (ce qui est bien supérieur à la moyenne — chez les immigrés) et où il n’y a “que” 50% de cadres parmi les natifs actifs (ce qui serait inférieur à la moyenne — chez les natifs).
Il y a des lieux où les immigrés de classe sup sont plus fréquents qu’attendus (par comparaison avec les natifs de classe sup) — et des lieux où ils sont relativement moins fréquents. Ce sont des différences de différences. Des lieux où, finalement, les immigrés cadres s’installeront un peu moins fréquemment que les immigrés natifs (des lieux refusés) et des lieux où il y aura un peu plus d’installation par comparaison aux natifs (des lieux recherchés).

Pour tracer la carte suivante, j’ai lissé les données en prenant en compte les 4 plus proches voisins (en pondérant par la population des IRIS).


Cliquez pour agrandir

Ces lieux : Anthony, Chatenay Malabry, Courbevoie et un morceau de Nanterre, mais aussi la zone frontière entre les 13e et 14e arrondissements.

Il s’agit de « différences de différences » : cette carte ne représente pas les zones où se trouvent beaucoup d’immigrés, mais où, après avoir pris en compte les différences et similitudes de distributions (géographique et statistique) entre les populations actives “natives” et “immigrées”, on repère un « résidu », des zones où l’on ne s’attendrait pas à voir “autant” ou “si peu” de cadres immigrés. … Mais il n’est pas certain qu’une telle carte soit très utile.

Des recours différents à la procuration

Le graphique suivant est complexe, mais le résultat est intéressant : la procuration des « beaux quartiers » n’est pas celle des autres quartiers parisiens.

cliquez pour agrandir

Examinons-le pas à pas.
Tout d’abord, j’ai calculé, pour chacun des 896 bureaux de vote parisiens, la composition par âge (18-25 ans, 26-35 ans… jusqu’aux 65 ans et plus). L’idée est de regarder si la procuration est plus fréquente, par exemple quand les jeunes électeurs sont en forte proportion, ou au contraire si c’est quand les électeurs âgés sont bien représentés. On voit alors qu’il n’y a pas de corrélation entre fréquence d’une classe d’âge et fréquence de la procuration, sauf concernant les 55-65 ans : plus cette classe d’âge est importante, moins il y a de procurations.

Ensuite j’ai décomposé ces quartiers suivant l’importance du vote pour François Fillon. La géographie sociale parisienne fait que ce sont dans les “beaux quartiers” de l’Ouest (7e, 8e, 16e, nord du 15e, sud du 17e…) que les votes pour Fillon étaient nombreux. J’aurai pu prendre la proportion d’électeurs à particule, ou la proportion d’électeurs ayant plus de deux prénoms, ou un autre découpage géographique… et les résultats auraient été proches.

Dans les “beaux quartiers” (ici les points bleus, la ligne bleue est une droite de régression) le recours à la procuration est généralement indépendant de la proportion de telle ou telle classe d’âge. Sauf pour les quartiers qui comptent une proportion importante de jeunes électeurs : dans les beaux quartiers, plus il y a de jeunes, plus le recours à la procuration est important. Et la relation s’inverse pour les quartiers populaires (ceux qui n’ont pas voté Fillon, en rouge ici) : plus il y a de jeunes électeurs, moins il y a de procuration. Une hypothèse : dans les quartiers de l’Ouest parisien, un “jeune électeur” est en vacances, en stage, ou étudiant… loin de Paris. Il donne procuration à ses parents. Dans les quartiers populaires, c’est moins souvent le cas.

Ces relations s’inversent quand les trentenaires et les quadragénaires sont nombreux. Dans les beaux quartiers, leur part n’est pas corrélée au recours à la procuration. Mais dans les quartiers où le score de F. Fillon est faible, alors la part de ces trentenaires et quadra est positivement liée à la fréquence de la procuration. Et c’est encore plus vrai dans les quartiers où le score du candidat de l’UMP était très faible. Ces classes d’âges sont-elles plus mobiles en dehors des “beaux quartiers” ? Ou alors, si l’on réfléchit en ayant en tête les comportements des mandataires, il est possible de penser que ces classes d’âge recueillent plus fréquemment les procurations des plus jeunes et des plus âgés, qu’elles servent de “pivot” permettant aux plus jeunes et aux plus âgés de voter tout en étant absents.

Sans avoir accès aux informations sur les procurations individuelles (il faut pour cela aller recueillir les listes d’émargement, ce que j’ai commencé à faire), il est difficile d’aller plus loin dans le raisonnement et la mise à l’épreuve des hypothèses.

Un peu d’imputation

Les résultats électoraux publiés sur opendata.paris.fr sont de bonne qualité : ils proviennent directement du bureau des élections de la ville de Paris. Mais il y a de petites bizarreries dans le nombre de votes par procuration de quelques bureaux de vote. C’est assez habituel : le nombre de votes par procuration ne change pas le résultat, et il ne fait pas partie des données scrutées avec attention (le nombre de voix reçues par les candidats, le nombre de votants…). C’est une donnée annexe, d’un peu moins bonne qualité.
Par exemple, les bureaux 10-1 et 16-46 ont indiqué zéro vote par procuration au premier tour des présidentielles. Tous les autres bureaux de vote ont au moins 9 procurations. Et les bureaux qui ont moins de 15 votes par procurations se trouvent tous dans les 18e, 19e ou 20e arrondissements. Les bureaux immédiatement adjacents au 10-1 et au 16-46 ont eux aussi bien plus de procurations.
J’ai donc été vérifier les listes d’émargement, à la préfecture de Paris. J’ai compté les procurations. Et en effet, le 10-1 a vu 81 procurations au premier tour, et le 16-46 a vu 44 votes par procuration. Aurai-je pu prédire ces chiffres et m’épargner un aller-retour en métro ?


Comme le montre le graphique ci-dessus, dans les deux bureaux concernés, le “vrai” taux de procuration ne devrait pas être zéro, mais plutôt 3% pour l’un et 4,5% pour l’autre.
Au lieu d’une régression sur une seule variable, on peut prendre en compte simultanément d’autres variables. L’idée est ici de se servir des corrélations assez fortes entre variables : taux d’abstention, proportion de votes Fillon ou Macron, taux de bulletins nuls… pour assigner une valeur probable au taux de procurations au premier tour.

Si l’on fait cette régression en enlevant les bureaux “problématiques”, alors on obtient 6,3% de procurations pour le bureau 10-1 et 4,6% pour le bureau 16-46. Soit, en valeur absolue : 74 procurations pour le 10-1 et 44 pour le 16-46. On tombe pipe-poil sur le vrai nombre pour le bureau du 16e, on est en dessous de 7 votants pour le bureau du 10e arrondissement. Pas mal !

Le problème se repose pour le second tour : certains bureaux ont des nombres de procurations très improbables, près de 400. Et d’autres assesseurs semblent avoir au contraire oublié un 1 devant le chiffre 11 ou 27. Et encore un bureau à zéro procuration.

Pour estimer le nombre de procurations réelles dans ces bureaux (que je n’avais pas pu identifier avant ma visite à la préfecture), je peux utiliser les résultats du second tour (vote Macron, abstention, bulletins nuls), mais aussi ceux du premier tour : ainsi le vote Fillon au premier tour est assez prédictif, ainsi que, bien entendu, le recours à la procuration au premier tour.

Une première régression permet d’identifier les bureaux aux chiffres aberrants : ce sont les bureaux dont le taux de procuration prédit est très éloigné du taux de procuration observé. On les enlève du jeux de données, on répète la régression, et on affecte à ces bureaux le taux de procuration prédit par cette nouvelle regression.

Cette procédure va faire augmenter artificiellement le « R^2 » de la régression, puisqu’on enlève les points aberrants et qu’on les remplace par des points prédits. Heureusement, cela ne porte que sur moins de 10 bureaux sur les 896 bureaux parisiens. Et ça permet de tracer des cartes un peu plus jolies.

Une petite prime à la difficulté

Il y a peu de femmes députées, mais depuis la loi sur la parité, il y a presque autant de candidats que de candidates. Certes. Mais les femmes sont investies, en tendance, dans des circonscriptions plus difficiles à gagner.
On peut mettre cela en évidence en prenant les candidatures aux élections législatives de 2012.
On commence par s’intéresser à l’élection présidentielle et on calcule le score de chaque candidat au premier tour, dans chacune des circoncriptions. Hollande fait tant dans telle circonscription, etc… Puis on s’intéresse aux élections législatives, et on affecte les candidats-députés à chaque candidat-président en fonction de son “étiquette” : les candidats-députés socialistes sont affectées à Hollande, les candidats-députés “UMP” à Sarkozy, etc…
On peut alors regarder si les candidates-députées socialistes, par exemple, sont investies dans des circonscriptions où Hollande a fait un bon score ou un mauvais score, et faire la même chose pour les candidats-députés.
On sépare les candidats “sortants” (celles et ceux qui étaient déjà députés, et qui, très souvent, ont été élus dans des circonscriptions où leur “candidat-président” a fait un bon score) des candidats “nouveaux”.

cliquez pour agrandir

Ce que l’on peut voir, c’est que les candidates sont investies dans des circonscriptions où leur “candidat-président” a fait un mauvais score (un score plus bas que sa moyenne). Les candidats, eux, non. De ce fait, il est plus difficile d’être élue députée que d’être élu député.