Categories

Archives

Le mystère des garçons en avance

L’avance scolaire des garçons m’étonne, depuis quelques temps déjà (voir les épisodes précédents ici ou encore ). J’ai commencé à explorer les données du “Panel 2007” (qui suit des élèves sur plusieurs années), mais ce n’est pas encore assez abouti.
L’avance scolaire des garçons est bizarre car elle n’est pas entièrement liée à leurs performances scolaires : à notes égales, les garçons sautent plus souvent une classe que les filles. Et cela se vérifie quelque soit la série ou filière du bac et quelque soit l’origine sociale des élèves. Cela peut s’illustrer avec les résultats nominatifs au bac, en prenant les prénoms comme des indicateurs (flous) d’origine sociale.
En abscisse : le pourcentage de mention “Très bien”. En ordonnées : le pourcentage d’élèves en avance. Chaque point représente un groupe d’élèves portant un prénom donné plus de 200 fois. La ligne bleue montre la relation (issue d’une régression linéaire) entre la proportion de garçons obtenant la mention Très bien et la proportion de garçons “en avance”. La ligne rouge montre la même chose pour les filles. Quelque soit l’année (non représentée), quelque soit la série, quelque soit l’origine sociale, les garçons, en moyenne, ont plus souvent sauté une classe que les filles qui ont les mêmes performances scolaires.

cliquez pour agrandir

Quand on connaît les primes diverses accordées à la précocité, on ne peut s’empêcher de penser que, décidément, les avantages masculins commencent tôt dans la vie.

Une petite prime à la difficulté

Il y a peu de femmes députées, mais depuis la loi sur la parité, il y a presque autant de candidats que de candidates. Certes. Mais les femmes sont investies, en tendance, dans des circonscriptions plus difficiles à gagner.
On peut mettre cela en évidence en prenant les candidatures aux élections législatives de 2012.
On commence par s’intéresser à l’élection présidentielle et on calcule le score de chaque candidat au premier tour, dans chacune des circoncriptions. Hollande fait tant dans telle circonscription, etc… Puis on s’intéresse aux élections législatives, et on affecte les candidats-députés à chaque candidat-président en fonction de son “étiquette” : les candidats-députés socialistes sont affectées à Hollande, les candidats-députés “UMP” à Sarkozy, etc…
On peut alors regarder si les candidates-députées socialistes, par exemple, sont investies dans des circonscriptions où Hollande a fait un bon score ou un mauvais score, et faire la même chose pour les candidats-députés.
On sépare les candidats “sortants” (celles et ceux qui étaient déjà députés, et qui, très souvent, ont été élus dans des circonscriptions où leur “candidat-président” a fait un bon score) des candidats “nouveaux”.

cliquez pour agrandir

Ce que l’on peut voir, c’est que les candidates sont investies dans des circonscriptions où leur “candidat-président” a fait un mauvais score (un score plus bas que sa moyenne). Les candidats, eux, non. De ce fait, il est plus difficile d’être élue députée que d’être élu député.

Un peu d’imputation

Les résultats électoraux publiés sur opendata.paris.fr sont de bonne qualité : ils proviennent directement du bureau des élections de la ville de Paris. Mais il y a de petites bizarreries dans le nombre de votes par procuration de quelques bureaux de vote. C’est assez habituel : le nombre de votes par procuration ne change pas le résultat, et il ne fait pas partie des données scrutées avec attention (le nombre de voix reçues par les candidats, le nombre de votants…). C’est une donnée annexe, d’un peu moins bonne qualité.
Par exemple, les bureaux 10-1 et 16-46 ont indiqué zéro vote par procuration au premier tour des présidentielles. Tous les autres bureaux de vote ont au moins 9 procurations. Et les bureaux qui ont moins de 15 votes par procurations se trouvent tous dans les 18e, 19e ou 20e arrondissements. Les bureaux immédiatement adjacents au 10-1 et au 16-46 ont eux aussi bien plus de procurations.
J’ai donc été vérifier les listes d’émargement, à la préfecture de Paris. J’ai compté les procurations. Et en effet, le 10-1 a vu 81 procurations au premier tour, et le 16-46 a vu 44 votes par procuration. Aurai-je pu prédire ces chiffres et m’épargner un aller-retour en métro ?


Comme le montre le graphique ci-dessus, dans les deux bureaux concernés, le “vrai” taux de procuration ne devrait pas être zéro, mais plutôt 3% pour l’un et 4,5% pour l’autre.
Au lieu d’une régression sur une seule variable, on peut prendre en compte simultanément d’autres variables. L’idée est ici de se servir des corrélations assez fortes entre variables : taux d’abstention, proportion de votes Fillon ou Macron, taux de bulletins nuls… pour assigner une valeur probable au taux de procurations au premier tour.

Si l’on fait cette régression en enlevant les bureaux “problématiques”, alors on obtient 6,3% de procurations pour le bureau 10-1 et 4,6% pour le bureau 16-46. Soit, en valeur absolue : 74 procurations pour le 10-1 et 44 pour le 16-46. On tombe pipe-poil sur le vrai nombre pour le bureau du 16e, on est en dessous de 7 votants pour le bureau du 10e arrondissement. Pas mal !

Le problème se repose pour le second tour : certains bureaux ont des nombres de procurations très improbables, près de 400. Et d’autres assesseurs semblent avoir au contraire oublié un 1 devant le chiffre 11 ou 27. Et encore un bureau à zéro procuration.

Pour estimer le nombre de procurations réelles dans ces bureaux (que je n’avais pas pu identifier avant ma visite à la préfecture), je peux utiliser les résultats du second tour (vote Macron, abstention, bulletins nuls), mais aussi ceux du premier tour : ainsi le vote Fillon au premier tour est assez prédictif, ainsi que, bien entendu, le recours à la procuration au premier tour.

Une première régression permet d’identifier les bureaux aux chiffres aberrants : ce sont les bureaux dont le taux de procuration prédit est très éloigné du taux de procuration observé. On les enlève du jeux de données, on répète la régression, et on affecte à ces bureaux le taux de procuration prédit par cette nouvelle regression.

Cette procédure va faire augmenter artificiellement le « R^2 » de la régression, puisqu’on enlève les points aberrants et qu’on les remplace par des points prédits. Heureusement, cela ne porte que sur moins de 10 bureaux sur les 896 bureaux parisiens. Et ça permet de tracer des cartes un peu plus jolies.

Des recours différents à la procuration

Le graphique suivant est complexe, mais le résultat est intéressant : la procuration des « beaux quartiers » n’est pas celle des autres quartiers parisiens.

cliquez pour agrandir

Examinons-le pas à pas.
Tout d’abord, j’ai calculé, pour chacun des 896 bureaux de vote parisiens, la composition par âge (18-25 ans, 26-35 ans… jusqu’aux 65 ans et plus). L’idée est de regarder si la procuration est plus fréquente, par exemple quand les jeunes électeurs sont en forte proportion, ou au contraire si c’est quand les électeurs âgés sont bien représentés. On voit alors qu’il n’y a pas de corrélation entre fréquence d’une classe d’âge et fréquence de la procuration, sauf concernant les 55-65 ans : plus cette classe d’âge est importante, moins il y a de procurations.

Ensuite j’ai décomposé ces quartiers suivant l’importance du vote pour François Fillon. La géographie sociale parisienne fait que ce sont dans les “beaux quartiers” de l’Ouest (7e, 8e, 16e, nord du 15e, sud du 17e…) que les votes pour Fillon étaient nombreux. J’aurai pu prendre la proportion d’électeurs à particule, ou la proportion d’électeurs ayant plus de deux prénoms, ou un autre découpage géographique… et les résultats auraient été proches.

Dans les “beaux quartiers” (ici les points bleus, la ligne bleue est une droite de régression) le recours à la procuration est généralement indépendant de la proportion de telle ou telle classe d’âge. Sauf pour les quartiers qui comptent une proportion importante de jeunes électeurs : dans les beaux quartiers, plus il y a de jeunes, plus le recours à la procuration est important. Et la relation s’inverse pour les quartiers populaires (ceux qui n’ont pas voté Fillon, en rouge ici) : plus il y a de jeunes électeurs, moins il y a de procuration. Une hypothèse : dans les quartiers de l’Ouest parisien, un “jeune électeur” est en vacances, en stage, ou étudiant… loin de Paris. Il donne procuration à ses parents. Dans les quartiers populaires, c’est moins souvent le cas.

Ces relations s’inversent quand les trentenaires et les quadragénaires sont nombreux. Dans les beaux quartiers, leur part n’est pas corrélée au recours à la procuration. Mais dans les quartiers où le score de F. Fillon est faible, alors la part de ces trentenaires et quadra est positivement liée à la fréquence de la procuration. Et c’est encore plus vrai dans les quartiers où le score du candidat de l’UMP était très faible. Ces classes d’âges sont-elles plus mobiles en dehors des “beaux quartiers” ? Ou alors, si l’on réfléchit en ayant en tête les comportements des mandataires, il est possible de penser que ces classes d’âge recueillent plus fréquemment les procurations des plus jeunes et des plus âgés, qu’elles servent de “pivot” permettant aux plus jeunes et aux plus âgés de voter tout en étant absents.

Sans avoir accès aux informations sur les procurations individuelles (il faut pour cela aller recueillir les listes d’émargement, ce que j’ai commencé à faire), il est difficile d’aller plus loin dans le raisonnement et la mise à l’épreuve des hypothèses.

Les immigrés cadres

Dans l’ancien département de la Seine (Paris et sa banlieue proche), où résident les cadres ?
La carte suivante s’intéresse aux personnes non immigrées : dans les zones en rouge, la population active est composée de plus de 70% de cadres et de professions intermédiaires, dans les zones en bleu, de moins de 34%.


Cliquez pour agrandir

On voit que Paris et l’Ouest ont une proportion importante de cadres et de professions intermédiaires.

Interessons-nous maintenant aux immigrés. La proportion de cadres et de professions intermédiaires dans la population active immigrée est plus faible. Mais grosso modo la distribution géographique ressemble à la précédente. Parmi les immigrés, il y a aussi plus de cadres à l’Ouest.

Cliquez pour agrandir

Les distributions géographiques sont proches, mais pas semblables. On peut voir qu’il y a certaines zones où semblent résider relativement plus de cadres immigrés (en proportion du total des actifs immigrés) que de cadres non-immigrés (en proportion du total des actifs natifs). Par exemple des zones où, parmi les immigrés actifs, il y a 45% de cadres (ce qui est bien supérieur à la moyenne — chez les immigrés) et où il n’y a “que” 50% de cadres parmi les natifs actifs (ce qui serait inférieur à la moyenne — chez les natifs).
Il y a des lieux où les immigrés de classe sup sont plus fréquents qu’attendus (par comparaison avec les natifs de classe sup) — et des lieux où ils sont relativement moins fréquents. Ce sont des différences de différences. Des lieux où, finalement, les immigrés cadres s’installeront un peu moins fréquemment que les immigrés natifs (des lieux refusés) et des lieux où il y aura un peu plus d’installation par comparaison aux natifs (des lieux recherchés).

Pour tracer la carte suivante, j’ai lissé les données en prenant en compte les 4 plus proches voisins (en pondérant par la population des IRIS).


Cliquez pour agrandir

Ces lieux : Anthony, Chatenay Malabry, Courbevoie et un morceau de Nanterre, mais aussi la zone frontière entre les 13e et 14e arrondissements.

Il s’agit de « différences de différences » : cette carte ne représente pas les zones où se trouvent beaucoup d’immigrés, mais où, après avoir pris en compte les différences et similitudes de distributions (géographique et statistique) entre les populations actives “natives” et “immigrées”, on repère un « résidu », des zones où l’on ne s’attendrait pas à voir “autant” ou “si peu” de cadres immigrés. … Mais il n’est pas certain qu’une telle carte soit très utile.

Zones de sur-performance

À partir des résultats au premier tour de l’élection présidentielle de 2017, à Paris, on peut tracer cette carte montrant les zones où les différents candidats ont réalisé des scores supérieurs à leur moyenne parisienne.

cliquez pour agrandir

Et voici le code, non commenté. Je commence par repérer où se trouvent les zones de sur-performance (les bureaux de votes). J’extrait du fond de carte parisien les 4 zones distinctes. Je trace ensuite quatre cartes les unes sur les autres.

library(tidyverse)
library(classInt)
library(RColorBrewer)
library(maptools)
library(rgdal)

setwd("~/Dropbox/projets-R/")

# le "shapefile" se trouve sur opendata.paris.fr
paris<-readOGR("../data/2017-listes-paris/secteurs-des-bureaux-de-vote-3/",
               "secteurs-des-bureaux-de-vote")

# frontières des arrondissements
parisarr <- readOGR ("../procurations/paris/arrondissements/parisarr.shp", layer="parisarr")
# les résultats électoraux se trouvent sur opendata.paris.fr
df <- read_csv2("~/Dropbox/procurations/paris/paris-2017/resultats_electoraux.csv")
df <- df %>% filter(`date du scrutin`=="2017-04-23") %>% 
  select(3,4,6,7,8,9,10,12,14,15,16,17) %>% 
  spread(key=`nom du candidat ou liste`,value=`nombre de voix du candidat ou liste obtenues pour le bureau de vote`) %>% 
  mutate(numbv=paste(`numero d'arrondissement 01 a 20`,`numero de bureau de vote 000 a 999`,sep="-"))

res <- df %>% group_by(numbv) %>% 
  summarize(arr=mean(as.numeric(`numero d'arrondissement 01 a 20`)),
            prop_macron=100*MACRON/`nombre d'exprimes du bureau de vote`,
            prop_lepen=100*`LE PEN`/`nombre d'exprimes du bureau de vote`,
            prop_fillon=100*FILLON/`nombre d'exprimes du bureau de vote`,
            prop_melenchon=100*(HAMON+`MÉLENCHON`)/`nombre d'exprimes du bureau de vote`) %>% 
  gather(key=type,value=valeur,-numbv,-arr)

res <- res %>% group_by(type) %>% 
  mutate(sur_rep=valeur/(mean(valeur)+.2*sd(valeur))) %>% # "la moyenne et un peu plus" (.2 écart type)
  filter(sur_rep>1) %>% group_by(numbv) %>% 
  mutate(keep=type[which.max(sur_rep)],valeur_keep=valeur[which.max(sur_rep)]) # on garde le candidat "le plus au dessus" de sa moyenne

# on ne garde pas les bureaux dupliqués
res <- res[!duplicated(res$numbv),]

# extraction des zones-candidats
macron <- subset(paris,paris$id_bv %in% res$numbv[res$keep=="prop_macron"])
lepen  <- subset(paris,paris$id_bv %in% res$numbv[res$keep=="prop_lepen"])
melenchon <- subset(paris,paris$id_bv %in% res$numbv[res$keep=="prop_melenchon"]) # avec le score d'Hamon ajouté
hamon <- subset(paris,paris$id_bv %in% res$numbv[res$keep=="prop_hamon"])
fillon <- subset(paris,paris$id_bv %in% res$numbv[res$keep=="prop_fillon"])

png("~/Desktop/parissur_rep.png",width=1100,height=800,res=150)
par(mar=c(1,0,1,1))
plot(paris) # on commence par "tracer" Paris 

m<-match(macron$id_bv,res$numbv)
plotvar<-res$valeur_keep
nclr <- 3
plotclr <- brewer.pal(nclr,"Greens")
class <- classIntervals(plotvar[m], nclr, style="fisher",dataPrecision=1)
colcode <- findColours(class, plotclr)
plot(macron,col=colcode,border=colcode,add=T)

m<-match(fillon$id_bv,res$numbv)
plotvar<-res$valeur_keep
nclr <- 3
plotclr <- brewer.pal(nclr,"Blues")
class <- classIntervals(plotvar[m], nclr, style="fisher",dataPrecision=1)
colcode <- findColours(class, plotclr)
plot(fillon,col=colcode,border=colcode,add=T)

m<-match(melenchon$id_bv,res$numbv)
plotvar<-res$valeur_keep
nclr <- 3
plotclr <- brewer.pal(nclr,"Reds")
class <- classIntervals(plotvar[m], nclr, style="fisher",dataPrecision=1)
colcode <- findColours(class, plotclr)
plot(melenchon,col=colcode,border=colcode,add=T)

m<-match(lepen$id_bv,res$numbv)
plotvar<-res$valeur_keep
nclr <- 3
plotclr <- brewer.pal(nclr,"Purples")
class <- classIntervals(plotvar[m], nclr, style="fisher",dataPrecision=1)
colcode <- findColours(class, plotclr)
plot(lepen,col=colcode,border=colcode,add=T)

plot(parisarr,add=T,lwd=.1) # on ajoute les frontières des arrondissements
legend(2.232, 48.91,legend=c("Hamon/Melenchon","Le Pen","Fillon","Macron"), fill=c("red","purple","deepskyblue","chartreuse3"), cex=1, bty="n",title="")
title(main="Zone de sur-performance des candidats. Paris. Présidentielles 2017.")
title(sub="Fond : opendata.paris.fr | données : Ville de Paris | Cartographie : B. Coulmont\nZones où les candidats font mieux que leur moyenne",line=-.5,cex.sub=.8)
dev.off()

Et, en bonus, le code, amélioré par Christophe P. :


library(tidyverse)
library(classInt)
library(RColorBrewer)
library(maptools)
library(rgdal)

rep_data_secteurs < - 'DATA/secteurs-des-bureaux-de-vote'
# "../data/2017-listes-paris/secteurs-des-bureaux-de-vote-3/"


setwd("~/Dropbox/projets-R/")

# le "shapefile" se trouve sur opendata.paris.fr
paris<-readOGR(rep_data_secteurs,
               "secteurs-des-bureaux-de-vote")

# frontières des arrondissements
parisarr <- readOGR ("../procurations/paris/arrondissements/parisarr.shp", layer="parisarr")
# les résultats électoraux se trouvent sur opendata.paris.fr
df <- read_csv2("~/Dropbox/procurations/paris/paris-2017/resultats_electoraux.csv")
df <- df %>% filter(`date du scrutin`=="2017-04-23") %>% 
  select(3,4,6,7,8,9,10,12,14,15,16,17) %>% 
  spread(key=`nom du candidat ou liste`,value=`nombre de voix du candidat ou liste obtenues pour le bureau de vote`) %>% 
  mutate(numbv=paste(`numero d'arrondissement 01 a 20`,`numero de bureau de vote 000 a 999`,sep="-"))

res < - df %>% group_by(numbv) %>% 
  summarize(arr=mean(as.numeric(`numero d'arrondissement 01 a 20`)),
            prop_macron=100*MACRON/`nombre d'exprimes du bureau de vote`,
            prop_lepen=100*`LE PEN`/`nombre d'exprimes du bureau de vote`,
            prop_fillon=100*FILLON/`nombre d'exprimes du bureau de vote`,
            prop_melenchon=100*(HAMON+`MÉLENCHON`)/`nombre d'exprimes du bureau de vote`) %>% 
  gather(key=type,value=valeur,-numbv,-arr)

res < - res %>% group_by(type) %>% 
  mutate(sur_rep=valeur/(mean(valeur)+.2*sd(valeur))) %>% # "la moyenne et un peu plus" (.2 écart type)
  filter(sur_rep>1) %>% group_by(numbv) %>% 
  mutate(keep=type[which.max(sur_rep)],valeur_keep=valeur[which.max(sur_rep)]) # on garde le candidat "le plus au dessus" de sa moyenne

# on ne garde pas les bureaux dupliqués
res < - res[!duplicated(res$numbv),]

# extraction des zones-candidats
extract_zone <- function (name)
{
    field <- paste0("prop_", name)
    return(subset(paris,paris$id_bv %in% res$numbv[res$keep==field]))
}

macron <- extract_zone('macron')
lepen  <- extract_zone('lepen')
melenchon <- extract_zone('melenchon') # avec le score d'Hamon ajouté
hamon <- extract_zone('hamon')
fillon <- extract_zone('fillon')

png("~/Desktop/parissur_rep.png",width=1100,height=800,res=150)
par(mar=c(1,0,1,1))
plot(paris) # on commence par "tracer" Paris 

plot_candidate <- function (cand, color)
{
    m<-match(cand$id_bv,res$numbv)
    plotvar<-res$valeur_keep
    nclr <- 3
    plotclr <- brewer.pal(nclr, color)
    class <- classIntervals(plotvar[m], nclr, style="fisher",dataPrecision=1)
    colcode <- findColours(class, plotclr)
    plot(cand,col=colcode,border=colcode,add=T)
}

plot_candidate(macron, "Greens")
plot_candidate(fillon, "Blues")
plot_candidate(melenchon, "Reds")
plot_candidate(lepen, "Purples")

plot(parisarr,add=T,lwd=.1) # on ajoute les frontières des arrondissements
legend(2.232, 48.91,legend=c("Hamon/Melenchon","Le Pen","Fillon","Macron"), fill=c("red","purple","deepskyblue","chartreuse3"), cex=1, bty="n",title="")
title(main="Zone de sur-performance des candidats. Paris. Présidentielles 2017.")
title(sub="Fond : opendata.paris.fr | données : Ville de Paris | Cartographie : B. Coulmont\nZones où les candidats font mieux que leur moyenne",line=-.5,cex.sub=.8)
dev.off()

Procuration et type de vote

À Paris, tout le monde ne vote pas par procuration. Par définition, les abstentionnistes ne votent pas par procuration. Et plus il y a d’abstentionnistes dans un bureau de vote [techniquement, à l’extérieur du bureau de vote, bien entendu], moins il y a de procurations : c’est dans les quartiers où l’on participe beaucoup que l’on vote par procuration. De la même manière, là où le vote est fréquemment blanc ou nul, il y a peu de procurations.
Là où les « petits candidats » font leur meilleur score, c’est là où il y a peu de votes par procuration. Mais cette relation se vérifie aussi pour de nombreux candidats : en 2017 à Paris, la fréquence de la procuration est inversement reliée au score local des candidats Le Pen, Hamon, Mélenchon, Arthaud et Poutou… On voit ainsi que la droite de régression (et une régression locale) est orientée vers le bas : dans les zones où il y a eu beaucoup de procurations, il y a eu relativement peu de votes pour Jean-Luc Mélenchon.


cliquez pour agrandir

La relation est inversée pour Macron et Fillon : là où il y a eu beaucoup de procurations, c’est là où ces candidats ont fait leurs meilleurs scores. En 2012, les choses étaient un peu différentes. Il y avait eu plus de procurations au premier tour à Paris, et seul le candidat Sarkozy était associé à une corrélation positive.

Ma vie dans l’EDP (1)

Une demi-journée par semaine, voire un peu plus, je me plonge via Big_Stat à l’INED dans l’Echantillon démographique permanent (EDP). Le but : comprendre “l’inscription ailleurs”, le fait d’être inscrit ailleurs que sur son lieu de résidence. C’est quelque chose de fréquent : cela concerne près d’un.e inscrit.e sur cinq.

Première découverte : l’EDP est découpé en “bases études”. Chaque base-étude contient l’ensemble de l’EDP, pour un millésime donné (avec les informations rétrospectives, recensements, etc…). Mais attention : les identifiants individuels de l’EDP-2012 ne sont pas ceux de l’EDP-2014. Première demi-journée de perplexité, avant de comprendre, et de tout reprendre à zéro.

Deuxième découverte : le lieu d’inscription électorale, quand ce n’est pas le lieu de résidence, n’est pas un lieu abandonné. C’est un lieu investi. Si on n’a pas été radié, c’est qu’on a encore (parfois) des attachements dans ce lieu. Une des bases de l’EDP porte sur les mariages. Et on peut regarder où se marient (en 2014) les personnes qui, en 2014 par exemple, sont “inscrites ailleurs” que sur leur lieu de résidence. Ca fait peu de monde (il faut sélectionner les individus EDP recensés en 2014, français, majeurs, inscrits sur les listes électorales, mais “inscrits ailleurs” que sur leur lieu de résidence, et qui se sont mariés en 2014). Nous partîmes 4 millions, nous arrivâmes 600.

     Femmes Hommes Effectifs
2012 27,5   19,5   600
2014 26,5   19,4   620

J’ai aussi fait le calcul pour 2012 aussi. Un quart des femmes, un cinquième des hommes (inscrits ailleurs et qui se marient) choisissent comme lieu du mariage non pas le lieu de résidence, mais le lieu de l’inscription électorale.

Alors certes, les effectifs ne sont pas énormes. Il faut que je fasse la même opération de sélection avec, par exemple, les recensements de 2008 à 2014. Il faudrait aussi que je travaille sur le lieu de résidence antérieur, ou sur les lieux d’inscription postérieurs au mariage : car le mariage est peut-être le dernier moment d’inscription ailleurs (le moment où certains arrêtent d’être inscrits chez leurs parents et où, enfin, ils s’inscrivent là où ils résident).

Viens chez moi, j’habite chez une copine…

… chantait Renaud il y a quelques années.
Cette chanson relevait, avec humour, qu’un «chez soi», c’est parfois chez un.e autre. Il n’est pas simple de saisir cette forme de résidence, mais on peut l’approcher à partir des listes électorales parisiennes. En effet, un champ, sur ces listes, donne la possibilité d’indiquer que l’on habite « chez Madame Dupont » ou « chez Monsieur Durand », que son nom n’est pas sur la boîte aux lettres, n’est pas sur d’autres documents, mais qu’on est joignable au 45 rue des Fleurs, « chez Madame Durand ».
Ces «chez» sont sur ces fichiers, explorons-les.
Ils ne sont pas nombreux : seulement 1,3% des inscrits. Mais comme il y a beaucoup d’inscrits, ça fait quand même près de 17 000 individus.
On peut voir qu’être “chez quelqu’un d’autre” est le fait des plus jeunes : Entre 19 ans et 40 ans, plus de 1,5% des inscrits ont un chez-soi chez l’autre. Plutôt des femmes, à cet âge. Mais après 35 ans, ce sont les hommes qui sont plus souvent que les femmes dans cette situation.

La proportion diminue avec l’âge, après 24 ans, à mesure qu’on se construit un chez soi chez soi.

Les inscrites qui habitent chez quelqu’un d’autre, pour la moitié d’entre elles, habitent chez un homme. Les inscrits, eux, sont près de 6 sur 10 à habiter chez une femme :

Sexe de la personne inscrite, sexe de la personne hébergeant
Sexe Autre cas Hébergeuse Hébergeur
F 5.7 43.9 50.4
M 6.3 57.1 36.6
Source : Listes électorales

À croire que ces hommes, en effet, “habitent chez leur copine”.

Aux jeunes âges, ce sont surtout des femmes qui habitent chez une femme. Entre 30 ans et 40 ans, la situation la plus fréquente, c’est une femmes qui habite chez un homme. Et après 40 ans, c’est surtout un homme qui habite chez une femme.

Les épreuves classantes nationales : âge, sexe et prestige

Il y a, en France, un concours pour devenir interne en médecine, et les listes des reçus sont publiées au journal officiel chaque année, m’apprend nc233.com qui a étudié les prénom des reçus.
J’ai récupéré les listes pour les trois dernières années.
Comme dans toute épreuve scolaire, on remarque que les plus précoces réussissent mieux :

En 2016, 50 % les candidats nés en 1993 sont dans le “top 1000”, alors que moins de 5% de ceux qui sont nés en 1988 s’y trouvent.

Mais à la différence des épreuves scolaires, les filles réussissent moins bien les “Epreuves nationales classantes” que les hommes. La pénalité est d’environ une demi-année : les filles réussissent autant que les garçons qui ont six mois de plus qu’elles.

Et cette plus grande réussite masculine est visible si l’on s’intéresse à la proportion d’hommes en fonction du rang de classement. Plus on se rapproche du début du classement, plus les hommes sont représentés : quand il y a 45% d’hommes au total, ils sont 60% dans les tous premiers rangs :

Et cette prime masculine se reproduit année après année.
Il est intéresssant de voir que la proportion d’homme augmente aussi vers la fin du classement, mais pas aux toutes dernières places, où il n’y a plus que 40% de garçons. Les femmes, elles, sont plus fréquemment représentées au milieu du classement.

Est-ce lié au refus de féminiser les internats et les spécialités médicales les plus prestigieuses ? Ou est-ce un effet du rendement inégal du rang de classement entre hommes et femmes ? Ne sachant pas comment ces épreuves sont organisées, je ne peux pas répondre.

Les arrêtés d’affectation sont aussi publié, et l’on peut voir qui choisit quoi en fonction de son rang de classement. Les premiers classés obtiennent ce qu’ils souhaitent. Les dernières classées prennent ce qui reste.

Dans le tableau suivant, par exemple, on peut lire que la spécialité “pédiatrie” est féminisée. Alors que la chirurgie générale (que ce soit à Paris, à Lille ou à Lyon) l’est peu. La colonne “max” indique la position du dernier reçu (50 indique que le dernier reçu était dans les 50% les mieux classés). Cela indique l’attractivité de la Discipline*Région : ainsi pour espérer une place en cardiologie ou en anesthésie, il vaut mieux être bien classé. En revanche, pour avoir psychiatrie, pas de problème. Et si on est bien classé, en général, on ne demandera pas “medecine générale” à Caen : personne parmi les 20% les mieux classés, entre 2014 et 2016, n’a demandé cette spécialité (ce qu’indique la colonne “min”).

Attractivités des spécialités et des régions
Région Spécialité min max N % Hommes
1 Aix-Marseille. pédiatrie 1 51 50 8
2 Ile-de-France. dermatologie et vénérologie 0 76 52 15.4
3 Lyon. pédiatrie 0 73 51 15.7
4 Ile-de-France. pédiatrie 1 76 253 17.8
5 Ile-de-France. gynécologie obstétrique 1 42 94 18.1
6 Lille. pédiatrie 1 49 65 20
7 Nancy. psychiatrie 7 100 52 25
8 Rennes. médecine générale 0 95 322 30.7
9 Besançon. médecine générale 6 100 237 31.2
10 Aix-Marseille. psychiatrie 5 88 76 31.6
11 Grenoble. médecine générale 4 97 328 31.7
12 Lyon. médecine générale 3 98 555 32.4
13 Nantes. médecine générale 3 90 348 33.9
14 Ile-de-France. pneumologie 1 27 58 34.5
15 Montpellier. médecine générale 1 97 475 34.9
16 Angers. médecine générale 4 97 346 35
17 Bordeaux. psychiatrie 15 92 68 35.3
18 Tours. médecine générale 10 100 263 35.7
19 Ile-de-France. médecine générale 0 100 1730 36.1
20 Strasbourg. médecine générale 4 99 413 36.1
21 Bordeaux. médecine générale 0 98 577 36.4
22 Toulouse. médecine générale 1 98 472 38.3
23 Ile-de-France. psychiatrie 2 91 308 38.6
24 Nice. médecine générale 2 95 247 40.1
25 Saint-Etienne. médecine générale 4 97 234 40.2
26 Aix-Marseille. médecine générale 4 99 653 40.3
27 Clermont-Ferrand. médecine générale 2 100 258 40.7
28 Nancy. médecine générale 17 100 398 40.7
29 Toulouse. psychiatrie 2 96 73 41.1
30 Lyon. psychiatrie 4 75 72 41.7
31 Ile-de-France. médecine interne 0 27 93 41.9
32 Ile-de-France. médecine du travail 29 100 57 42.1
33 Brest. médecine générale 6 99 284 42.3
34 Ile-de-France. gastro-entérologie et hépatologie 0 27 66 42.4
35 Lille. psychiatrie 6 93 120 43.3
36 Rouen. psychiatrie 15 98 62 43.5
37 Ile-de-France. biologie médicale 4 99 55 43.6
38 Ile-de-France. oto-rhino-laryngologie et chirurgie cervico-faciale 2 28 55 43.6
39 Rouen. médecine générale 12 100 296 43.6
40 Ile-de-France. neurologie 0 29 64 43.8
41 Poitiers. médecine générale 5 96 368 43.8
42 Lille. médecine générale 1 99 715 43.9
43 Océan-Indien. médecine générale 13 97 169 45
44 Reims. médecine générale 17 100 236 46.6
45 Limoges. médecine générale 10 100 130 46.9
46 Caen. médecine générale 20 100 271 47.6
47 Antilles-Guyane. médecine générale 8 96 212 49.1
48 Dijon. médecine générale 8 100 244 50.4
49 Ile-de-France. oncologie 0 34 76 52.6
50 Poitiers. psychiatrie 6 99 57 54.4
51 Amiens. médecine générale 16 100 246 54.9
52 Ile-de-France. ophtalmologie 0 47 90 55.6
53 Ile-de-France. radiodiagnostic et imagerie médicale 0 22 155 56.1
54 Lyon. anesthésie-réanimation 0 23 50 58
55 Ile-de-France. cardiologie et maladies vasculaires 0 21 141 58.9
56 Montpellier. chirurgie générale 1 51 61 59
57 Lille. anesthésie-réanimation 1 38 60 60
58 Ile-de-France. anesthésie-réanimation 0 41 193 60.6
59 Ile-de-France. santé publique 3 97 51 62.7
60 Ile-de-France. anesthésie réanimation 0 39 92 66.3
61 Lille. radiodiagnostic et imagerie médicale 0 22 57 66.7
62 Lyon. chirurgie générale 2 44 64 67.2
63 Lille. chirurgie générale 1 50 96 67.7
64 Aix-Marseille. chirurgie générale 0 52 66 68.2
65 Ile-de-France. chirurgie générale 0 72 190 68.4
Source : Légifrance

Et un bonus pour celles et ceux qui sont arrivés jusqu’ici : la proportion de candidats “précoces” (qui ont au moins un an de moins que le gros du peloton) par spécialité. 17% des internes en “néphrologie” sont des précoces, et ce n’est que 2,7% des internes en médecine générale (les plus nombreux).

Proportion de candidats précoces
Spécialité % précoces Effectif
santé publique 1.4 222
médecine du travail 1.7 293
médecine générale 2.8 11027
biologie médicale 3.2 339
médecine physique et de réadaptation 3.2 311
endocrinologie, diabète, maladies métaboliques 3.3 246
psychiatrie 3.4 1546
gynécologie-obstétrique 4.7 214
anesthésie réanimation 6.1 460
chirurgie générale 6.4 1260
oncologie 6.6 392
cardiologie et maladies vasculaires 7.1 644
pneumologie 7.1 366
pédiatrie 7.3 995
gynécologie obstétrique 7.5 456
anesthésie-réanimation 8 922
rhumatologie 8.1 271
neurologie 8.6 373
radiodiagnostic et imagerie médicale 9 787
gastro-entérologie et hépatologie 9.1 397
dermatologie et vénérologie 9.4 299
oto-rhino-laryngologie et chirurgie cervico-faciale 9.5 262
ophtalmologie 12.6 461
médecine interne 14.7 409
néphrologie 17 265
Source : Légifrance