Categories

Archives

À pied, en voiture, à cheval ou en métro ?

Comment se déplacent les Franciliens pour aller au travail ?
Voici une petite exploration à partir des données du recensement 2010 (disponibles sur le site de l’INSEE). Il y a trois possibilités : à pied, en voiture, ou en transport en commun. L’occasion de faire une analyse “ternaire”. Ici, le vert-vert signifie le recours à la voiture, le bleu le recours aux transports en commun, et plus cela tend vers le rouge, plus les pieds sont utilisés pour aller au travail.
deplacements

Voici le “ternary plot” :

ggtern

J’étais tombé sur une image proche visualisant les transports dans le grand-Londres, mais je ne sais plus où.
Et si vous me dites : « mais moi, je marche jusqu’à ma voiture et je roule jusqu’à la gare… » Je vous répondrai d’aller visiter le site de l’INSEE pour comprendre la construction des données.
Note : par “à pied”, il faut comprendre “sans aucun déplacement”, “à pied”, ou “en deux-roues”

Géographie de la procuration

Les votes par procuration, à Paris, lors des Européennes de mai 2014, ont été plus fréquents dans les arrondissements centraux.
procuration-europeennes-2014
[Alors que, lors des Présidentielles ou des Législatives, septième, huitième et seizième ont un recours plus intense que d’autres arrondissements… Petite modification, donc, à prendre en compte.]

Les Noël naissent-ils à Noël ?

Les listes électorales donnent accès aux prénoms et à la date de naissance des électeurs. Il est ainsi possible d’étudier le lien entre certaines fêtes et le choix de certains prénoms. Commençons par Noël et Pascal.
J’ai retenu la date de naissance de tous les électeurs et électrices qui avaient un “Noël” parmi leurs prénoms : Noël, Jean-Noël, Marie-Noelle… sont, pour ce qui me concerne, des “Noël”.
Et ce que l’on constate, c’est que le jour de Noël est un jour de naissance particulier pour les Noël :
noel
Mais les choses évoluent au cours du siècle. 37% des “Noël” né-e-s avant 1935 sont né-e-s à Noël (c’est à dire entre le 23 décembre et le 27 décembre), ce n’est plus le cas que de 25% de celles et ceux qui sont nées entre 1935 et 1961. Et les Noël nés après 1979 que sont que 10% à être nés autour de Noël.
L’examen de la même relation avec les Pascal est plus complexe, car la date de Pâques change chaque année. Heureusement, il existe une fonction de la library timeDate, dans R, pour donner la date de Pâques. Et une partie des Pascal (et des Pascale, et des Marie-Pascale) naissent en effet à Pâques.
pascal
L’évolution est similaire à celles des Noël (mais en partant d’un niveau moins haut) : 13% “Pascal” nés avant 1950 sont nés à Pâques (plus ou moins 2 jours). Ce n’est plus le cas que de 6% des Pascal nés après 1981. Sur une période de 5 jours, s’il n’y avait pas d’attirance entre prénom et date, il aurait du naître 1,4% de Pascal ou de Noël à Pâques ou à Noël.
Il me reste maintenant à récupérer la liste des Saints-du-jour (en scrapant le site Nominis de la Conférence des Evêques) pour voir si le lien repéré ici pour deux dates est aussi repérable pour la Saint-Cunégonde et la Saint-Geoffroy.

En tout cas, ça a l’air de marcher pour la Saint-Valentin :
valentin

et pour quelques uns des prénoms les plus fréquents sur les listes électorales :
prenoms-pics80
cliquez pour voir en plus grand

Certains prénoms exhibent un saint (Michel, Marie, Jean, Daniel, Sébastien…) d’autres semblent plus également distribués sur l’année (Alain, Sarah…).

Un peu en avance

De nombreux travaux ont montré que, s’agissant des prénoms les plus fréquents, les cadres étaient “en avance” sur le reste des professions et catégories socioprofessionnelles. Des parents cadres vont avoir tendance à donner des prénoms un peu avant que des parents “professions intermédiaires” ou “employés” ne donnent les mêmes prénoms.
L’avance sur la mode peut-elle alors être prise comme indicateur indirect de position sociale ?
À partir des listes électorales parisienne, j’ai comparé, pour chaque “premier prénom”, l’année de naissance de l’électeur et l’année pendant laquelle son prénom atteint son rang le plus élevé. Ainsi un électeur prénommé Matthieu, né en 1979, sera considéré comme “en avance” de dix ans sur la mode (le prénom “Matthieu” atteint son meilleur rang national en 1989). On peut faire cela pour le million d’électeurs et d’électrices né-e-s en France et inscrit-e-s à Paris. Les prénoms très rares posent problème, car les données disponibles ne permettent pas de calculer l’année de leur “pic”. C’est le cas pour 8,3% des électeurs/trices.
La carte suivante montre, à l’échelle du bureau de vote, quelle est la proportion d’inscrits dont le prénom est au moins 3 ans “en avance” sur le pic.

avance

On remarquera aisément que les quartiers de Paris les plus “bourgeois” sont aussi ceux où les prénoms sont les plus fréquemment “en avance”. Comme si la mode pouvait naître dans un coin caché du septième arrondissement et essaimer, ensuite, dans le reste du corps social.

Les conditions maritales

Je continue ici l’examen des listes électorales. À Paris en 2014, les électrices sont 666954. Et un peu plus de 235000 sont mariées (au sens où elles disposent d’un nom marital en plus de leur nom de naissance). L’indicateur est imparfait : il est bien probable que le nom de l’époux ne soit pas toujours mentionné sur les listes électorales.
La proportion de femmes “mariées” augmente avec l’âge : les centenaires sont presques toutes mariées.
age-mariee
La géographie maritale parisienne est intéressante (on s’intéresse ici à la proportion de femmes mariées parmi les femmes) :
femmes-mariees
Les arrondissements les plus bourgeois sont ceux où les femmes mariées sont les plus fréquentes : septième, huitième, seizième. En revanche, dans les dixième, onzième et dix-huitième, les femmes n’indiquent pas souvent de nom marital. Est-ce parce qu’elles ne sont pas mariées ? Ou est-ce plutôt parce que c’est surtout dans les espaces bourgeois que l’on indique, — en toute discrétion — avec la bague de fiançailles et l’alliance, le nom de l’époux en toutes circonstances ? Ou est-ce parce qu’il y a des arrondissements de vieux et des arrondissements de jeunes et que le taux de mariage varie avec l’âge ?
L’analyse multivariée attendra, mais l’on remarquera, déjà, des comportements différents entre arrondissements : à tous âges, les femmes des arrondissements bourgeois ont plus fréquemment un nom marital sur leur carte d’électrice.
age-arrondissement-mariee

Le poids du nom

Les listes électorales parisiennes (plus d’un million d’inscrits), contiennent des informations sur 236072 femmes mariées : on y lit leur nom de naissance et le nom de leur époux. Les choses sont ainsi faites.
Certaines personnes disposent ainsi, par la naissance ou par le mariage, d’une particule. Appelons ces personnes des “nobles”. 6067 femmes sont nées nobles, 6456 épousent un noble. 230 005 sont nées roturières. Et 229 616 épousent un roturier.
Si les mariages avaient lieu au hasard, c’est à dire s’il n’y avait aucune attirance des femmes nées avec une particule pour les hommes nés avec une particule (et vice-versa), alors l’on observerait ceci :

Epouse un manant    Epouse un noble
Nait manante 223715 6290
Nait noble 5901 166

Seules 166 femmes nées avec une particule trouveraient un homme à particule.
Mais l’on sait bien que les mariages n’ont pas lieu au hasard.

Epouse un manant    Epouse un noble
Nait manante 225167 4838
Nait noble 4449 1618

Dans la réalité, dix fois plus de femmes nobles épousent des hommes nobles que si le coup de foudre frappait au hasard.
La situation diffère-t-elle suivant les arrondissements ? L’on sait que les “nobles” sont fréquents dans certains arrondissements (huitième, septième, seizième) et quasiment absents des arrondissements populaires (dix-neuvième, vingtième). Peut-être que leurs comportements conjugaux diffèrent : la noblaillonne du XIXe n’a peut-être pas les même goût que la duchesse du Faubourg Saint-Germain. L’on peut produire les mêmes données à l’échelle des 20 arrondissements parisiens et représenter, par des couleurs, le rapport entre la situation observée et la situation “attendue” (si les mariages se formaient au hasard).


mariages-paris
Cliquez pour agrandir

Il est complexe de réfléchir en terme de sur-représentation ET en terme de rapports de surreprésentations. Cela peut conduire à des interprétations étranges (notamment en raison des petits effectifs aristocrates à l’est de Paris). Mais l’on voit que là où il y a peu de nobles, ces derniers s’épousent dix fois plus fréquemment qu’attendu : la distance sociale se maintient (Jean-Eudes de Maillancourt est peut-être un gentrifieur, mais comme il appartient quand même à la gentry, il épousera plutôt Sixtine-Marie de La Huchette d’Arcourt). Ce n’est pas le cas là où l’aristocratie est nombreuse : dans le septième, ce rapport n’est plus que de 1 à quatre. Mais dans le septième, les mariages hétérogames sont relativement moins fréquents qu’ailleurs ; et les mariages entre manants relativement plus fréquents. Je laisse méditer ce qui peut apparaître, a priori, comme contradictoire.

Paris en couleurs

Les listes électorales sont une source de données formidables. J’ai eu l’occasion de les explorer récemment. Première tentative de synthèse ici.
mds-couleur
click to embigen

J’ai conservé quelques variables, à l’échelle du bureau de vote : l’âge moyen, la proportion de femmes inscrites, la proportion de personnes nées à l’étranger, la proportion de “nobles”, la proportion de personnes portant plus de deux prénoms.
J’ai appliqué à cela une procédure appelée “Multi-dimensional scaling“, qui permet de rapprocher entre eux des individus ayant des caractéristiques proches. Ici, les individus sont des bureaux de vote.
J’ai retenu trois dimensions.
La première dimension rassemble entre eux les bureaux de vote selon la proportion d’inscrits nés à l’étranger [on remarque que le 16e arrondissement est un peu différent du 8e et du 7e].
La deuxième dimension capture les variations de l’âge et du sexe apparemment.
La troisième dimension est plus complexe à interpréter immédiatement (et je n’ai pas encore exploré en détail).
Sur ces trois dimensions, chaque bureau de vote a un score, que je normalise entre 0 et 255, ce qui permet d’associer une couleur “RVB” à chaque bureau. Un bureau ayant un score semblable sur les trois dimension sera plutôt gris (clair ou foncé).

La carte oppose alors un bureau de vote situé au cœur du septième arrondissement (qui est ici vert foncé) aux bureaux de votes rose/orangés des marges de Paris. Mais aussi un bureau “vert-clair”, au cœur de Paris (plus masculin et jeune) à d’autres que je vous laisse trouver. La Butte Montmartre apparaît bien bleue. L’opposition entre Ouest et Est, importante à Paris, apparaît indirectement : les couleurs les plus sombres sont à l’Ouest, comme si un nuage était posé sur l’Ouest.
[Première synthèse qu’il faudra affiner, bien sûr].

d <- dist(mydata)
fit <- cmdscale(d,eig=TRUE, k=3)
x <- fit$points[,1]
y <- fit$points[,2]
z <- fit$points[,3]
range01 <- function(x){round(255*(x-min(x))/(max(x)-min(x)))}
xs<-range01(x)
ys<-range01(y)
zs<-range01(z)
mds<-cbind(xs,ys,zs)
couleurs<-rgb(mds[,1],mds[,2],mds[,3],maxColorValue=255)
# et ensuite, il suffit d'associer chaque Bureau de vote à chaque couleurs : le BV[i] recevra couleur[i]

Pretty R at inside-R.org

La méthode a été inspirée par cet article : Delineating Europe’s Cultural Regions: Population Structure and Surname Clustering [James Cheshire, Pablo Mateos et Paul A. Longley]

Versatile « Marie »

À la fin du XIXe siècle, Marie était dans le “top 20” des prénoms les plus donnés aux garçons. Souvenons-nous, par exemple de Marie Koenig, connu sous le prénom de Pierre. Ou de Marie Revillon, connu sous le nom de Michel Tony-Revillon.
Mais ce prénom cesse rapidement d’être donnés aux bébés de sexe masculin. Du moins en première position. Car « Marie » est versatile. On trouve des Louis-Marie et Jean-Marie, des Hubert-Marie et autres Pierre-Marie. Mais l’on trouve aussi des “Louis, Marie, Octave” ou des “Charles, Marie, Geoffroy”.
Et Wikipedia nous dit vaguement que « dans certaines familles catholiques, le prénom Marie sera systématiquement choisi pour premier ou deuxième prénom, même pour un garçon, en hommage à la Vierge Marie. »
Choisir « Marie » en 2e, en 3e ou en 7e prénom permettrait de signifier (en quasi-cachette, mais administrativement) une forme de catholicité. Possible, mais cela reste à creuser.
Il est possible, dès maintenant, de cartographier des « Marie-hommes », à partir des listes électorales à Paris :

homme-marie

Les arrondissements dans lesquels on trouve le plus de Marie-hommes (Marie étant ici utilisé sans “tiret” et après le premier prénom) sont les 7e et les alentours du Parc Monceau (8e et 17e). 16e, 15e, 6e suivent. Les arrondissements plus populaires, 18e, 19e, qui comptent aussi peu d’électeurs à particule, comptent peu de Marie-homme.
Difficile en l’état de valider totalement l’hypothèse de Marie comme signal catholique. Mais comme signal bourgeois, peut-être un peu plus.

Note méthodologique : la carte compare entre eux uniquement les hommes ayant plusieurs prénoms (car la probabilité d’avoir “Marie” en second prénom est nulle quand on n’a qu’un seul prénom). Une comparaison entre les porteurs du prénom Marie et tous les hommes (quel que soit le nombre de prénom) ne change pas la distribution.

Mise à jour : une version précédente de la carte était basée sur des données inexactes.

Dis-moi, combien de prénoms as-tu ?

L’on sait peu de choses sur les seconds, troisièmes… et parfois quatrièmes, cinquièmes et sixièmes prénoms. Ce sont des prénoms invisibles dans la vie quotidienne. « Bonjour, je m’appelle Marie, Adélaïde, Charlotte, Garance, Domitille, Sixtine d’Aniel de la Rochefoucault… »
Et dans la plupart des cas, les données statistiques disponibles ne recueillent pas ces prénoms fantômes. Il en va différemment sur les listes électorales, où noms et prénoms permettent l’indexation d’une personne à une carte d’identité. Il est ainsi possible de repérer l’évolution, dans le temps, du nombre moyen de prénoms des personnes inscrites sur les listes électorales.
Sur le graphique suivant, j’ai distingué trois groupes principaux (et distingué, dans ces groupes, les hommes des femmes). Premier groupe, les électeurs nés à l’étranger. Le groupe du milieu, l’ensemble des inscrits. Le groupe du haut les électeurs ayant un nom de famille à particule [la particule semble être un indicateur intéressant].
prenoms-inscrits
Les deux groupes “électeurs nés à l’étranger” et “électeurs à particule” se distinguent fortement : les électeurs nés à l’étranger ont en moyenne moins de deux prénoms. Les électeurs à particule en moyenne plus de deux prénoms, voire trois pour les plus jeunes. Alors qu’une particule rallonge déjà le nom de famille moyen, les parents à particule choisissent des formules prénominales plus longues [ce qui complexifie le théorème de Bérurier mentionné par Marie-Anne Paveau]. Manière d’égaliser les deux côtés de la balance onomastique?

Si hommes et femmes né°e°s à l’étranger se ressemblent sous le rapport du nombre de prénom, il n’en va pas de même pour les électeurs à particule, ni, dans une moindre mesure, pour l’ensemble des inscrits : les femmes ont en moyenne moins de prénoms que les hommes. Elles sont peut-être privées d’un capital onomastique (les prénoms des ancêtres, transmis aux hommes de préférence ?)…

Une première lecture de ce graphique insisterait ensuite sur l’augmentation régulière du nombre moyen de prénoms des électeurs.

Mais attention :

  1. il est probable, très probable, que les jeunes inscrits n’ont pas les mêmes caractéristiques sociales que les inscrits plus âgés (la mal-inscription touchant tendanciellement certaines personnes plutôt que d’autres), et si le nombre de prénom varie en tendance avec l’origine sociale, alors on repère ici les conséquences graphiques d’un effet de sélection
  2. l’augmentation du nombre de prénoms est peut-être due à des changements administratifs-informatiques dans l’enregistrement des personnes qui se sont inscrites récemment : ceux qui se sont inscrits dans les années 1990 ne pouvaient, peut-être, qu’inscrire deux ou trois prénoms, alors que ceux qui se sont inscrits dans les années 1990-2000 ont eu la possibilité d’inscrire tous leurs prénoms… Cela pourrait expliquer en partie le “saut” visible pour les électeurs nés vers 1980.

Le prénom à l’échelle “micro”

Certains naissent avec un seul prénom, d’autres avec une demi-douzaine. Les listes électorales indiquent, pour chaque électeur, le nombre de prénoms.
A Paris en 2014, 5 électeurs inscrits ont 8 prénoms. L’un d’entre eux (les prénoms ont été modifié) est “Philippe-René Louis André Pierre Arthur Clément Jac Léon” une autre est “Annieke Bénédicte Lia Huguette Carline Sophie Aurélie Marie”… et peut-être que la liste continue, mais que les prénoms, faute de place informatique, n’apparaissent pas. Et 59 personnes ont sept prénoms ou plus.

À l’échelle du bureau de vote, le nombre moyen de prénoms diffère. Dans les bureaux de vote des 5e, 6e, 7e, 8e et 17e (sud), les électeurs ont plus de 2,2 prénoms. Dans les bureaux de votes du 19e et du 18e (est), ils en ont moins de 1,8.

nbprenoms-bv

Mais le nombre moyen est peut-être un indicateur imparfait. Voici donc la carte montrant la proportion d’électeurs ayant 3 prénoms ou plus. C’est presque la même chose, mais les écarts sont magnifiés (certains bureaux de votes ont moins de 15% d’électeurs du type “Marie Clothilde Elizabeth Gentiane”).

prenoms3-bv

La carte reproduit bien la division entre un paris plutôt populaire, à l’Est, et un Paris plusbourgeois, à l’Ouest. L’habitude de donner plusieurs prénoms à la naissance est répandue en France, mais est peu fréquente dans de nombreux pays, et la proportion d’électeurs nés à l’étranger influe.
Mais on repère aussi probablement des pratiques administratives distinctes : il me semble probable que, dans le 9e arrondissement, tous les prénoms ne soient pas notés (ce qui expliquerait la coloration bleu-clair de cet arrondissement).