Categories

Archives

Archives de la catégorie : 'cartographie'

Le poids du nom

Les listes électorales parisiennes (plus d’un million d’inscrits), contiennent des informations sur 236072 femmes mariées : on y lit leur nom de naissance et le nom de leur époux. Les choses sont ainsi faites.
Certaines personnes disposent ainsi, par la naissance ou par le mariage, d’une particule. Appelons ces personnes des “nobles”. 6067 femmes sont nées nobles, 6456 épousent un noble. 230 005 sont nées roturières. Et 229 616 épousent un roturier.
Si les mariages avaient lieu au hasard, c’est à dire s’il n’y avait aucune attirance des femmes nées avec une particule pour les hommes nés avec une particule (et vice-versa), alors l’on observerait ceci :

Epouse un manant    Epouse un noble
Nait manante 223715 6290
Nait noble 5901 166

Seules 166 femmes nées avec une particule trouveraient un homme à particule.
Mais l’on sait bien que les mariages n’ont pas lieu au hasard.

Epouse un manant    Epouse un noble
Nait manante 225167 4838
Nait noble 4449 1618

Dans la réalité, dix fois plus de femmes nobles épousent des hommes nobles que si le coup de foudre frappait au hasard.
La situation diffère-t-elle suivant les arrondissements ? L’on sait que les “nobles” sont fréquents dans certains arrondissements (huitième, septième, seizième) et quasiment absents des arrondissements populaires (dix-neuvième, vingtième). Peut-être que leurs comportements conjugaux diffèrent : la noblaillonne du XIXe n’a peut-être pas les même goût que la duchesse du Faubourg Saint-Germain. L’on peut produire les mêmes données à l’échelle des 20 arrondissements parisiens et représenter, par des couleurs, le rapport entre la situation observée et la situation “attendue” (si les mariages se formaient au hasard).


mariages-paris
Cliquez pour agrandir

Il est complexe de réfléchir en terme de sur-représentation ET en terme de rapports de surreprésentations. Cela peut conduire à des interprétations étranges (notamment en raison des petits effectifs aristocrates à l’est de Paris). Mais l’on voit que là où il y a peu de nobles, ces derniers s’épousent dix fois plus fréquemment qu’attendu : la distance sociale se maintient (Jean-Eudes de Maillancourt est peut-être un gentrifieur, mais comme il appartient quand même à la gentry, il épousera plutôt Sixtine-Marie de La Huchette d’Arcourt). Ce n’est pas le cas là où l’aristocratie est nombreuse : dans le septième, ce rapport n’est plus que de 1 à quatre. Mais dans le septième, les mariages hétérogames sont relativement moins fréquents qu’ailleurs ; et les mariages entre manants relativement plus fréquents. Je laisse méditer ce qui peut apparaître, a priori, comme contradictoire.

Paris en couleurs

Les listes électorales sont une source de données formidables. J’ai eu l’occasion de les explorer récemment. Première tentative de synthèse ici.
mds-couleur
click to embigen

J’ai conservé quelques variables, à l’échelle du bureau de vote : l’âge moyen, la proportion de femmes inscrites, la proportion de personnes nées à l’étranger, la proportion de “nobles”, la proportion de personnes portant plus de deux prénoms.
J’ai appliqué à cela une procédure appelée “Multi-dimensional scaling“, qui permet de rapprocher entre eux des individus ayant des caractéristiques proches. Ici, les individus sont des bureaux de vote.
J’ai retenu trois dimensions.
La première dimension rassemble entre eux les bureaux de vote selon la proportion d’inscrits nés à l’étranger [on remarque que le 16e arrondissement est un peu différent du 8e et du 7e].
La deuxième dimension capture les variations de l’âge et du sexe apparemment.
La troisième dimension est plus complexe à interpréter immédiatement (et je n’ai pas encore exploré en détail).
Sur ces trois dimensions, chaque bureau de vote a un score, que je normalise entre 0 et 255, ce qui permet d’associer une couleur “RVB” à chaque bureau. Un bureau ayant un score semblable sur les trois dimension sera plutôt gris (clair ou foncé).

La carte oppose alors un bureau de vote situé au cœur du septième arrondissement (qui est ici vert foncé) aux bureaux de votes rose/orangés des marges de Paris. Mais aussi un bureau “vert-clair”, au cœur de Paris (plus masculin et jeune) à d’autres que je vous laisse trouver. La Butte Montmartre apparaît bien bleue. L’opposition entre Ouest et Est, importante à Paris, apparaît indirectement : les couleurs les plus sombres sont à l’Ouest, comme si un nuage était posé sur l’Ouest.
[Première synthèse qu’il faudra affiner, bien sûr].

d <- dist(mydata)
fit <- cmdscale(d,eig=TRUE, k=3)
x <- fit$points[,1]
y <- fit$points[,2]
z <- fit$points[,3]
range01 <- function(x){round(255*(x-min(x))/(max(x)-min(x)))}
xs<-range01(x)
ys<-range01(y)
zs<-range01(z)
mds<-cbind(xs,ys,zs)
couleurs<-rgb(mds[,1],mds[,2],mds[,3],maxColorValue=255)
# et ensuite, il suffit d'associer chaque Bureau de vote à chaque couleurs : le BV[i] recevra couleur[i]

Pretty R at inside-R.org

La méthode a été inspirée par cet article : Delineating Europe’s Cultural Regions: Population Structure and Surname Clustering [James Cheshire, Pablo Mateos et Paul A. Longley]

Le prénom à l’échelle “micro”

Certains naissent avec un seul prénom, d’autres avec une demi-douzaine. Les listes électorales indiquent, pour chaque électeur, le nombre de prénoms.
A Paris en 2014, 5 électeurs inscrits ont 8 prénoms. L’un d’entre eux (les prénoms ont été modifié) est “Philippe-René Louis André Pierre Arthur Clément Jac Léon” une autre est “Annieke Bénédicte Lia Huguette Carline Sophie Aurélie Marie”… et peut-être que la liste continue, mais que les prénoms, faute de place informatique, n’apparaissent pas. Et 59 personnes ont sept prénoms ou plus.

À l’échelle du bureau de vote, le nombre moyen de prénoms diffère. Dans les bureaux de vote des 5e, 6e, 7e, 8e et 17e (sud), les électeurs ont plus de 2,2 prénoms. Dans les bureaux de votes du 19e et du 18e (est), ils en ont moins de 1,8.

nbprenoms-bv

Mais le nombre moyen est peut-être un indicateur imparfait. Voici donc la carte montrant la proportion d’électeurs ayant 3 prénoms ou plus. C’est presque la même chose, mais les écarts sont magnifiés (certains bureaux de votes ont moins de 15% d’électeurs du type “Marie Clothilde Elizabeth Gentiane”).

prenoms3-bv

La carte reproduit bien la division entre un paris plutôt populaire, à l’Est, et un Paris plusbourgeois, à l’Ouest. L’habitude de donner plusieurs prénoms à la naissance est répandue en France, mais est peu fréquente dans de nombreux pays, et la proportion d’électeurs nés à l’étranger influe.
Mais on repère aussi probablement des pratiques administratives distinctes : il me semble probable que, dans le 9e arrondissement, tous les prénoms ne soient pas notés (ce qui expliquerait la coloration bleu-clair de cet arrondissement).

Où sont les femmes ?

Les listes électorales contiennent des informations intéressantes, à l’échelle du bureau de vote. On peut mettre en carte la proportion d’inscrits dont le nom de famille comporte une particule. On peut aussi cartographier d’autres caractéristiques, plus classiques.

Si l’on sait qu’il nait chaque année environ 105 hommes pour 100 femmes, l’on voit que cette proportion est inégalement répartie sur le territoire parisien. Au centre-nord de Paris, les inscrits sont plus souvent des hommes que des femmes. Ces dernières sont plus “rive-gauche” finalement.
femmesinscrites

D’autres informations montrent la diversité de l’espace parisien. Ainsi l’âge. L’âge de l’inscrit médian est d’environ 50 ans dans le XVIe… et d’environ 40 ans dans le XVIIIe.

agemedian
Mais la dispersion est aussi intéressante : le “centre-nord” de Paris a des inscrits moins dispersée en âge, alors que les XVIe, VIIe, XVe arrondissement ont une population d’inscrits plus diverses (sous le rapport de l’âge).

dispersionage

Et si l’on s’intéresse au lieu de naissance des électeurs ? On peut voir que les électeurs nés à l’étranger se trouvent surtout à proximité des périphériques. Le XVIe a plus d’étrangers que ce que j’aurai pensé a priori, mais ce ne sont probablement pas les mêmes étrangers que dans le XVIIIe arrondissement. Et Montmartre serait le dernier village gaulois.
paris-etranger

Le Paris des Nobles

À la fin du XIXe siècle, d’après l’annuaire du Tout Paris, voici où se trouvaient les Nobles :
175-Nobles
(image extraite de l’Atlas des parisiens)
Et en 2014 ? En m’appuyant sur les listes électorales, recueillies dans le cadre d’une enquête sur la pratique du vote par procuration, j’ai dressé la carte suivante qui montre la fréquence des nobles à l’échelle du bureau de vote :
nobles-2014
Sur les quelques 1,2 millions d’inscrits, j’ai considéré comme “Noble” le porteur ou la porteur d’une particule : d’Oulmont est noble, de Coulmont est noble, du Coulmont est noble, Galouzeau des Coulmonts sera noble… ce qui est un indicateur, ma foi, un peu faible. Mais la carte est, je trouve, parlante. Marquises et Vicomte évitent le 19e arrondissement. La particule préfère les 6e, 7e, 8e et 16e arrondissements.
La stabilité de la localisation nobiliaire entre 1889 et 2014 est frappante.

La procuration au premier tour (Paris, municipales, 2014)

Centre et périphéries à Paris : le recours à la procuration fut peu important au premier tour des municipales. Il fut plus important dans les arrondissements centraux.
procurations-paris-municipales-t1
cliquez pour agrandir

La province à Paris

De quel endroit viennent les Parisiens ?
parisprovince
En utilisant les données de l’INSEE sur la mobilité des résidents entre 2005 et 2008, il est possible de repérer les départements d’origine des néo-parisiens.
J’ai essayé de prendre en compte la taille des départements d’origine et des arrondissements d’arrivée, pour repérer les flux “significatifs” (qui ne sont pas toujours les flux les plus importants).
Note de lecture : cette carte compte tous les “78” comme des Versaillais, et tous les “77” comme des Melunais.
La carte avec les numéros de département est ci-dessous :
parisprovince-nombres

Vote à distance, distance au vote ?

Dans un article sur Metropolitiques, Lucie Bargel analyse le vote des “originaires”, celles et ceux qui sont vues comme étant “d’ici”, mais qui vivent “là bas”. Elle pointe l’existence de villages dans lesquels il y a plus d’inscrits (sur les listes électorales) que de résidents (au sens du recensement). Cet “effet Bargel”, est-il fréquent ?

La carte suivante laisse penser que oui.
france-inscrits-residents
Cliquez pour agrandir

Sur cette carte, les zones en rouge sont celles où les inscrits sur les listes électorales de la commune sont plus nombreux que les résidents de la commune. Certes il existe un lien entre la résidence et l’inscription sur les listes électorales. Mais une résidence “secondaire” dans une commune peut suffire à être inscrit sur la liste de cette commune. Et il y a aussi tous ces “jeunes” (et moins jeunes), qui, ayant quitté leurs parents, continuent, par attachement peut-être, à voter là où ils résidaient. Traditionnellement, ces personnes ont été qualifiées de “faux inscrits” [Sineau. “L’abstentionnisme parisien…” RFSP 28(1), 1978, 55-72] (on trouve aussi l’expression chez Gaxie dans Explication du vote: Un bilan des études électorales en France) en suivant l’idée que ces personnes ne devraient pas être inscrites.

Creusons un peu cette carte. Si l’on se restreint aux résidents majeurs (en enlevant les enfants, qui ne votent pas et qui donc n’ont rien à faire dans l’histoire), que remarque-t-on ?

france-inscrits-residents19
Cliquez pour agrandir

On voit donc apparaître une France de l’attachement, en rouge. Une “France du vide” (démographique) mais une France qui n’a pas été entièrement quittée par celles et ceux qui n’y habitent plus vraiment. La France des montagnes : Morvan, Alpes, Pyrénées. La France des plâteaux : le Perche, les Ardennes sont visibles sur cette carte. Et, aussi, une France de la Côte (regardez bien, à l’Ouest normand ou breton, où presque tous les villages du littoral immédiat sont roses ou rouges) pleine de résidences secondaires. Au total, plus de 17 000 communes ont plus d’inscrits sur les listes électorales que de résidents majeurs. Cela peut sans doute contribuer aux difficultés rencontrées par de nombreux villages dans la constitution de listes de candidats complètes pour les municipales.

Une représentation graphique montre une relation entre l’altitude d’une commune et le rapport entre nombre d’inscrits et nombre de résidents… là se niche peut-être le cœur de “l’effet Bargel”.
altitude-inscrits-residents
Mais une altitude (1000 mètres) ne signifie pas la même chose partout en France. Il y a des “1000 mètres” très difficiles à atteindre et des “1000 mètres” bien plus aisés à atteindre. Je propose deux régressions (linéaires et locales), sans pondération (ce qui donne à chaque village ou ville un poids égal) ou avec une pondération par le nombre d’inscrits. Dans les quatre cas, la relation est positive.

L’étude de la relation entre la variation de la population et la “surinscription” est moins univoque. Le graphique suivant met en abscisse la variation relative de la population (entre 1999 et 2011) et le ratio “inscrits sur résidents majeurs” en 2008/2009.
La régression linéaire sur les communes a un coefficient négatif : avoir perdu des habitants est corrélé à “avoir plus d’inscrits que de résidents majeurs”. Mais si on prend en compte la taille des communes (leur population en 2011), alors le coefficient est très proche de zéro : la surinscription n’est pas liée à la variation relative du nombre d’habitants.

population-evolution-inscrits
Cliquez pour agrandir

L’inscription sur les listes électorales étant liée, quand même, à une forme de résidence (ancienne, partielle, secondaire…) il est possible que les villes et villages comptant une grande proportion de résidences secondaires soient aussi des endroits avec une surinscription plus forte. C’est, globalement, le cas :
surinscription-secondaires
Cliquez pour agrandir

Plus il y a de résidences secondaires (en proportion) plus il y a d’inscrits “en trop” (par rapport aux résidents majeurs).

On peut aussi regarder s’il existe une relation entre la proportion d’actifs résidents dont le travail se trouve à l’extérieur de la commune et la surinscription. J’utilise là une variable non pas pour elle-même, mais comme indicateur de la situation communale : une zone de résidence plus que de travail. Une partie des surinscrits sont peut-être des personnes qui travaillent et vivent en dehors de la commune où ils sont inscrits.

Le graphique suivant résume les corrélations entre variables (prises deux à deux) :
corrplot

Mais alors, ce rôle de l’altitude c’est peut-être juste la combinaison du déclin de la population et d’un nombre important de résidences secondaires combiné à une situation d’emploi particulière ? Une régression linéaire multiple, sur ces quatre variables, laisse penser que non : une altitude plus élevée reste associée à une surinscription plus forte (en contrôlant les autres variables). L’effet Bargel résiste bien à la régression !

Cette surinscription a-t-elle des conséquences électorales ? Après tout, ces non-résidents ne votent peut-être pas, s’il faut, pour voter, se déplacer. Ces villages où se trouvent plus d’inscrits que de résidents, doivent connaître un taux d’abstention plus élevé que la moyenne, n’est-ce-pas ? Pas vraiment : participation et surinscription semblent corrélées.
participation-bargel

Peut-être que les “surinscriptions” ont lieu dans des zones électoralistes… et que ceux qui résident ailleurs mais y sont inscrits continuent, même à distance, à participer intensément. Il est probable (à vérifier…) que si ces résidents temporaires font l’effort de s’inscrire (ou ne font pas l’effort de s’inscrire ailleurs), alors ils font aussi, peut-être, l’effort de voter (ou d’établir une procuration). Distance au vote ou vote à distance ? ce “ou” n’est pas exclusif. Il est certainement possible d’analyser cette “surinscription” comme la surmobilisation de groupes ou de personnes, qui arrivent à voter, à élire, sans avoir à résider.

Maintenant, vous pouvez retourner lire l’article de Lucie Bargel.

Notes : Les cartes ont été réalisées avec R, package maptools, à partir d’un shapefile des communes (GeoFla) et de données de l’INSEE (pour le recensement) et du ministère de l’intérieur (pour le nombre d’inscrits sur les listes électorales). J’ai bien conscience que ces sources n’ont pas la même origine, qu’une “résidente” et qu’une “inscrite” sont les résultats de définitions différentes… mais qui ne sont pas sans lien entre elles. L’appariement des données s’est fait très rapidement mais un peu “à la louche” quand même.

Can you really vote twice? Proxy votes in France

Here is the companion piece to my blog post on The Monkey Cage (thanks Erik!). You can also see Arthur Charpentier’s companion piece.

France does not allow for early voting nor mail-in voting. If you want to vote, you have to go to the ballot box, or vote by proxy. Proxy voting is now easier than before, but one still has to go to the police, the gendarmerie or to a local tribunal to officialize the proxy. And one has to sign “sur l’honneur” that going to the ballot box on the day of the election is impossible. Another condition : The proxy voter needs to be registered to vote in the same city.
I was surprised to realize that French political scientists never studied proxy voting (it has been extensively studied by legal scholars of electoral fraud). Until a few years ago, it was indeed a rounding error in ballot box results, but that is not the case anymore. And to be brief, proxy voting seems to be a way for the politically active to vote when they can not physically vote. With two colleagues, Arthur Charpentier and Joël Gombin, we have begun to explore the social and political logics of the “procuration” — as proxy voting is known in France. We focused our inquiry, at first, at the polling station level (bureaux de vote) : it is a very small geographical unit of around 1000 voters, and in many cities it should be somewhat homogeneous (at least with a smaller variance than bigger geographical units).
We focused on polling stations data because the “electoral participation surveys” of the INSEE (the French National Statistical Institute) did not gather information about “proxy votes” (they were considered to be too few).

For a few years now, the main French cities have put some data online. And in a few cases, we have data about proxy votes :

  1. Montpellier : Electoral results (1994-2012), and the shapefile of the Bureaux de vote for 2012.
  2. Nantes : electoral results (2007 to 2012) and shapefile of the polling stations (for 2012)
  3. Paris : electoral results (2007-2012) But no shapefile here. I have had access to a shapefile created by the Cartelec group
  4. Lyon : It is more complicated here. Data have to be scrapped from the municipal website. The shapefile of the polling station is available. Julien Barnier put on GitHub the code used to gather electoral results

In the working paper published by La Vie des idées, we also used data created by the ANR Cartelec, which recombined data from the French census to fit the geographical units of the polling stations.

Feel free to ask for more information about la procuration en France.

Explorer la procuration

La Vie des Idées vient de publier un article écrit avec Arthur Charpentier et Joël Gombin, article qui porte sur le vote par procuration en France.
Je poursuis ici l’exploration des données du vote par procuration et Arthur Charpentier fait de même sur son blog.

Tout d’abord un mot sur les données :
Dans l’article, nous nous appuyons sur les données recueillies par l’ANR Cartelec, notamment pour les fonds de carte des bureaux de vote (au format shapefile .shp) et pour les données du recensement à l’échelle de ces bureaux de vote. Ces données sont accessibles sur le site de Cartelec.
Mais Cartelec n’a pas d’informations concernant les procurations. Et il n’est pas simple de trouver le nombre de votes par procuration aux niveaux nationaux, départementaux, communaux ou à l’échelle du bureau de vote. Mon premier réflexe a été de rechercher des données dans les enquêtes “Participation électorale” de l’INSEE (1983-2012)… mais ces enquêtes n’a-ont pas pris en compte les procurations… Ce qui est dommage, car l’on dispose, avec ces enquêtes, de données individuelles.
Il a donc fallu se rabattre sur d’autres sources, partielles et à une échelle agrégée… Nous avons travaillé ici avec des données “écologiques” (et donc avec un risque d’ecological fallacy) À ma connaissance, seules quatre grandes villes donnent accès à des données sur les procurations.

  1. Montpellier : Résultats des élections (1994-2012), et aussi le shapefile des Bureaux de vote pour les élections de 2012.
  2. Nantes : résultats des élections (de 2007 à 2012) et shapefile des Bureaux de vote (pour 2012)
  3. Paris : résultat des élections (2007-2012) Etrangement, la ville de Paris n’a pas mis à disposition des citoyens le shapefile des bureaux de vote
  4. Lyon : C’est plus compliqué dans le cas de Lyon. On trouve bien le shapefile des bureaux de vote, mais les résultats doivent être moissonés sur le site de la ville de Lyon. Julien Barnier a mis en ligne le code R sur github pour récupérer les données et une analyse ici

J’ai contacté les sites « opendata » de Strasbourg, Marseille, Toulouse et Bordeaux pour essayer d’obtenir des données similaires, mais pour l’instant soit “le logiciel” des services électoraux municipaux ne recueille pas le nombre de votes par procuration (Strasbourg), soit les services des élection diffusent un format inutilisable (Marseille), soit les services des élections, très occupés en ce moment, répondront plus tard à ces demandes.
J’ai aussi contacté (à deux reprises au moins) la préfecture des Hauts de Seine, pour connaître le nombre de votes par procuration à Neuilly et aux alentours, mais sans réponse.
Le bureau des élections du Ministère de l’Intérieur m’a envoyé un fichier excel contenant pour la France entière des données départementales très “trouées” : apparemment, le Ministère ne contrôle pas de très près le nombre de votes par procuration et beaucoup de préfectures n’envoient pas les chiffres. Cela rend très complexe l’évaluation de l’évolution nationale de la fréquence de la procuration.
Mais j’ai réussi à faire cette petite carte nationale (en faisant soit la moyenne des deux tours, quand c’était disponible, soit en ne prenant qu’un seul tour) :
proddep2012pres
Il semble y avoir un peu plus de procurations dans le Sud de la France en avril-mai 2012… Mais si, lors du premier tours, les trois zones scolaires étaient en vacances, ce n’était pas le cas le 6 mai quand seule la zone B (Lille, Aix…) était en vacances. La région parisienne et la Corse ont un recours plus intense à la procuration.

Une autre carte qui ne se trouve pas dans l’article de la Vie des idées est reproduite ici. Une carte parisienne montrant le rapport entre votes par procurations et votes “blancs ou nuls”, carte intéressante : elle permet de bien distinguer des zones où les votes par procurations ne sont pas beaucoup plus nombreux que les votes nuls et des zones où le vote par procurations est de 6 à 17 fois plus fréquent que le vote nul, c’est à dire des zones où l’offre politique disponible rencontre tellement bien l’assentiment des résidents qu’ils votent même en cas d’empêchement.

proc-nuls

Terminons par quelques “copies d’écran” montrant le rôle d’internet dans la procuration.

L’équipe de NKM, candidate à la mairie de Paris, a mis en place une procédure permettant à un sympathisant UMP de trouver quelqu’un pour qui voter (comme l’équipe de Hollande l’avait fait en 2012) :

procurations-nkm-janvier2014

L’équipe d’Anne Hidalgo fait presque la même chose, mais en permettant aussi à des personnes souhaitant être mandatées de se déclarer, en jouant sur le plaisir du vote : “Vous êtes disponible et impatient-e (…) Votez deux fois !”
procuration-hidalgo2014

Ces deux dispositifs peuvent se comprendre comme des “pièges à sympathisants” : l’UMP locale — et le PS local — connaît sans doute ses militants, mais moins ses sympathisants. Avec ce dispositif, des informations peuvent être recueillies sur des personnes qu’il est possible de mobiliser ensuite.

Et dans le même temps, le gouvernement prépare la dématérialisation de l’établissement du vote par procuration :
procurations-simplification
Simplifier le vote par procuration vise à rendre plus aisé l’acte de vote. Mais l’on voit — c’est mon hypothèse — que la procuration semble utilisée de manière prioritaire par des personnes aisées (diplômées, propriétaires, cadres…) : c’est à mon avis une des modalités du vote des classes dominantes. Il est fort possible que rendre plus aisée la procuration ne bénéficie pas vraiment au gouvernement actuel… mais c’est une autre histoire.