Categories

Archives

Archives de la catégorie : 'General'

La procuration en 2022 : répartition communale

L’Insee a rendu public, sur le site Statistiques locales, le nombre et la fréquence des procurations en 2022, au niveau communal.
Voici donc une carte montrant, pour la France métropolitaine, le « taux de procurations » en 2022 :

La procuration est plus fréquente dans l’Ouest parisien (des villes riches comme Neuilly ou Versailles), dans les métropoles régionales (Nantes, Rennes, Lyon), dans les zones de montagne (où l’on trouve par ailleurs des inscrits qui n’y résident pas), la Corse mais aussi les villes et villages du littoral de la Manche et de l’Atlantique (zones de résidences secondaires).

Les prénoms des élus

Il y a, en 2022, environ 502 000 élus dans les différents conseils municipaux en France. Le répertoire national des élus est téléchargeable sur data.gouv.fr. Les prénoms les plus fréquents sont Jean, Marie, Philippe, Michel…
Mais ces prénoms sont aussi fréquents dans la population française non élue. Quels sont donc les prénoms qui sont sur-représentés chez les élus ?

Voici le raisonnement que j’ai suivi : j’ai comparé les prénoms des élus avec les prénoms des personnes nées en France, à partir du Fichier des prénoms, de l’Insee. Je vais présenter les résultats sous la forme d’un graphique qui compare la distribution des prénoms dans le Répertoire national des élus avec la distribution du Fichier des prénoms. Voici un graphique explicatif :
 

Vous remarquerez que les échelles sont logarithmiques.

Première comparaison

Je commence par comparer la population des élus et élues avec la population née en France depuis 1900 à partir du Fichier des prénoms. S’il y a 1,2% des naissances qui sont des naissances de bébés prénommés Zygloub et qu’il y a 2,4% de Zygloub parmi les élus, alors Zygloub est 2 fois plus présent chez les élus que ce qui est attendu (2 = 2,4 / 1,2).

Apparemment, il y a “trop” de Didier et de Régis parmi les élus, et “pas assez” de Jeannine, de Mohamed et de Thérèse. Quatre fois moins de Louis qu’attendu, et trois fois plus d’Hervé.
Mais on a tout de suite un problème : la population des élus municipaux compte moins de femmes que la population française, ce qui va se refléter sur la position des prénoms sur ce graphique. Je vais donc faire une deuxième comparaison, en tenant compte de la part des femmes parmi les élu·e·s.

Deuxième comparaison

Cela ne change pas grand chose, mais on voit des prénoms comme Justine ou Marie se rapprocher d’un rapport d’égalité :
 

Et de l’autre côté du graphique, les prénoms masculins sur-représentés apparaissent moins sur-représentés (étant donné que les hommes constituent la majorité des élus).

Troisième comparaison

On peut aller plus loin : les élus municipaux sont principalement des élus de toutes petites communes. Et à Paris, par exemple, il y a peu d’élus municipaux par comparaison avec la population. Quand on compare les prénoms de la population à ceux des élus, on peut le faire sur une base départementale : s’il y a peu de Samira en Corrèze, il y aura sans doute peu d’élues nommées Samira (même si, dans le Nord, il va naitre plus de Samira).

Dans le graphique suivant, je contrôle donc par les naissances départementales :


 
Peu de changements, là aussi. Mais quand même : si les Mohamed étaient quatre fois moins fréquents qu’attendus quand on ne prenait pas en compte les départements, ils ne sont plus que 2,5 fois moins fréquents qu’attendus.

Quatrième comparaison

Il faut donc probablement contrôler par le sexe et le département, comme je le propose ci-dessous :


 
Bof, non ? Ça ne conduit pas à une modification radicale des sur- et sous-représentations. C’est probablement parce que j’ai oublié que les élus n’avaient pas 110 ans, et qu’ils n’avaient pas 10 ans non plus.

Cinquième comparaison

Il faut donc, bien entendu, contrôler par l’année de naissance. Et cela d’autant plus que les prénoms connaissent souvent une période – plutôt courte – pendant laquelle ils sont beaucoup donnés. Si les Jeannine sont peu présentes parmi les élus, c’est parce qu’elles sont en grande partie déjà décédées.

Dans le graphique suivant, je prend donc en compte la distribution par âge de la population des élus.


 
Ah, là il y a du changement. Une bonne partie des prénoms se retrouvent à proximité du rapport d’égalité entre le nombre d’élus et le nombre attendu d’élus. Mais ne peut-on pas aussi prendre en compte le sexe et le département ?

Sixième comparaison

Oh que si : dans le dernier graphique, je montre les résultats d’un calcul prenant en compte l’année de naissance, le sexe et le département d’élection des élu·e·s :

La “boule” centrale s’est encore rétrécie : on prévoie assez bien combien il y a aura de Céline élues si l’on connaît la distribution par âge, sexe et départements de la population des élues. Il reste quelques prénoms que ces variables expliquent mal : Bertrand, Armelle, Bénédicte, Etienne, Benoît, Hugues et Hubert se retrouvent trop souvent parmi les élus. Est-ce un signe que ces prénoms sont attachés à des personnes disposant de ressources sociales plus importantes ? De l’autre côté, on trouve des prénoms symétriques : Tony, Kevin, Sabrina, Nadia, Jonathan, Jessica… que l’on devrait retrouver plus souvent chez les élus.

Et Mohamed et Karim : même en tenant compte de l’âge des élus, de leur département d’élection, de leur sexe… il y a “trop peu” de Mohamed et de Karim parmi les élus municipaux. Pour quelles raisons ? Peut-être l’utilisation d’un autre prénom au quotidien et une candidature sous un autre prénom que le prénom de naissance (comme le firent ou le font Marie-Ségolène “Ségolène” Royal, Marion-Anne “Marine” Le Pen et tant d’autres). Peut-être qu’il faudrait prendre en compte une échelle plus fine que le département ? Ou peut-être qu’on trouverait d’autres raisons si on cherchait un peu.

Notes :

  1. J’ai transformé les prénoms composés : Anne-Marie est Anne, Jean-Philippe est Jean…
  2. J’ai asciifié les prénoms : ils n’ont plus aucun accent ni cédilles
  3. C’est un peu stupide de prendre en compte les naissances départementales pour estimer une proportion attendue, comme si les élus étaient nés là où ils sont élus
  4. Et en plus, avec la fin du département de la Seine en 1968, les codages bizarres de l’Outre-Mer, je ne suis pas certain de ne pas avoir été trop rapide parfois
  5. J’ai sans doute fait des erreurs, mais si vous voulez les corriger, le code est sur github

Des animaux et des indigènes : « race » dans le Journal officiel

De 1896 à la décolonisation de Madagascar, le Journal officiel de Madagascar et dépendances rend compte de l’actualité légale d’un territoire qui est alors colonie française.
Dans ce Journal officiel il est assez régulièrement fait mention de « race ». Par exemple ici :

Source Gallica

ou encore ici

Source Gallica

Mais dans le premier extrait, il s’agit d’humains, dans le second de chevaux.
Mon nominalisme radical m’a poussé à en savoir plus. J’ai donc, grâce à l’API de Gallica, récupéré toutes les occurrences de « race(s) » dans le J.O de Madagascar. L’année 1931 manque, et c’est un petit malheur. Autour de ce mot, après avoir éliminé les mots de liaison (et, ou, mais, il…), j’ai pris une fenêtre de 50 mots avant et après. J’ai ensuite procédé à une classification thématique au moyen d’un “topic modelling“. J’ai retenu trois “topics”.

Le premier, que j’ai nommé “Production”, rassemble des extraits consacré aux races bovines, et à la production de viande. Le troisième s’intéresse à la “Reproduction” et au prix des animaux, à la fécondité. Les “métis” désignent souvent des croisements de races animales, pas les enfants de couples de colons et de Malgaches. Le deuxième “topic” concerne surtout des humains : ça parle de colonie, de province, de chef, de gouverneur, de population et d’indigènes.

Et ça évolue dans le temps : chaque extrait a une probabilité d’être affecté à un “topic” (un extrait peut être attaché à plusieurs topics), et je fais la moyenne par période de 5 ans.

Si je lis bien ce que j’ai fait, et j’ai probablement fait des erreurs ici et là, c’est le thème de la Reproduction qui émerge à partir des années 1920, en réduisant la part des extraits associés aux autres thèmes. Ce n’est pas que les « indigènes » perdent leur « race » à partir de la première guerre mondiale, mais plutôt que les réflexions agricoles prennent de l’ampleur.

La lecture plus qualitative des extraits du J.O. de Madagascar laisse percevoir la déconnexion des usages du mot «race(s)». On trouvera très peu de textes qui parlent simultanément de races d’humains et de races d’animaux. La gestion des populations humaines et celle des populations de bétail ne sont pas exactement les mêmes.

Quinze ans de procurations à Paris, 2007-2022

La carte ci-dessous représente la proportion des voix exprimées qui sont des votes par procuration, à Paris, par bureau de vote, pour les élections municipales, législatives et présidentielles, de 2007 à 2022.

cliquez pour agrandir

On retrouve des régularités : (1) le vote par procuration est plus fréquent en période de vacances scolaires ou de «pont» (et donc au moment des présidentielles, qui ont lieu pendant les vacances de printemps), (2) le vote par procuration est plus fréquent dans les beaux quartiers que dans la ceinture de logements sociaux situés à proximité du périphérique, et (3) le vote par procuration, lors des municipales, est plus fréquent là où le résultat de l’élection est incertain (mais ce point, je devrais le vérifier).

Si l’on calcule la fréquence moyenne, sur ces vingt scrutins, du vote par procuration, on peut tracer la carte suivante :

Comme les frontières des bureaux de vote ont changé entre 2007 et 2022, j’ai découpé Paris en petits carrés et estimé la fréquence qu’on aurait si les bureaux de vote étaient ces petits carrés.

Présidentielles : les parrainages à particule

Si la particule du nom de famille (de, du, d’ ou des) ne voulait rien dire, alors les gens à particule auraient la même distribution sociale que les gens sans particule. Monsieur Dupont et monsieur du Pont seraient équivalents.
J’ai pu montrer, dans Dupont n’est pas du Pont (Histoire & mesure, 2019), que, précisément, Dupont n’est pas du Pont.
On peut en trouver une nouvelle illustration dans ce graphique, qui présente la proportion des « parrainages » (ou « présentations ») des candidats et candidates, aux élections présidentielles, depuis 1981. Soit 41 ans, huit élections, 56 candidats, et plus de 60 700 parrainages et marrainages.

Comme on peut le constater, c’est un gradient gauche-droite qui se révèle dans la distribution des « parrainages à particule ». Statistiquement, la chose est intéressante : il y a peu d’élus à particule, environ 1%, et les parrainages sont peu nombreux (entre 500 et 2000). Il ne suffirait que de quelques parrainages à particule en plus ici ou là pour faire basculer un.e candidat.e du bas en haut de cette liste. Mais ce n’est pas ce que l’on observe…

 

Pour comprendre dans quelles recherches s’inscrit ce graphique, vous pouvez lire Dupont n’est pas du Pont.

Le redoublement de minorité

Qui utilise son prénom dans son enseigne commerciale ?
Dans le fichier Sirene, je sélectionne les entrepreneurs individuels (au sens de « unités légales » identifiées par un nom et un prénom) et dont l’entreprise dispose d’une « enseigne commerciale », soit environ 560 000 entreprises fin 2021.
Environ 10% de ces entreprises ont, dans leur enseigne commerciale, le prénom de l’entrepreneur/entrepreneuse. Par exemple « Aux fleurs de Line » est le magasin de Line Dupont. Les femmes ont tendance à utiliser un peu plus leur prénom que les hommes, qui, eux, utilisent beaucoup plus leur nom de famille : « Maçonnerie Dupont » est l’entreprise de Maurice Dupont. Les femmes constituent environ 43% des entrepreneuses individuelles dont l’entreprise a une enseigne commerciale.
La chose amusante, du moins je la trouve amusante, c’est que dans les secteurs où les femmes sont peu fréquentes (les «travaux d’installation électrique», l’«entretien et réparation de véhicules»…), elles utilisent beaucoup moins leur prénom que les hommes. «Dupont Réparation» est la boîte de mécanique de Line Dupont, «Maurice Répare» est la boîte de mécanique de Maurice Dupont. On voit moins ça quand les hommes sont ultraminoritaires : certes ils utilisent moins leur prénom en coiffure ou «soins de beauté», mais pas autant, et on ne retrouve pas un tel coude à droite du graphique.
 

cliquez pour agrandir

 
Dans les secteurs masculins, les femmes ne mettent pas en avant leur appartenance minoritaire… ce qui fait qu’elles apparaissent encore moins présentes qu’elles ne le sont en réalité.

Tu seras présidente, ma fille !

Quand Gaston Doumergue, ce président de la IIIe République, visitait une ville, est-ce que les bébés naissaient avec le prénom de Gaston ? Et avait-il plus de succès que Paul Deschanel ?
On peut apporter des éléments de réponse à ces questions.
Un historien, Nicolas Mariot, a publié un ouvrage désormais classique sur les voyages présidentiels : Bains de foule. Les voyages présidentiels en province (Belin, 2006). Il a recueilli des informations précises sur les différentes étapes de ces voyages. Il a mis gracieusement à ma disposition des informations sur la ville d’étape, le jour de l’étape et le président qui fait étape.
De l’autre côté, le “Fichier des personnes décédées” publié par l’Insee indique, pour les personnes décédées après 1969, le jour et le lieu de naissance.
J’ai donc étudié les naissances dans les villes d’étapes, pour la période qui entoure les voyages présidentiels de la IIIe République.

Si l’on agrège l’ensemble des voyages et des présidents, on voit un bel effet :


Le jour de la visite du président, 10,5% des enfants nés dans la ville d’étape reçoivent le prénom du président (au sens : un de leur trois premiers prénoms est celui du président). L’effet est très limité dans le temps. Deux jours après la visite présidentielle, son effet sur les prénoms a disparu.

Il peut être intéressant d’examiner cet effet “président par président”. Dans le graphique suivant, j’indique par un gros point la proportion le jour de la visite.

L’effet-visite est visible pour tous les présidents sauf les Paul, pour lesquels les naissances, le jour de la visite, tombent pile sur la moyenne. Mais Doumer n’a eu le temps que d’un voyage avant son assassinat. Et Deschanel n’a fait que six voyages présidentiels (et, au cours du cinquième, tombe de train en pleine nuit).

Ces premiers résultats demandent à être vérifiés : parfois, j’ai codé l’étape “Lille-Roubaix” comme “Lille”, par exemple. Il faudrait aussi vérifier si ce qui s’observe sur les trois premiers prénoms est toujours visible si on s’intéresse juste au premier prénom. Il faudrait prendre en compte les tailles variables des populations des villes (peut-être que les effets sont dus à une seule étape, par coïncidence le jour de la Saint-Emile, dans une grosse ville, quand il était au pic de sa popularité). Il faudrait regarder si l’effet est visible dans les villes et villages immédiatement contigus à la ville visitée. Différencier en fonction du succès électoral récent du parti présidentiel dans la localité visitée… Et enfin il faut garder à l’esprit que cela ne concerne, au final, que quelques dizaines de bébés : sur une période de plus de quarante ans, seuls 70 bébés portant un prénom présidentiel sont nés le jour de la visite, dans la localité-étape alors qu’on en attendait une petite vingtaine.

11 septembre, 20 ans

in memoriamCette vue de Wooster St. a été prise depuis l’appartement 6K, du 3, Washington Sq. Village où j’ai passé quelques années passionnantes. La photo avait été prise quelques mois avant le 11 septembre 2001, c’était la vue depuis ma chambre et mon salon. Une bien belle vue, dans un très joli quartier. J’y suis repassé il y a quelques années déjà : le quartier s’est — encore plus — enrichi, Soho — la rue qu’on voit partir vers le sud — qui gardait un peu de boue et de graisse en 2000 (quand on cherchait bien) n’en a plus du tout.

La nuit, ça donnait ça : au premier plan, des tours dessinées par Ieoh Ming Pei et James Ingo Freed (de beaux espaces intérieurs, un peu moins jolies à contempler de l’extérieur), et à l’arrière plan le World Trade Center.

Il y a dix ans, j’avais écrit ceci : Mon 11 septembre. Et comme ce blog n’est que rarement consacré à l’introspection, je n’ai pas grand chose de plus à dire. J’ai quand même l’impression qu’il y a eu un avant et un après.

Quelques nouvelles (2021)

Petites choses en vrac :

  1. Pendant deux ans, j’ai écrit, pour Le Monde des chroniques sur les prénoms. De « Pauline partout, Justine nulle part » à « Sultan », ces chroniques sont rassemblées ici Le prénom des gens. En plus, une dernière chronique « bonus », « Popaul et Zézette » a été rédigée avec Maïa Mazaurette.
  2. Pourquoi les top-modèles ne sourient pas (co-écrit avec Pierre Mercklé) fait partie de la sélection du prix lycéen du livre de sciences sociales (2021-2022).
  3. L’article co-écrit avec Nicolas Todd, « Naming for Kin during World War I » (Journal of Interdisciplinary History) a été remarqué par la newsletter The Interpreter du New York Times :

La spirale de Du Bois

Dans un cours de visualisation des données (une introduction à {ggplot}), j’ai rapidement présenté quelques graphiques réalisés par le sociologue W.E.B Du Bois pour l’exposition universelle de Paris en 1900. Si vous ne connaissez pas ces graphiques et le contexte de leur création, regardez cette série d’articles : W. E. B. Du Bois’ staggering Data Visualizations are as powerful today as they were in 1900.
Une étudiante m’a demandé s’il était facile de reproduire ces graphiques avec R. On trouve des réplications de ces graphiques réalisées avec R :

Mais je n’ai pas trouvé de réplication de ce graphique :


Daniel Murray collection (Library of Congress).

Alors je me suis mis au travail, et voici le résultat :

(J’ai déposé le code sur github)