Versatile « Marie »

À la fin du XIXe siècle, Marie était dans le “top 20″ des prénoms les plus donnés aux garçons. Souvenons-nous, par exemple de Marie Koenig, connu sous le prénom de Pierre. Ou de Marie Revillon, connu sous le nom de Michel Tony-Revillon.
Mais ce prénom cesse rapidement d’être donnés aux bébés de sexe masculin. Du moins en première position. Car « Marie » est versatile. On trouve des Louis-Marie et Jean-Marie, des Hubert-Marie et autres Pierre-Marie. Mais l’on trouve aussi des “Louis, Marie, Octave” ou des “Charles, Marie, Geoffroy”.
Et Wikipedia nous dit vaguement que « dans certaines familles catholiques, le prénom Marie sera systématiquement choisi pour premier ou deuxième prénom, même pour un garçon, en hommage à la Vierge Marie. »
Choisir « Marie » en 2e, en 3e ou en 7e prénom permettrait de signifier (en quasi-cachette, mais administrativement) une forme de catholicité. Possible, mais cela reste à creuser.
Il est possible, dès maintenant, de cartographier des « Marie-hommes », à partir des listes électorales à Paris :

homme-marie

Les arrondissements dans lesquels on trouve le plus de Marie-hommes (Marie étant ici utilisé sans “tiret” et après le premier prénom) sont les 7e et les alentours du Parc Monceau (8e et 17e). 16e, 15e, 6e suivent. Les arrondissements plus populaires, 18e, 19e, qui comptent aussi peu d’électeurs à particule, comptent peu de Marie-homme.
Difficile en l’état de valider totalement l’hypothèse de Marie comme signal catholique. Mais comme signal bourgeois, peut-être un peu plus.

Note méthodologique : la carte compare entre eux uniquement les hommes ayant plusieurs prénoms (car la probabilité d’avoir “Marie” en second prénom est nulle quand on n’a qu’un seul prénom). Une comparaison entre les porteurs du prénom Marie et tous les hommes (quel que soit le nombre de prénom) ne change pas la distribution.

Mise à jour : une version précédente de la carte était basée sur des données inexactes.

Dis-moi, combien de prénoms as-tu ?

L’on sait peu de choses sur les seconds, troisièmes… et parfois quatrièmes, cinquièmes et sixièmes prénoms. Ce sont des prénoms invisibles dans la vie quotidienne. « Bonjour, je m’appelle Marie, Adélaïde, Charlotte, Garance, Domitille, Sixtine d’Aniel de la Rochefoucault… »
Et dans la plupart des cas, les données statistiques disponibles ne recueillent pas ces prénoms fantômes. Il en va différemment sur les listes électorales, où noms et prénoms permettent l’indexation d’une personne à une carte d’identité. Il est ainsi possible de repérer l’évolution, dans le temps, du nombre moyen de prénoms des personnes inscrites sur les listes électorales.
Sur le graphique suivant, j’ai distingué trois groupes principaux (et distingué, dans ces groupes, les hommes des femmes). Premier groupe, les électeurs nés à l’étranger. Le groupe du milieu, l’ensemble des inscrits. Le groupe du haut les électeurs ayant un nom de famille à particule [la particule semble être un indicateur intéressant].
prenoms-inscrits
Les deux groupes “électeurs nés à l’étranger” et “électeurs à particule” se distinguent fortement : les électeurs nés à l’étranger ont en moyenne moins de deux prénoms. Les électeurs à particule en moyenne plus de deux prénoms, voire trois pour les plus jeunes. Alors qu’une particule rallonge déjà le nom de famille moyen, les parents à particule choisissent des formules prénominales plus longues [ce qui complexifie le théorème de Bérurier mentionné par Marie-Anne Paveau]. Manière d’égaliser les deux côtés de la balance onomastique?

Si hommes et femmes né°e°s à l’étranger se ressemblent sous le rapport du nombre de prénom, il n’en va pas de même pour les électeurs à particule, ni, dans une moindre mesure, pour l’ensemble des inscrits : les femmes ont en moyenne moins de prénoms que les hommes. Elles sont peut-être privées d’un capital onomastique (les prénoms des ancêtres, transmis aux hommes de préférence ?)…

Une première lecture de ce graphique insisterait ensuite sur l’augmentation régulière du nombre moyen de prénoms des électeurs.

Mais attention :

  1. il est probable, très probable, que les jeunes inscrits n’ont pas les mêmes caractéristiques sociales que les inscrits plus âgés (la mal-inscription touchant tendanciellement certaines personnes plutôt que d’autres), et si le nombre de prénom varie en tendance avec l’origine sociale, alors on repère ici les conséquences graphiques d’un effet de sélection
  2. l’augmentation du nombre de prénoms est peut-être due à des changements administratifs-informatiques dans l’enregistrement des personnes qui se sont inscrites récemment : ceux qui se sont inscrits dans les années 1990 ne pouvaient, peut-être, qu’inscrire deux ou trois prénoms, alors que ceux qui se sont inscrits dans les années 1990-2000 ont eu la possibilité d’inscrire tous leurs prénoms… Cela pourrait expliquer en partie le “saut” visible pour les électeurs nés vers 1980.

Le prénom à l’échelle “micro”

Certains naissent avec un seul prénom, d’autres avec une demi-douzaine. Les listes électorales indiquent, pour chaque électeur, le nombre de prénoms.
A Paris en 2014, 5 électeurs inscrits ont 8 prénoms. L’un d’entre eux (les prénoms ont été modifié) est “Philippe-René Louis André Pierre Arthur Clément Jac Léon” une autre est “Annieke Bénédicte Lia Huguette Carline Sophie Aurélie Marie”… et peut-être que la liste continue, mais que les prénoms, faute de place informatique, n’apparaissent pas. Et 59 personnes ont sept prénoms ou plus.

À l’échelle du bureau de vote, le nombre moyen de prénoms diffère. Dans les bureaux de vote des 5e, 6e, 7e, 8e et 17e (sud), les électeurs ont plus de 2,2 prénoms. Dans les bureaux de votes du 19e et du 18e (est), ils en ont moins de 1,8.

nbprenoms-bv

Mais le nombre moyen est peut-être un indicateur imparfait. Voici donc la carte montrant la proportion d’électeurs ayant 3 prénoms ou plus. C’est presque la même chose, mais les écarts sont magnifiés (certains bureaux de votes ont moins de 15% d’électeurs du type “Marie Clothilde Elizabeth Gentiane”).

prenoms3-bv

La carte reproduit bien la division entre un paris plutôt populaire, à l’Est, et un Paris plusbourgeois, à l’Ouest. L’habitude de donner plusieurs prénoms à la naissance est répandue en France, mais est peu fréquente dans de nombreux pays, et la proportion d’électeurs nés à l’étranger influe.
Mais on repère aussi probablement des pratiques administratives distinctes : il me semble probable que, dans le 9e arrondissement, tous les prénoms ne soient pas notés (ce qui expliquerait la coloration bleu-clair de cet arrondissement).

Où sont les femmes ?

Les listes électorales contiennent des informations intéressantes, à l’échelle du bureau de vote. On peut mettre en carte la proportion d’inscrits dont le nom de famille comporte une particule. On peut aussi cartographier d’autres caractéristiques, plus classiques.

Si l’on sait qu’il nait chaque année environ 105 hommes pour 100 femmes, l’on voit que cette proportion est inégalement répartie sur le territoire parisien. Au centre-nord de Paris, les inscrits sont plus souvent des hommes que des femmes. Ces dernières sont plus “rive-gauche” finalement.
femmesinscrites

D’autres informations montrent la diversité de l’espace parisien. Ainsi l’âge. L’âge de l’inscrit médian est d’environ 50 ans dans le XVIe… et d’environ 40 ans dans le XVIIIe.

agemedian
Mais la dispersion est aussi intéressante : le “centre-nord” de Paris a des inscrits moins dispersée en âge, alors que les XVIe, VIIe, XVe arrondissement ont une population d’inscrits plus diverses (sous le rapport de l’âge).

dispersionage

Et si l’on s’intéresse au lieu de naissance des électeurs ? On peut voir que les électeurs nés à l’étranger se trouvent surtout à proximité des périphériques. Le XVIe a plus d’étrangers que ce que j’aurai pensé a priori, mais ce ne sont probablement pas les mêmes étrangers que dans le XVIIIe arrondissement. Et Montmartre serait le dernier village gaulois.
paris-etranger

Le Paris des Nobles

À la fin du XIXe siècle, d’après l’annuaire du Tout Paris, voici où se trouvaient les Nobles :
175-Nobles
(image extraite de l’Atlas des parisiens)
Et en 2014 ? En m’appuyant sur les listes électorales, recueillies dans le cadre d’une enquête sur la pratique du vote par procuration, j’ai dressé la carte suivante qui montre la fréquence des nobles à l’échelle du bureau de vote :
nobles-2014
Sur les quelques 1,2 millions d’inscrits, j’ai considéré comme “Noble” le porteur ou la porteur d’une particule : d’Oulmont est noble, de Coulmont est noble, du Coulmont est noble, Galouzeau des Coulmonts sera noble… ce qui est un indicateur, ma foi, un peu faible. Mais la carte est, je trouve, parlante. Marquises et Vicomte évitent le 19e arrondissement. La particule préfère les 6e, 7e, 8e et 16e arrondissements.
La stabilité de la localisation nobiliaire entre 1889 et 2014 est frappante.

La procuration au premier tour (Paris, municipales, 2014)

Centre et périphéries à Paris : le recours à la procuration fut peu important au premier tour des municipales. Il fut plus important dans les arrondissements centraux.
procurations-paris-municipales-t1
cliquez pour agrandir

Vote à distance, distance au vote ?

Dans un article sur Metropolitiques, Lucie Bargel analyse le vote des “originaires”, celles et ceux qui sont vues comme étant “d’ici”, mais qui vivent “là bas”. Elle pointe l’existence de villages dans lesquels il y a plus d’inscrits (sur les listes électorales) que de résidents (au sens du recensement). Cet “effet Bargel”, est-il fréquent ?

La carte suivante laisse penser que oui.
france-inscrits-residents
Cliquez pour agrandir

Sur cette carte, les zones en rouge sont celles où les inscrits sur les listes électorales de la commune sont plus nombreux que les résidents de la commune. Certes il existe un lien entre la résidence et l’inscription sur les listes électorales. Mais une résidence “secondaire” dans une commune peut suffire à être inscrit sur la liste de cette commune. Et il y a aussi tous ces “jeunes” (et moins jeunes), qui, ayant quitté leurs parents, continuent, par attachement peut-être, à voter là où ils résidaient. Traditionnellement, ces personnes ont été qualifiées de “faux inscrits” [Sineau. "L'abstentionnisme parisien..." RFSP 28(1), 1978, 55-72] (on trouve aussi l’expression chez Gaxie dans Explication du vote: Un bilan des études électorales en France) en suivant l’idée que ces personnes ne devraient pas être inscrites.

Creusons un peu cette carte. Si l’on se restreint aux résidents majeurs (en enlevant les enfants, qui ne votent pas et qui donc n’ont rien à faire dans l’histoire), que remarque-t-on ?

france-inscrits-residents19
Cliquez pour agrandir

On voit donc apparaître une France de l’attachement, en rouge. Une “France du vide” (démographique) mais une France qui n’a pas été entièrement quittée par celles et ceux qui n’y habitent plus vraiment. La France des montagnes : Morvan, Alpes, Pyrénées. La France des plâteaux : le Perche, les Ardennes sont visibles sur cette carte. Et, aussi, une France de la Côte (regardez bien, à l’Ouest normand ou breton, où presque tous les villages du littoral immédiat sont roses ou rouges) pleine de résidences secondaires. Au total, plus de 17 000 communes ont plus d’inscrits sur les listes électorales que de résidents majeurs. Cela peut sans doute contribuer aux difficultés rencontrées par de nombreux villages dans la constitution de listes de candidats complètes pour les municipales.

Une représentation graphique montre une relation entre l’altitude d’une commune et le rapport entre nombre d’inscrits et nombre de résidents… là se niche peut-être le cœur de “l’effet Bargel”.
altitude-inscrits-residents
Mais une altitude (1000 mètres) ne signifie pas la même chose partout en France. Il y a des “1000 mètres” très difficiles à atteindre et des “1000 mètres” bien plus aisés à atteindre. Je propose deux régressions (linéaires et locales), sans pondération (ce qui donne à chaque village ou ville un poids égal) ou avec une pondération par le nombre d’inscrits. Dans les quatre cas, la relation est positive.

L’étude de la relation entre la variation de la population et la “surinscription” est moins univoque. Le graphique suivant met en abscisse la variation relative de la population (entre 1999 et 2011) et le ratio “inscrits sur résidents majeurs” en 2008/2009.
La régression linéaire sur les communes a un coefficient négatif : avoir perdu des habitants est corrélé à “avoir plus d’inscrits que de résidents majeurs”. Mais si on prend en compte la taille des communes (leur population en 2011), alors le coefficient est très proche de zéro : la surinscription n’est pas liée à la variation relative du nombre d’habitants.

population-evolution-inscrits
Cliquez pour agrandir

L’inscription sur les listes électorales étant liée, quand même, à une forme de résidence (ancienne, partielle, secondaire…) il est possible que les villes et villages comptant une grande proportion de résidences secondaires soient aussi des endroits avec une surinscription plus forte. C’est, globalement, le cas :
surinscription-secondaires
Cliquez pour agrandir

Plus il y a de résidences secondaires (en proportion) plus il y a d’inscrits “en trop” (par rapport aux résidents majeurs).

On peut aussi regarder s’il existe une relation entre la proportion d’actifs résidents dont le travail se trouve à l’extérieur de la commune et la surinscription. J’utilise là une variable non pas pour elle-même, mais comme indicateur de la situation communale : une zone de résidence plus que de travail. Une partie des surinscrits sont peut-être des personnes qui travaillent et vivent en dehors de la commune où ils sont inscrits.

Le graphique suivant résume les corrélations entre variables (prises deux à deux) :
corrplot

Mais alors, ce rôle de l’altitude c’est peut-être juste la combinaison du déclin de la population et d’un nombre important de résidences secondaires combiné à une situation d’emploi particulière ? Une régression linéaire multiple, sur ces quatre variables, laisse penser que non : une altitude plus élevée reste associée à une surinscription plus forte (en contrôlant les autres variables). L’effet Bargel résiste bien à la régression !

Cette surinscription a-t-elle des conséquences électorales ? Après tout, ces non-résidents ne votent peut-être pas, s’il faut, pour voter, se déplacer. Ces villages où se trouvent plus d’inscrits que de résidents, doivent connaître un taux d’abstention plus élevé que la moyenne, n’est-ce-pas ? Pas vraiment : participation et surinscription semblent corrélées.
participation-bargel

Peut-être que les “surinscriptions” ont lieu dans des zones électoralistes… et que ceux qui résident ailleurs mais y sont inscrits continuent, même à distance, à participer intensément. Il est probable (à vérifier…) que si ces résidents temporaires font l’effort de s’inscrire (ou ne font pas l’effort de s’inscrire ailleurs), alors ils font aussi, peut-être, l’effort de voter (ou d’établir une procuration). Distance au vote ou vote à distance ? ce “ou” n’est pas exclusif. Il est certainement possible d’analyser cette “surinscription” comme la surmobilisation de groupes ou de personnes, qui arrivent à voter, à élire, sans avoir à résider.

Maintenant, vous pouvez retourner lire l’article de Lucie Bargel.

Notes : Les cartes ont été réalisées avec R, package maptools, à partir d’un shapefile des communes (GeoFla) et de données de l’INSEE (pour le recensement) et du ministère de l’intérieur (pour le nombre d’inscrits sur les listes électorales). J’ai bien conscience que ces sources n’ont pas la même origine, qu’une “résidente” et qu’une “inscrite” sont les résultats de définitions différentes… mais qui ne sont pas sans lien entre elles. L’appariement des données s’est fait très rapidement mais un peu “à la louche” quand même.

Le rythme amoureux

saisons-naissances-smallLa chose est connue par de nombreux travaux, mais je voulais continuer mon exploration des rythmes sociaux.
Voici donc, à partir des données quotidiennes de l’état civil de 1968 à 2011 (naissances), disponibles sur le site de l’INSEE, une estimation du rythme des conceptions. J’ai soustrait 9 mois [9 fois 30 jours] au jour des naissances :

conception
Le mois d’août est propice aux conceptions, ainsi que les vacances (bien arrosées) de Noël.

En cliquant sur l’image, vous pourrez même distinguer le pic de la Saint-Valentin (14 février) qui donne lieu à un peu plus de naissances que la moyenne de février.

Les choses ont bien changé depuis 1968 : le pic de mai a disparu :
saisons-naissances

Parmi les choses à lire : A. Régnier Loillier, “Évolution de la saisonnalité des naissances en France de 1975 à nos jours“, Population, 2010.

La samedification des mariages

À Bordeaux, entre 1933 et maintenant, les mariages se samedifient :
samedification
Aujourd’hui, près de 80% des mariages de la semaine sont célébrés le samedi.
Mercredis et Jeudi ont cessé d’être des jours de mariage. Quant au dimanche, oublions-le (les mairies sont fermées, de toute façon).

 

Mais en revanche, les naissances se désamedifient et se dédimanchifient :
naissances-bordeaux
Les femmes sont incitées à ne pas accoucher pendant les week-ends, pour des raisons d’organisation des services (et les césariennes sont probablement programmées aussi en semaine).

 

Et les décès ?
deces-bordeaux
Les Bordelais et Bordelaises ne décèdent pas le dimanche, et de plus en plus le jeudi. Mais là, les jours sont beaucoup moins distincts que dans les deux autres graphes.
[@jbiaudet sur twitter m'indique une référence : Kentish-Barnes (N). « Mourir à l’heure du médecin » Décisions de fin de vie en réanimation, Revue française de sociologie, 2007-3 ]
 

Inspiration : Kieran Healy et son Code. et cet article d’A. Régnier-Loillier
Données : Mariages par jour, depuis 1933, Bordeaux.

Les amis de mes amis sont directeurs de thèse

Voici plusieurs graphes établis à partir des codirections de thèse en France.

math-reseau
Les couleurs indiquent les disciplines des directeurs.

Et l’on constate que les disciplines “proches” (socio / histoire) ont tendance à se retrouver à proximité sur le graphique.
socio-reseau

On peut s’intéresser de plus près aux thèses codirigées inscrites dans une discipline particulière, par exemple, au hasard, la sociologie. [cliquez pour voir en grand]
socio-reseau
Dans ce dernier graphique, les couleurs placent ensemble des individus que l’algorithme walktrap.community a placé dans la même “communauté”. Globalement “ça fait sens”. Et l’on ne remerciera jamais assez Nicky Le Feuvre de servir de “bridge” entre des mondes distincts.

Le même graphique pour l’histoire, pour la philosophie et directement en images pour l’économie
economie-reseau

&npsb;

Comment ont été construits ces graphes :

Grâce à @cynorrhodon (qui avait étudié la longueur des titres de thèse), j’ai récupéré des informations sur plus de 315 000 thèses françaises (oui, 315 000). Parmi ces thèses, un peu plus de 38 000 thèses sont effectuées ou ont été effectuées en codirection. En général, cela implique deux directeurs ou directrices de thèse, mais parfois trois ou quatre. Très très rarement plus.
Chaque thèse est associée à une discipline au moins, parfois deux ou trois.
La base ainsi constituée est relativement sale, et il a fallu la nettoyer un peu, en normalisant les noms et prénoms. Ceci fut fait de manière automatisée et rapide, sans chercher à dissocier “Jean Dupont” professeur de Mathématiques à Rennes 2 et “Jean Dupont” professeur de sociologie à Montpellier 3. J’espère qu’ils ne sont pas très nombreux à être ainsi homonymes. De même je n’ai pas cherché à indiquer que J. Dupont, professeur de mathématiques à Montpellier 3 est la même personne que Jean Dupont professeur de mathématiques à Montpellier 3.
Se posait ensuite un problème d’association, entre une personne et une discipline. Un seul exemple, Stéphane Beaud, sociologue, apparaissait 7 fois comme “sociologues”, et à une reprise comme “Sciences de la société”. Julia Kristeva apparaissait 15 fois comme “littérature française” et sinon sous de multiples autres disciplines. J’ai donc considéré que la discipline à retenir était celle qui était le plus souvent associée avec une personne.
Le réseau comprenait un grand nombre de liens et de personnes. J’ai donc réduit ce réseau aux individus qui avaient au moins N liens, et je n’ai gardé que la plus grosse composante (pour produire les graphes représentés).
Il y a un grand nombre de disciplines différentes, plus de 4 400. Parfois un intitulé généraliste est proposé : “Sociologie” ou “Chimie”, parfois, c’est un indicateur très précis, comme “Anthropologie psychanalytique et pratiques cliniques du corps” ou “Chimie organique, minerale, analytique, industrielle” ou encore (sans correction) “Ingenierie de la cognition, de linteraction, de lapprentissage et de la creation Sciences du langage”. Pour associer des couleurs aux points, je cherche donc la présence d’une chaine de caractère dans la discipline. “Socio” pour tout ce qui est sociologie, socioanthropologie… “politi” pour tout ce qui est science politique, sciences politiques.

Le graphique spécifique à la sociologie illustre certaines des difficultés : l’on repèrera que des individus identiques apparaissent sous deux formes nominales… et sont donc considérés comme deux individus différents. Je n’ai gardé que les individus ayant participé à deux codirections ou plus (les individus qui n’ont participé qu’à une seule codirection ont disparu).