Categories

Archives

Le cumul des variables

Les filles ont en moyenne plus de mention “très bien” que les garçons. Les parisiens ont plus souvent la mention que les non-parisiens. Les candidats avec une année d’avance (nés en 1997 par exemple) ont plus de mention très bien que les autres. Les candidats avec trois prénoms ou plus ont eu aussi plus de mention très bien que ceux qui n’ont qu’un ou deux prénoms.
Est-ce que tous ces indicateurs se cumulent ?
cumuls
Les “filles” [cf note], parisiennes, en avance, qui ont 3 prénoms ou plus ont une chance sur deux d’obtenir une mention TB. Les garçons, non-parisiens, en retard (nés avant 1996), qui ont moins de trois prénoms sont une chance sur cent d’obtenir la mention “très bien”.
[Les premières sont beaucoup plus rares que les seconds]
La même chose est calculable en ajoutant encore un indicateur, la particule (“Sixtine DE MACHIN”). Mais on se retrouve avec de très petits effectifs, notamment pour les filles, nobles, parisiennes, en avance, qui ont trois prénoms ou plus et qui ont autorisé la diffusion des résultats nominatifs au bac.
Ou comment combiner un peu de “toutes choses égales par ailleurs” et de “toutes choses inégales réunies”.

Mise à jour : en combinant les années 2013 et 2014, l’on dispose de suffisamment de candidats à particule (Amicie d’HAUCOURT par exemple) pour produire le même tableau :
particules-bac
[L’indicateur est très imparfait : il faudrait sans doute comparer terme à terme les porteurs de particule et les personnes dont le nom de famille est parmi les plus répandus en France, comme MARTIN, DURAND, BERNARD, RICHARD…]

Note : les “filles” ici, sont les personnes ayant des prénoms surtout donnés à des filles (et vice-versa pour les “garçons”).

Sauter une classe, une affaire de classe (mais pas que)

5% des candidats au bac (général ou technologique) arrivent “en avance” : ils (et elles) passent le bac en 2014, mais au lieu d’être nés en 1996, ils (et elles) sont nés entre 1997 et 2000…
Ces candidats et ces candidates ont “sauté une classe” : parents et enseignants ont repéré une maîtrise des compétences scolaires suffisante pour passer de la “grande section” de maternelle au CE1, par exemple. Mais il est fort probable que tous les milieux sociaux ne valorisent pas autant l’avance et la précocité. En classe de sixième : 8 à 9 % des enfants de professions libérales ou de professeurs sont “en avance”, ce n’est le cas que de 1% environ des enfants d’ouvriers, m’écrit Wilfried Lignier.
Un graphique qui représente en abscisses la proportion de porteurs de prénoms “en avance” et en ordonnées le nombre de candidats portant ces prénoms montre de manière synthétique l’origine de classe du saut de classe.
Cliquez pour agrandir
avance
Cliquez pour agrandir

Si l’on compare le graphique de l’avance au graphique des mentions “Très bien”, on repèrera de grandes similarités. Les Augustin et les Jordan sont toujours situés aux extrèmes.
On peut aussi repérer des différences, par exemple si l’on compare directement proportion de mentions “TB” et proportion d’individus en avance, et que l’on colore les prénoms en fonction de leur genre.
avance-mention
5,4% des garçons sont “en avance”, et ce n’est le cas que de 4,5% des filles. À résultat final équivalent, 10% des Augustin et 3% des Lise auront été jugés suffisamment “intelligents/mûrs/compétents…” pour sauter une ou deux classes. “Petit génie”, “enfant prodige”, est un diagnostic qui se porte plus souvent sur les garçons (brillants) que sur les filles (scolaires). Sauter une classe : une affaire de genre.

Prénoms et mentions au bac, édition 2014

bac-2014
Cliquez pour une image plus lisible

[Avec Rue89]
La réussite scolaire varie en fonction de l’origine sociale, du niveau de diplôme des parents et du sexe des lycéens. Le choix des prénoms varie aussi avec ces mêmes critères (origine, diplôme, sexe de l’enfant). C’est pourquoi en 2014 environ 20% des Agathe, Jeanne et Gabrielle (qui ont eu plus de 8/20 au bac) ont obtenu la mention « Très bien », c’est à dire dix fois plus que les Dylan, Jordan ou Steven. L’année dernière, ces prénoms étaient déjà à la même place.
Les prénoms les plus donnés vers 1996, Manon, Thomas, Camille et Marie, se répartissent autour de la moyenne. 9% des bacheliers ont obtenu la plus haute mention, c’est le cas de 8,5% des Thomas et 10% des Camille. Les Manon passent plus souvent au rattrapage (ou sans mention) que les Marie (qui réussissent un peu mieux). Le sociologue pensera rapidement que les Marie nées vers 1996 sont plus souvent filles de cadres que les Manon.
Ce graphique donne ainsi à voir, en touchant les individus au plus profond d’eux-même (à travers le prénom), un espace social inégalitaire. Les parents des Cassandra et Cindy, en 1996, trouvaient sans doute affreux des prénoms tels que Diane ou Zoé (des prénoms de chiens ou d’arrière-grand-mère). Ceux des Félix et des Augustin, parions-le, soupiraient en entendant Killian ou Dylan : « quel mauvais goût ! ».
En filigrane, le même graphique donne à voir, à travers certains prénoms — Mohamed, Anissa, Inès — ceux qui sont probablement les (petits-)enfants de migrants du Maghreb, dont la place est ici équivalente à celle des enfants d’ouvriers et d’employés : Mickael ou Mohamed, Mehdi ou Dorian, sont ici à la même position.
Note : le graphique a été réalisé à partir des résultats nominatifs d’un peu plus de 310 000 individus ayant eu plus de 8/20 au bac 2014. Les données manquaient pour quelques départements, mais il y a fort à parier que ces données en plus ne bouleverseront pas l’analyse.
Pour en savoir plus, vous pouvez lire Sociologie des prénoms (édition La Découverte) [sur amazon, dans une librairie indépendante], et regarder les graphiques des années précédentes : 2013, 2012 ou 2011
Un mini-site interactif est disponible ici : https://coulmont.com/bac/

Une fontaine de jouvence

names-smallNames, une revue d’onomastique, vient de publier un article sur les changements de prénom en France. Un article court, qui développe une idée simple : les changements de prénom, même s’ils impliquent très très souvent des descendants de migrants, ne sont pas que des manifestation d’un rapport aux identités nationales. Très souvent, celles et ceux qui changent de prénom prennent un prénom plus jeune : Mauricette devient Léa.
Les travaux de Besnard, Desplanques et Grange ont montré la relation qui existe entre “avance temporelle” sur la mode et position sociale : cadres, professions des arts et du spectacle, bourgeoisie du Bottin mondain choisissent des prénoms en avance sur la mode plus souvent que d’autres milieux sociaux. Prendre un prénom “plus jeune” revient alors souvent à prendre un prénom en avance sur le pic de la mode (du moins par rapport au moment de la naissance).
Mais les demandeurs n’explicitent jamais cette demande de rajeunissement : elle n’apparaît ni à l’audience, ni dans les requêtes (rédigées par les avocats). Elle apparaît parfois dans certaines attestations, écrites par les amis, mais uniquement dans quelques cas (ceux des prénoms féminin en —ette, explicitement décrits comme anciens et démodés). C’est la simple agrégation statistique (sur plusieurs centaines de cas) qui fait apparaître ce fait social : changer de prénom, c’est se baigner dans la fontaine de jouvence, mais sans jamais le dire.
L’article : Baptiste Coulmont. “Changing One’s First Name in France: A Fountain of Youth ?” Names. 2014, 62(3), 137-146, DOI : 10.1179/0027773814Z.00000000080

Que faire avec ses Saints ?

Les Saints disparaissent de la scène publique. De moins en moins de bébés reçoivent, à la naissance, un prénom inscrit dans le calendrier liturgique français.
saints-chute
Mais les Saints se maintiennent à un niveau supérieur à 30% des naissances jusqu’au début des années 2000. Le Saint pourrait donc être un indicateur intéressant : il capture de l’âge, de l’origine nationale, et peut-être des orientations culturelles (il me semble clair que la liste des Saints catholiques n’est pas une liste à l’attrait universel).
La proportion d’électeurs (et d’électrices) avec un prénom de Saint (ou de Sainte) dessine donc un espace parisien bien connu. Les Saints s’exhibent dans le septième arrondissement, dans toute leur gloire. Ils sont plus discrets dans le dix-neuvième.
prenomssaints
Les Saints n’ont pas perdu toute leur efficacité : ils font encore de l’effet. Le jour de la Saint-N (quel que soit le prénom de Saint), il va naître en moyenne 1,7 fois plus de bébés portant ce prénom (avant 1970) que lors du reste de l’année. On passe à 1,35 fois plus pour les bébés nés après 1970. Les Saints perdent quand même en efficacité.

saint69

saints70
[Note : l’effet est massif, mais concentré sur une journée. Prenons le prénom “Zyxtof” : il va naître, chaque jour de l’année, en moyenne 0,27% des Zyxtof de l’année. Le jour de la Saint-Zyxtof, il naîtra 0,37% des Zyxtof de l’année. Ce qui fait que les Zyxtof ont quand meme 99,6% de chance de naître ailleurs que le jour de la Saint-Zyxtof.]
Signe de sécularisation ? de dissociation du catholicisme et de la nomination ? La conférence des évêques semble être consciente d’un retournement de civilisation : si l’on ne montre plus ses Saints, il faut amener les Saints en face des demandeurs. Sur le site “nominis.cef.fr“, il est ainsi possible d’entrer un prénom (Kaicy ? Stanley ? Jennifer ?) et de trouver le Saint associé. L’Eglise rattrape ainsi l’exubérance parentale, en proposant [principalement aux grands-parents, me dit-on] l’association à une lignée croyante a posteriori. N’ayez pas peur : vous avez tous des Saints !

Sur ce, puisque nous sommes le 13 mai, bonne fête à toutes les Fatima !

Les Noël naissent-ils à Noël ?

Les listes électorales donnent accès aux prénoms et à la date de naissance des électeurs. Il est ainsi possible d’étudier le lien entre certaines fêtes et le choix de certains prénoms. Commençons par Noël et Pascal.
J’ai retenu la date de naissance de tous les électeurs et électrices qui avaient un “Noël” parmi leurs prénoms : Noël, Jean-Noël, Marie-Noelle… sont, pour ce qui me concerne, des “Noël”.
Et ce que l’on constate, c’est que le jour de Noël est un jour de naissance particulier pour les Noël :
noel
Mais les choses évoluent au cours du siècle. 37% des “Noël” né-e-s avant 1935 sont né-e-s à Noël (c’est à dire entre le 23 décembre et le 27 décembre), ce n’est plus le cas que de 25% de celles et ceux qui sont nées entre 1935 et 1961. Et les Noël nés après 1979 que sont que 10% à être nés autour de Noël.
L’examen de la même relation avec les Pascal est plus complexe, car la date de Pâques change chaque année. Heureusement, il existe une fonction de la library timeDate, dans R, pour donner la date de Pâques. Et une partie des Pascal (et des Pascale, et des Marie-Pascale) naissent en effet à Pâques.
pascal
L’évolution est similaire à celles des Noël (mais en partant d’un niveau moins haut) : 13% “Pascal” nés avant 1950 sont nés à Pâques (plus ou moins 2 jours). Ce n’est plus le cas que de 6% des Pascal nés après 1981. Sur une période de 5 jours, s’il n’y avait pas d’attirance entre prénom et date, il aurait du naître 1,4% de Pascal ou de Noël à Pâques ou à Noël.
Il me reste maintenant à récupérer la liste des Saints-du-jour (en scrapant le site Nominis de la Conférence des Evêques) pour voir si le lien repéré ici pour deux dates est aussi repérable pour la Saint-Cunégonde et la Saint-Geoffroy.

En tout cas, ça a l’air de marcher pour la Saint-Valentin :
valentin

et pour quelques uns des prénoms les plus fréquents sur les listes électorales :
prenoms-pics80
cliquez pour voir en plus grand

Certains prénoms exhibent un saint (Michel, Marie, Jean, Daniel, Sébastien…) d’autres semblent plus également distribués sur l’année (Alain, Sarah…).

Un peu en avance

De nombreux travaux ont montré que, s’agissant des prénoms les plus fréquents, les cadres étaient “en avance” sur le reste des professions et catégories socioprofessionnelles. Des parents cadres vont avoir tendance à donner des prénoms un peu avant que des parents “professions intermédiaires” ou “employés” ne donnent les mêmes prénoms.
L’avance sur la mode peut-elle alors être prise comme indicateur indirect de position sociale ?
À partir des listes électorales parisienne, j’ai comparé, pour chaque “premier prénom”, l’année de naissance de l’électeur et l’année pendant laquelle son prénom atteint son rang le plus élevé. Ainsi un électeur prénommé Matthieu, né en 1979, sera considéré comme “en avance” de dix ans sur la mode (le prénom “Matthieu” atteint son meilleur rang national en 1989). On peut faire cela pour le million d’électeurs et d’électrices né-e-s en France et inscrit-e-s à Paris. Les prénoms très rares posent problème, car les données disponibles ne permettent pas de calculer l’année de leur “pic”. C’est le cas pour 8,3% des électeurs/trices.
La carte suivante montre, à l’échelle du bureau de vote, quelle est la proportion d’inscrits dont le prénom est au moins 3 ans “en avance” sur le pic.

avance

On remarquera aisément que les quartiers de Paris les plus “bourgeois” sont aussi ceux où les prénoms sont les plus fréquemment “en avance”. Comme si la mode pouvait naître dans un coin caché du septième arrondissement et essaimer, ensuite, dans le reste du corps social.

Les conditions maritales

Je continue ici l’examen des listes électorales. À Paris en 2014, les électrices sont 666954. Et un peu plus de 235000 sont mariées (au sens où elles disposent d’un nom marital en plus de leur nom de naissance). L’indicateur est imparfait : il est bien probable que le nom de l’époux ne soit pas toujours mentionné sur les listes électorales.
La proportion de femmes “mariées” augmente avec l’âge : les centenaires sont presques toutes mariées.
age-mariee
La géographie maritale parisienne est intéressante (on s’intéresse ici à la proportion de femmes mariées parmi les femmes) :
femmes-mariees
Les arrondissements les plus bourgeois sont ceux où les femmes mariées sont les plus fréquentes : septième, huitième, seizième. En revanche, dans les dixième, onzième et dix-huitième, les femmes n’indiquent pas souvent de nom marital. Est-ce parce qu’elles ne sont pas mariées ? Ou est-ce plutôt parce que c’est surtout dans les espaces bourgeois que l’on indique, — en toute discrétion — avec la bague de fiançailles et l’alliance, le nom de l’époux en toutes circonstances ? Ou est-ce parce qu’il y a des arrondissements de vieux et des arrondissements de jeunes et que le taux de mariage varie avec l’âge ?
L’analyse multivariée attendra, mais l’on remarquera, déjà, des comportements différents entre arrondissements : à tous âges, les femmes des arrondissements bourgeois ont plus fréquemment un nom marital sur leur carte d’électrice.
age-arrondissement-mariee

Paris en couleurs

Les listes électorales sont une source de données formidables. J’ai eu l’occasion de les explorer récemment. Première tentative de synthèse ici.
mds-couleur
click to embigen

J’ai conservé quelques variables, à l’échelle du bureau de vote : l’âge moyen, la proportion de femmes inscrites, la proportion de personnes nées à l’étranger, la proportion de “nobles”, la proportion de personnes portant plus de deux prénoms.
J’ai appliqué à cela une procédure appelée “Multi-dimensional scaling“, qui permet de rapprocher entre eux des individus ayant des caractéristiques proches. Ici, les individus sont des bureaux de vote.
J’ai retenu trois dimensions.
La première dimension rassemble entre eux les bureaux de vote selon la proportion d’inscrits nés à l’étranger [on remarque que le 16e arrondissement est un peu différent du 8e et du 7e].
La deuxième dimension capture les variations de l’âge et du sexe apparemment.
La troisième dimension est plus complexe à interpréter immédiatement (et je n’ai pas encore exploré en détail).
Sur ces trois dimensions, chaque bureau de vote a un score, que je normalise entre 0 et 255, ce qui permet d’associer une couleur “RVB” à chaque bureau. Un bureau ayant un score semblable sur les trois dimension sera plutôt gris (clair ou foncé).

La carte oppose alors un bureau de vote situé au cœur du septième arrondissement (qui est ici vert foncé) aux bureaux de votes rose/orangés des marges de Paris. Mais aussi un bureau “vert-clair”, au cœur de Paris (plus masculin et jeune) à d’autres que je vous laisse trouver. La Butte Montmartre apparaît bien bleue. L’opposition entre Ouest et Est, importante à Paris, apparaît indirectement : les couleurs les plus sombres sont à l’Ouest, comme si un nuage était posé sur l’Ouest.
[Première synthèse qu’il faudra affiner, bien sûr].

d <- dist(mydata)
fit <- cmdscale(d,eig=TRUE, k=3)
x <- fit$points[,1]
y <- fit$points[,2]
z <- fit$points[,3]
range01 <- function(x){round(255*(x-min(x))/(max(x)-min(x)))}
xs<-range01(x)
ys<-range01(y)
zs<-range01(z)
mds<-cbind(xs,ys,zs)
couleurs<-rgb(mds[,1],mds[,2],mds[,3],maxColorValue=255)
# et ensuite, il suffit d'associer chaque Bureau de vote à chaque couleurs : le BV[i] recevra couleur[i]

Pretty R at inside-R.org

La méthode a été inspirée par cet article : Delineating Europe’s Cultural Regions: Population Structure and Surname Clustering [James Cheshire, Pablo Mateos et Paul A. Longley]

Marie, Marie, Marie : d’un genre trouble, classique et classant

Quoi de plus classique que le prénom « Marie » ? Quoi de plus classant que le prénom « Marie » ? Mais que classe Marie ? La classe ou le genre ?
En s’appuyant sur les listes électorales parisiennes, il est possible d’explorer certains des usages sociaux de ce prénom, à Paris du moins.
Depuis la fin des années Trente, ce prénom (sous la forme simple « Marie » ou sous la forme composée « Marie-Prénom ») est de moins en moins choisi par les parents. Il reste plus fréquent chez les familles “à particule” : deux fois plus fréquent chez les porteuses de particules que pour l’ensemble des électrices. C’est un “classique” certe, mais un classique en crise.
marie-naissancesf1
Il n’en va pas de même en deuxième, troisième, quatrième… sixième position. Si appeler sa fille « Marie » est d’un classique un peu démodé (« c’est d’un classique… »), appeler sa fille « Domitille, Marie » l’est moins. En positions secondaires, « Marie » n’est pas en crise. Les électrices nées récemment exhibent plus souvent que les électrices nées vers 1970, sur leur carte d’identité et leur carte d’électrice, le prénom secondaire “Marie”. Et les électrices à particule, depuis le début du XXe siècle, sont de manière croissante des « Marie secondaires ». Elles le sont, en moyenne, 4 fois plus fréquemment que l’ensemble des électrices.
marie-naissancesf

Et à cette position secondaire, pour les familles à particules, « Marie » n’est pas marqueur de genre. Les hommes électeurs à particule ont aussi souvent « Marie » comme deuxième prénom que les électrices à particule. Ce n’est pas le cas de l’ensemble des électeurs hommes, qui, certes, ont assez souvent une « Marie » dans l’ensemble de leurs prénoms, mais beaucoup moins que les électrices.
marie-naissances
Féminin en première position, aristocratique en seconde position : Marie est toujours utile.