Categories

Archives

Paris en couleurs

Les listes électorales sont une source de données formidables. J’ai eu l’occasion de les explorer récemment. Première tentative de synthèse ici.
mds-couleur
click to embigen

J’ai conservé quelques variables, à l’échelle du bureau de vote : l’âge moyen, la proportion de femmes inscrites, la proportion de personnes nées à l’étranger, la proportion de “nobles”, la proportion de personnes portant plus de deux prénoms.
J’ai appliqué à cela une procédure appelée “Multi-dimensional scaling“, qui permet de rapprocher entre eux des individus ayant des caractéristiques proches. Ici, les individus sont des bureaux de vote.
J’ai retenu trois dimensions.
La première dimension rassemble entre eux les bureaux de vote selon la proportion d’inscrits nés à l’étranger [on remarque que le 16e arrondissement est un peu différent du 8e et du 7e].
La deuxième dimension capture les variations de l’âge et du sexe apparemment.
La troisième dimension est plus complexe à interpréter immédiatement (et je n’ai pas encore exploré en détail).
Sur ces trois dimensions, chaque bureau de vote a un score, que je normalise entre 0 et 255, ce qui permet d’associer une couleur “RVB” à chaque bureau. Un bureau ayant un score semblable sur les trois dimension sera plutôt gris (clair ou foncé).

La carte oppose alors un bureau de vote situé au cœur du septième arrondissement (qui est ici vert foncé) aux bureaux de votes rose/orangés des marges de Paris. Mais aussi un bureau “vert-clair”, au cœur de Paris (plus masculin et jeune) à d’autres que je vous laisse trouver. La Butte Montmartre apparaît bien bleue. L’opposition entre Ouest et Est, importante à Paris, apparaît indirectement : les couleurs les plus sombres sont à l’Ouest, comme si un nuage était posé sur l’Ouest.
[Première synthèse qu’il faudra affiner, bien sûr].

d <- dist(mydata)
fit <- cmdscale(d,eig=TRUE, k=3)
x <- fit$points[,1]
y <- fit$points[,2]
z <- fit$points[,3]
range01 <- function(x){round(255*(x-min(x))/(max(x)-min(x)))}
xs<-range01(x)
ys<-range01(y)
zs<-range01(z)
mds<-cbind(xs,ys,zs)
couleurs<-rgb(mds[,1],mds[,2],mds[,3],maxColorValue=255)
# et ensuite, il suffit d'associer chaque Bureau de vote à chaque couleurs : le BV[i] recevra couleur[i]

Pretty R at inside-R.org

La méthode a été inspirée par cet article : Delineating Europe’s Cultural Regions: Population Structure and Surname Clustering [James Cheshire, Pablo Mateos et Paul A. Longley]

Dis-moi, combien de prénoms as-tu ?

L’on sait peu de choses sur les seconds, troisièmes… et parfois quatrièmes, cinquièmes et sixièmes prénoms. Ce sont des prénoms invisibles dans la vie quotidienne. « Bonjour, je m’appelle Marie, Adélaïde, Charlotte, Garance, Domitille, Sixtine d’Aniel de la Rochefoucault… »
Et dans la plupart des cas, les données statistiques disponibles ne recueillent pas ces prénoms fantômes. Il en va différemment sur les listes électorales, où noms et prénoms permettent l’indexation d’une personne à une carte d’identité. Il est ainsi possible de repérer l’évolution, dans le temps, du nombre moyen de prénoms des personnes inscrites sur les listes électorales.
Sur le graphique suivant, j’ai distingué trois groupes principaux (et distingué, dans ces groupes, les hommes des femmes). Premier groupe, les électeurs nés à l’étranger. Le groupe du milieu, l’ensemble des inscrits. Le groupe du haut les électeurs ayant un nom de famille à particule [la particule semble être un indicateur intéressant].
prenoms-inscrits
Les deux groupes “électeurs nés à l’étranger” et “électeurs à particule” se distinguent fortement : les électeurs nés à l’étranger ont en moyenne moins de deux prénoms. Les électeurs à particule en moyenne plus de deux prénoms, voire trois pour les plus jeunes. Alors qu’une particule rallonge déjà le nom de famille moyen, les parents à particule choisissent des formules prénominales plus longues [ce qui complexifie le théorème de Bérurier mentionné par Marie-Anne Paveau]. Manière d’égaliser les deux côtés de la balance onomastique?

Si hommes et femmes né°e°s à l’étranger se ressemblent sous le rapport du nombre de prénom, il n’en va pas de même pour les électeurs à particule, ni, dans une moindre mesure, pour l’ensemble des inscrits : les femmes ont en moyenne moins de prénoms que les hommes. Elles sont peut-être privées d’un capital onomastique (les prénoms des ancêtres, transmis aux hommes de préférence ?)…

Une première lecture de ce graphique insisterait ensuite sur l’augmentation régulière du nombre moyen de prénoms des électeurs.

Mais attention :

  1. il est probable, très probable, que les jeunes inscrits n’ont pas les mêmes caractéristiques sociales que les inscrits plus âgés (la mal-inscription touchant tendanciellement certaines personnes plutôt que d’autres), et si le nombre de prénom varie en tendance avec l’origine sociale, alors on repère ici les conséquences graphiques d’un effet de sélection
  2. l’augmentation du nombre de prénoms est peut-être due à des changements administratifs-informatiques dans l’enregistrement des personnes qui se sont inscrites récemment : ceux qui se sont inscrits dans les années 1990 ne pouvaient, peut-être, qu’inscrire deux ou trois prénoms, alors que ceux qui se sont inscrits dans les années 1990-2000 ont eu la possibilité d’inscrire tous leurs prénoms… Cela pourrait expliquer en partie le “saut” visible pour les électeurs nés vers 1980.

From tags to niches : big “data porn”

The first issue of Porn Studies has now been published, and it contains the article written with Mazières, Trachman, Cointet and Prieur, “Deep Tags“. In it, we describe a huge dataset of titles and tags. One interesting part is where we try to define what could be a “niche”, as arising from shared tags rather than from a particular or specific desire.
You can find more information about this article and the dataset on sexualitics.org.
Deep tags: toward a quantitative analysis of online pornography (open access)

L’évaporation académique

Suite au billet sur le bilan de la qualification, un collègue m’a demandé une représentation graphique de l’évaporation académique (je l’avais fait il y a un an). On appelle “évaporation” la proportion de candidats “qualifiés” par le CNU qui, une année donnée, ne candidatent sur aucun poste ouvert au concours.
Voici donc une représentation à partir des données de 2013 :
pression-evaporation-2013
Cliquez : c’est plus lisible en PDF

Des disciplines comme le droit, l’infocom et la science politique sont “malthusiennes” : elles laissent entrer peu de monde (en cherchant à qualifier un nombre de candidates relativement équivalent aux nombres de postes, sauf la science politique, qui qualifie beaucoup car elle a peu de postes). D’autres disciplines (en bleu) qualifient presque toutes celles qui se présentent… ce qui conduit, étant donné qu’il n’y a pas autant de postes, à plus d’évaporation (des candidats qualifiés ne candidatent même pas).

Les données proviennent des fichiers mis à disposition par la DGRHA1-A.

Bilan de la qualification CNU

Cette année, la DGRH A1-1 a encore fait du bon travail, et donne accès non pas à un rapport en pdf, mais à une série de tableaux excel qu’il est beaucoup plus facile de réutiliser. Merci ! On attend encore la possibilité, en tant que chercheur, d’avoir accès à des données individuelles, mais on ne peut pas tout avoir…
Commençons notre exploration. Les sections du CNU, en 2013, ont délivré 9183 qualifications MCF à 6774 candidats. Au départ, il y avait 10876 candidats à la qualif MCF, mais 3603 dossiers ont été éliminés (dossiers incomplets, non parvenus, renoncement…). Une candidate peut déposer plusieurs dossiers. 1937 personnes ont reçu plusieurs qualifications MCF (soit 28% des qualifiés).
25% des qualifiés MCF ont moins de 30 ans, 40% ont entre 30 et 34 ans. Les femmes sont 6 mois plus âgées que les hommes en moyenne.
En section 63 (Génie électrique), les femmes représentent 16% des qualifiés. En section 07, elles représentent près de 75% des qualifiés. Mais il faudrait comparer avec le nombre de femmes au départ de la procédure. Si l’on fait cela, on peut voir que, en section 08 (Latin, Grec…) la proportion des qualifiés compte proportionnellement plus de femmes que la proportion des candidats : elles gagnent 7 points. Idem en sociologie (section 19). En revanche en section 73 (“langues régionales”) et en section 03 (“Histoire du droit”) elles perdent plus de 10 points.

Il apparaît que plus les femmes sont nombreuses dans la population des personnes qualifiées, moins elles sont désavantagées lors de la qualification.
femmes-qualif-2014

Parlons un peu de la qualification aux postes de professeur. Cette demande de qualif n’est pas faite que par des MCF, mais aussi par des chercheurs (CNRS, INRA…) ou des enseignants non-universitaires souhaitant devenir professeurs des universités. Dans la section 29 “Constituants élémentaires”, les MCF représentent 33% des candidats à la qualif PR. En sections 16 (Psycho) et 74 (STAPS) les MCF représentent plus de 80% des candidats à la qualif PR.

Les qualifications multiples ne se font pas au hasard. On trouve peu de sociologues également qualifiés en mathématiques. La DGRHA1-1 propose donc un tableau des proximités disciplinaires, avec un “classement” des couples de disciplines les plus proches :

  1. Informatique & Mécanique, génie mécanique, génie civil se partagent 51 qualifiés [DM m’indique qu’il y a là une erreur : il faut lire Informatique & Génie informatique]
  2. Science politique & Sociologie, démographie en 2e place se partagent 46 qualifiés
  3. Milieux denses et matériaux & Chimie des matériaux se partagent 39 qualifiés
    [ et d’ailleurs les “Milieux denses” partagent de nombreux qualifiés avec de nombreuses autres sections ]

Une représentation synthétique donnerait ceci :

proximites2014
Cliquez pour avoir le PDF – beaucoup plus lisible

L’on remarque que deux disciplines, l’économie et la psychologie, servent d’intermédiaires entre le groupe des “lettres et sciences humaines” et le groupe des “sciences”. Urbanisme et géographie, cette année, se retrouvent de l’autre côté.

Les non-candidats (l’évaporation) : « 3768 personnes détenant globalement 5053 qualifications délivrées cette année n’ont pas candidaté sur les postes ouverts au recrutement ».
Y a-t-il un lien entre avoir plusieurs qualifications et ne pas candidater ? Oui, et c’est un peu paradoxal : les multiqualifiés sont un peu plus souvent que les monoqualifiés des personnes qui ne candidatent à aucun poste.

Qualifiés Non Candidats Proportion
1 qualification 4813 1969 40,9
2 qualifications 1557 690 44,3
3 qualifications 306 139 45,4
4 qualifications 67 24 35,8
5 qualifications 6 3 50,0

On laissera de côté les quadruples et quintuples qualifications (les effectifs, sur une année, sont faibles).
La proportion de non-candidats a fortement augmenté entre 2007 et 2011, elle est stable depuis : En 2013, 41,82% des qualifiés n’ont candidaté à aucun poste (41,5% en 2012, 41,3% en 2011, 38,9% en 2010… et 30,9% en 2007). Et cette année, pour les qualifiés PR, 57% n’ont candidaté à aucun poste.

Les données publiées permettent une analyse de la cohorte des qualifiés de 2009. Pour ce qui concerne les qualifiés MCF, 26% n’ont candidaté à aucun poste de 2009 à 2013. 27% ont candidaté une fois (en 2009), 11% ont candidaté deux fois. … 3% ont candidaté à cinq reprises. Au total, 26% des qualifiés MCF ont été recrutés : mais si l’on s’intéresse à celles et ceux qui ont effectivement candidaté, le taux de recrutement est plus élevé.

Je m’arrêterai là aujourd’hui, mais d’autres traitements statistiques sont possibles.

Qui codirige avec qui ?

Voici une petite visualisation interactive du réseau des co-directions en sciences sociales, en France, à partir du fichier du site theses.fr :
https://coulmont.com/varia/2014/codirections/

datavizsociocodir

Cela commence par mettre Stéphane Beaud au centre, mais si vous cliquez sur un co-directeur, vous verrez apparaître son réseau égocentré.
Bonne balade.

Les mots de la sociologie

Un peu, un tout petit peu, d’analyse de texte aujourd’hui, à partir des résumés de thèse en sociologie, que l’on trouve sur theses.fr
Après avoir récupéré des informations sur environ 316 000 thèses, j’ai extrait les résumés de 6700 thèses de sociologie. Parce qu’il s’agit d’une étude exploratoire, je n’ai pas aspiré les résumés des thèses en “Sciences de la société”, qui me semblent pourtant aussi être des thèses de sociologie.
Que peut-on faire avec ces résumés ? Un traitement simple consiste à repérer quels mots sont associés de manière très fréquente à certains mots. La technique suivie a été la suivante :
1- je choisis un mot : “politique” par exemple, ou “famille”, ou “urbain”, et je sélectionne tous les résumés qui contiennent politiq* ou politic* (politique, politiques, politicien, politicienne…), ou famill* familia* (famille, familles, familial… mais pas familier).
2- je forme deux groupes : le groupe des thèses qui ont un résumé qui contient le mot clé et ses dérivations, le groupe des thèses qui ne contiennent pas ce mot clé.
3- je compare le rapport de fréquence : ainsi le mot “publique” est 3 fois plus fréquent dans les résumés de thèse qui contiennent “politique” que dans les résumés de thèses qui ne contiennent pas “politique”. Le “corps” et le “quotidien” sont, eux, deux à trois fois moins fréquents dans ces thèses.

mots-sociologies

Que faire ensuite avec cela :
1- “lemmatiser” ! c’est à dire ne travailler qu’avec les racines des mots. Mais c’est complexe (ou du moins, je n’ai pas réussi simplement à faire fonctionner TreeTagger et koRpus sur mon corpus)
2- En synchronie : générer des sujets types dans chaque groupe et ainsi des individus qui cumulent les notions les plus communes, bref « ceux qui expriment le mieux le “sens commun” du groupe… Et qui sans doute, se pensent très originaux. » ajoute un collègue facétieux. « La ville populaire comme espace local, comme territoire ouvrier, à l’écart des grands centres », « La prise en charge par les services de santé des traitements à la personnes, risques et recours », « la participation des habitants à l’action de lutte pour l’accès au droit, une politique publique », etc…
3- Repérer, de manière diachronique… à quel seuil apparaissent des mots communs et donc à quel moment, dans quel lieu, ces spécialistes peuvent échanger sur la base de mots communs.
4- Enfin, il serait possible de s’intéresser aux stratégies d’hétérodoxie : qui combine des mots de registres distincts? Qui propose une sociologie urbaine de la socialisation professionnelle, la sexualité et l’action politique, voire les organisation de la gestion de la famille ou encore le corps et la mémoire dans les crises économiques.

Tenir le haut de l’affiche : les données

La Revue française de sociologie vient de publier mon article « Tenir le haut de l’affiche: analyse structurale des prétentions au charisme ».
L’article repose sur l’analyse statistique de 200 affiches pour des événements religieux organisés par des églises évangéliques liées aux migrations africaines (églises noires, ou “d’expression africaine”, ou “africaines”), en banlieue parisienne. [résumé de l’article]

Je mets à disposition des personnes intéressées les documents sur lesquels je me suis appuyé (et même un peu plus) dans cette collection d’environ 220 affiches dont celle-ci :
Untitled
Par ailleurs l’article avait été préparé par des réflexions intermédiaires, publiées sur ce blog, où j’indique comment savoir quand s’arrêter, et où je parle des acteurs importants, des réseaux aléatoires, de la statistique, des jeux d’échelles, des cartes, et une description des affiches (et une description des dispositifs anti-affichage).
L’on trouve aussi sur hal-shs une version un peu ancienne de mes réflexions : Capitals and networks : a sociology of Paris’ black churches (en anglais plein de fautes).

Comme vous pourrez le constater donc, cet article est le fruit d’une slow science. J’ai mis un peu plus de trois ans à rassembler le matériel qui a servi de base à l’article, patiemment, semaine après semaine : aucun corpus n’existait, il a fallu le constituer. Et ensuite il a fallu passer des heures à coder les affiches pour les faire “entrer” dans une base de données. Ah comme je jalouse les sociologues-en-chambre, qui n’ont comme seul corpus que leurs états d’âme (ce qui leur permet parfois de “produire”, bon an, mal an, un livre régulièrement).
L’article lui-même a mis deux ans à émerger : il fallait, pour le rédiger, me familiariser avec les outils de la sociologie des réseaux et avec l’ethnographie du pentecôtisme des migrants africains, deux choses que je ne connaissais pas. Et ici je jalouse les belles plumes de certains sociologues-en-chambre…
Le tout a donc pris cinq ans, c’est dire combien je suis heureux de cette publication.
Cette recherche fut, pendant ces cinq années, mon “travail à côté” : mes recherches principales étaient consacrées à la socio-histoire de la pornographie d’un côté et à la sociologie des prénoms (et aux changements de prénoms) de l’autre. J’ai apprécié l’absence d’intersection entre ces trois thèmes, qui rend difficile l’importation paresseuse de schèmes explicatifs (car il faut alors travailler à l’importation). J’ai apprécié la liberté qu’offrait le caractère marginal et non financé de cette recherche, y compris dans l’emploi de mon temps : recherche non financée, qui ne faisait l’objet d’aucune obligation institutionnelle, son rythme n’était dicté que par les possibilités de découverte. S’il n’y avait rien eu à découvrir, je n’aurai rien écrit.

Retour sur une expérience renouvelée

L’année dernière, en 2012, mon billet sur les mentions au bac avait été largement relayé. J’avais ensuite tenté de réfléchir un peu à cette réception. Cette année, au début du mois d’avril 2013, suite à un billet sur les prénoms sur-représentés par série du bac, une chose similaire s’était produite. Et j’y avais réfléchi, encore.
Il y a une semaine, j’ai rapidement analysé les résultats au bac 2013 qui venaient d’être publiés… et mon billet a rapidement été relayé. Alors, forcément, il y a un truc. Soit je dispose d’attachées de presse très compétentes, soit il y a un truc.
Il y a un truc [même si les attachées de presse de La Découverte sont très compétentes.]

Qu’ai-je fait ? Après avoir récupéré les données, je mets en ligne un billet dimanche en fin d’après-midi. Dans l’idéal, je l’aurais mis en ligne samedi en fin d’après-midi, mais je n’ai pas réussi à tout récupérer à temps. Pourquoi le samedi ? Je me dis que si le billet est repris sur “twitter” au cours du week-end, des journalistes l’auront vu et pourraient en parler le lundi. J’avais fait cela le 30 mars pour le billet sur les séries du bac. J’avais en effet toutes les chances de penser que ce qui était arrivé en juillet 2012 pouvait se reproduire — peut-être à une plus petite échelle — en juillet 2013, et autant prendre les devants en permettant une meilleure réception. Eviter l’idée selon laquelle le prénom “détermine” quoi que ce soit m’était chère.
Mais ce n’est visiblement pas la peine : le billet est mis en ligne dimanche, et les journalistes ont commencé à m’appeler lundi matin.

Immédiatement après avoir mis en ligne le billet, je twitte ceci :
pas-de-surprise
Je ne twitte pas “grande découverte”, mais “pas de surprise”.
Et ce fut ma seule contribution à la diffusion.

Poursuivons par une petite objectivation : le volume des visites sur le site coulmont.com
Le volume annuel tout d’abord :
bw-coulmont-year-201307
Cela indique assez bien le caractère exceptionnel, mais renouvelé, de l’intérêt porté aux billets sur les prénoms et le bac.

Le volume journalier ensuite :
bw-coulmont-7days-201307
A la différence de juillet dernier, le traffic a surtout été concentré sur le lundi. Une analyse plus détaillée montrerait que c’est moins le billet en lui-même que le document PDF qui a été visité. Cela se perçoit un peu sur le tableau des “pages vues” et des “hits” que je reproduit ci-dessous :

visites-bac2013-coulmont
Sur ce tableau, l’on estime mal le poids de “twitter”, car ce site multiplie les URL différentes en t.co. Europe1 semble en faire de même, avec 4 URL différentes.

Je n’ai pas pu récupérer, comme je l’avais fait l’année dernière, les discussions sur “twitter”, même si j’ai essayé de les suivre. Mon sentiment est que, initialement, les “twittos” utilisent l’URL du billet ou du PDF, mais que rapidement, cette URL se perd dans l’ensemble des URL dérivées (presse en ligne).

  1. Slate : Bac 2013 et prénoms: 20% des Adèle et des Diane ont eu une mention très bien, contre 2,5% des Sabrina [deux journalistes me contactent quelques minutes après que Slate ait mis en ligne l’article, en citant explicitement Slate comme étant à l’origine de leur appel]
  2. Le Monde, blog “big browser” : PALME D’OR – Pour une mention « très bien » au bac, mieux vaut s’appeler Adèle
  3. Rue89 : Baccalauréat : mieux vaut s’appeler Ulysse qu’Enzo
  4. aufeminin.com : Baccalauréat 2013 : Quel prénom pour quelle mention ?
  5. Elle.fr Les Diane et Adèle font mieux que les Sabrina au bac 2013
  6. 20minutes : Bac 2013: 20% des Adèle et Diane ont eu une mention «très bien», contre 2,5% des Sabrina
  7. LCI.fr Bac 2013 : quand le prénom est déterminant pour la mention
  8. Direct Matin : Mention au bac. Mieux vaut mieux s’appeler Diane ou Adèle
  9. L’Express.fr Pour avoir la mention “très bien” au bac, mieux vaut s’appeler Diane que Sabrina
  10. Sud Ouest : Bac : 17% des Juliette et 2,5% des Sabrina ont obtenu une mention “très bien”
  11. Europe1 : Bac 2013 : Diane, un prénom à mention
  12. RTL : Bac : dis moi ton prénom, je te dirai ta mention
  13. La Nouvelle République : “Insolite” Bac 2013 : les prénoms qui donnent des mentions
  14. lefigaro.fr Bac 2013 : dis moi ton prénom je te dirai ta mention
  15. plurielles.fr Diane, Adèle, Quitterie : ces prénoms qui récoltent des mentions “Très Bien”
  16. youmag.com Mieux vaut s’appeler Adèle que Rudy pour avoir son bac avec mention très bien [j’aime bien ceci « Des résultats qui vont sans aucun doute relancer la polémique lancée lors de la précédente divulgation de cette étude en avril 2013 où beaucoup, comme Magic Maman s’insurgeait [sic] contre ce type d’étude qui véhicule “une fois de trop la théorie du déterminisme social” »]
  17. blog-examen : Bac 2013 : la mention dépend-elle du prénom ?
  18. psycho-enfants.fr : Bac 2013 : certains prénoms « réussissent » mieux que d’autres
  19. LaLibre.be [Belgique] : Pour réussir ses études, mieux vaut s’appeler Diane ou Adèle [On apprécie le «En France, c’est devenu un classique après chaque annonce des résultats du bac. Le sociologue Baptiste Coulmont…»]

Quelques indices signalent l’intérêt des lecteurs (comme ce “palmarès” des articles les plus partagés de lemonde.fr) :
lemonde-bac2013

Le 9 juillet (mardi), les réactions continuent.
D’abord, les journaux gratuits “20 minutes”, “Direct matin”, “Metro”… publient des petits articles sur les prénoms et le bac. Mais, et c’est intéressant, une Sabrina et un Kévin sont conviés par les blogs du Nouvel Obs pour exposer leur point de vue

  1. Le Nouvel Obs : Bac 2013 : dis-moi comment tu t’appelles, je te donnerai ta mention
  2. Je m’appelle Sabrina et mon prénom n’a rien à voir avec ma mention “Assez bien”
  3. Bac 2013 et prénoms : je m’appelle Kevin, on me prend pour un crétin mais…
  4. Et un jeune collègue, N. Docao [oui, j’ai atteint l’âge où je peux parler de “jeunes collègues”] décrypte Bac 2013 et étude sur les prénoms : les médias s’emballent, Kevin et Sabrina trinquent

Ce que dit Nicolas Docao m’intéresse : l’attention (passagère) accordée à mes travaux est liée à ceci : “s’il est un bien symbolique dont l’individu est affublé en dehors de toute procédure de choix, il s’agit bien de son prénom. (…) Qu’on l’apprécie ou qu’on le déteste, le prénom dépasse tout choix individuel” Et relier ce non-choix à un statut acquis (la réussite au bac) pose problème, cela d’autant plus que le prénom est vécu comme un résumé du soi.
Je relève aussi quelques articles publiés le 9 juillet :

  1. BFMTV Bac 2013: quel prénom a obtenu le plus de mentions Très bien?
  2. 7sur7.be [site belge] Les prénoms qui prédisposent à réussir le bac
  3. ParoleDeMamans.com [sic] Les prénoms pour réussir le bac !
  4. grazia : Faut-il s’appeler Diane ou Adèle pour avoir une mention au bac ?
  5. La Côte (Suisse) : Tu veux avoir la mention au bac? Appelle-toi Juliette ou Grégoire mais pas Brian! [avec un rappel de la théorie de l’habitus de Pierre Bourdieu]
  6. zurbains : Bac 2013 : à chaque prénom sa mention ! [mention “passable” à ceci : «Au-delà des chiffres, vous aurez compris qu’une interprétation de ces résultats n’a que peu de sens.»]

Une chose m’a surpris dans ces articles, l’idée selon laquelle “comme chaque année, le sociologue Baptiste Coulmont publie son étude sur les prénoms…”, idée qui n’apparaît pas seulement dans les articles, mais aussi sur twitter :
tous-les-ans-twitter
Dans le monde contemporain, les “traditions” s’implantent finalement très rapidement, dès la deuxième année.

La discussion s’est poursuivie aux États-Unis, certes de manière un peu moins médiatique :

  1. Le blog themonkeycage.org, tenu par un groupe éminent de politistes étasuniens, relaie mon travail, sous la plume d’Erik Voeten : Kevin Rarely Gets “Très Bien”
  2. et ce billet est à son tour repris par Kevin Drum sur le site du mensuel Mother Jones It’s Not Just Kevin Who Rarely Gets “Très Bien” : il n’y a pas que Kevin qui ait du mal à obtenir la mention “Très bien”, écrit …Kevin… Drum [Drum est un commentateur politique qui apprécie les statistiques. A-t-on cela en France ?]
  3. et, de manière indirecte sur un des blogs du Washington Post, Wonkblog [wonk est un mot qui désigne l’expert public un peu “nerd“]

Pendant ce temps, en France, quelques quotidiens publient [en version “papier”] des articles reprenant les conclusions du graphique (Le Progrès, L’Est républicain). Ces articles sont mentionnés dans le cadre de la Revue de presse du matin sur LCP. Et Ségolène Royal a du répondre à une question dessus (c’est vers la fin de la vidéo) :

Des journalistes du “20h” de France 2 ont fait un reportage (j’y suis interviewé). Le reportage a été diffusé le 11 juillet.

Ce reportage suscita plusieurs commentaires indignés sur “twitter” :
twitter-fr2-comm
Et enfin, le 12 juillet (vendredi), mon travail est rapidement abordé dans une chronique de l’émission Télématin :

Que retenir de tout ça ?

Je ne dirai presque rien ici des erreurs de lecture, je renvoie au billet de Nicolas Docao. Ces erreurs de lectures (“le prénom détermine…”) sont en lien avec ma démarche : les prénoms personnalisent, individualisent presque, une cérémonie nationale collective, la publication des résultats du bac. Camille a réussi… une Camille a réussi… les Camille ont réussi… 11% des Camille ont réussi… Le langage opère des raccourcis entre catégories (hétérogènes) et individus… et l’on a parfois affaire à de quasi-antonomases (les noms propres, ici certains prénoms, ne sont pas tout à fait utilisés comme noms communs, mais on n’en est pas très loin). Un jeu intéressant (pour mes travaux) se déploie entre fonction identificatrice du prénom (son rattachement à une personne précise, dans un contexte donné) et sa fonction connotatrice (puisque des qualités collectives, ici la réussite mesurée par le taux de mention, sont attachées aux prénoms, si bien que les porteurs du prénom, sans porter individuellement ces qualités, peuvent y être associés).
Je retiendrai ici surtout, d’abord, qu’il est possible de renouveler ce qui apparaissait comme une expérience particulière, un enchaînement d’articles et de reportages sur une réflexion sociologique autour des ressorts la réussite scolaire. Mais que ce renouvellement ne se fait pas à l’identique. L’année dernière, deux relais avaient été cruciaux : une dépêche AFP et un article en deuxième page du Monde. Cette année ce fut plus diffus et moins légitime. L’enchainement fut celui-ci :
(1)twitter–>(2)”pure players” [i.e. presse uniquement en ligne]–>(3)quotidiens gratuits–>(4)presse régionale–>(5)télévision
Pas à l’identique pour une autre raison : certaines personnes ont ressenti de la lassitude face à ce qu’ils avaient déjà lu ou entendu l’année précédente. Il n’est donc pas certain que ce travail sera autant relayé, si l’année prochaine je réitère l’analyse des résultats nominatifs au bac. De mon côté, l’infrastructure est déjà en place, automatisée, depuis le code R pour scrapper les résultats jusqu’à la production de deux “mini-sites”, celui qui indique les prénoms ayant le même profil et celui qui présente, de manière lisible, le “nuage des prénoms“… Il ne reste plus qu’à organiser une conférence de presse alors ?

La mention n’attend pas le nombre des années

Le monde scolaire valorise la précocité, c’est même peut-être un des autres noms de la classe sociale. Certains élèves “sautent”, tôt dans leur scolarité, une ou deux classes. Ce ne sont pas n’importe quels élèves, comme le montre Wilfried Lignier dans sa thèse, La petite noblesse de l’intelligence.
Sélectionnés dès l’enfance, ces élèves “en avance” (en avance sur leur classe d’âge) qui arrivent “en avance” au bac sont particulièrement adaptés aux épreuves.
Comme le montre le graphique suivant, ils obtiennent au minimum deux fois plus fréquemment la mention “Très bien” que celles et ceux qui sont “à l’heure” au bac, et 15 fois plus que celles et ceux qui ont un an de “retard”. [les données portent sur plus de 338000 élèves ayant obtenu 8 ou plus au bac en 2013]
mois-naissance
Graphique au format PDF, plus lisible

Il est intéressant de remarquer que la précocité se perçoit aussi mois après mois : celles et ceux qui sont nés en janvier 1995 et qui passent le bac en 2013 obtiennent moins de mention Très bien que ceux qui sont nés en décembre 1995. C’est probablement que les parents des enfants nés en janvier 1995 et qui souhaitaient maximiser le rendement de l’institution scolaire ont réussi à faire “sauter” un mois à leurs enfants, intégrés à la classe “1994”, et donc rendu précoces. La capacité des parents à imposer ces sauts diminue avec le nombre des mois : possible pour les “février”, difficile pour les “mai”, impossible, ou presque, pour les “décembre”.
Natura saltum non facit… mais le monde social institue des sauts.