Categories

Archives

Réseaux de sociologues : l’état actuel de la sociologie française

Plusieurs articles récents viennent éclairer l’état actuel de la sociologie française. Un article de Demazière, un autre de Stéphane Beaud. Je voulais apporter ma contribution au débat. Beaud et Demazières diagnostiquent la sociologie française depuis leur position, et les méchantes langues disent que ces articles reflètent moins l’état actuel de la sociologie française que l’état actuel de Beaud et Demazière. Mon approche est différente : de par mes fonctions au CNU, et intéressé par l’objectivation statistique de la discipline, j’ai recueilli le jury de soutenance de tous les candidats à la qualification en section 19 cette année (un peu plus de 500) [ce qui vient compléter l’étude de la proximité entre sections du CNU et permettra de mieux rédiger le rapport annuel de la section].
On sait, par les travaux de Godechot notamment [un exemple ici], que les jurys de soutenance permettent d’établir d’intéressants constats. Beaud, par exemple, à la fois par sa position institutionnelle, ses intérêts scientifiques, sa connaissance du comportement des collègues… n’invite pas n’importe qui aux soutenances de ses doctorantes. Et c’est la même chose pour tous les autres.
Ces invitations et co-participations permettent de dresser une sorte de carte de la sociologie française, en utilisant un algorithme qui rapproche les personnes qui s’invitent les unes les autres aux jurys de thèse.

Cliquez pour télécharger un fichier PDF zoomable (mais pas toujours très lisible)

Sur ce graphe présentant une sélection des données [1] vous constaterez qu’au Nord se trouve une certaine sociologie économique (autour de Flichy, Cochoy, Paradeise, Vatin, Grossetti, Segrestin, Licoppe) Weber et Steiner se trouvent un peu plus au sud de ces personnes.
Au Sud-Sud commence l’empire du STAPS, avec During, qui se poursuit au Sud-Est où se trouve plusieurs représentant de la sociologie/anthropologie du corps, ou ce qu’on appelle les “STAPS” : Andrieu, Héas, Le Breton, Bodin, Duret. Dans la même zone se trouve aussi plusieurs représentants de la sociologie du travail (Bercot, Lallemand, Demazière, Gadéa) : une représentation n’utilisant que deux dimension fait se superposer des personnes ayant peu de liens.
A l’Ouest se trouve les islamisants ou les spécialistes des relations interethniques Roy, Fregosi, Khosrokhavar, Gole, Streiff-fenart.
Au coeur de la constellation vont se trouver les politistes (Spire, Deloye, Gaiti, Offerlé, Sommier) et un groupe où je retiens les noms de Beaud, Mauger, Schwartz, Lagrave Marry, Carricaburu, Fabiani, Sapiro…
Au total, les liens multiples engendrés par les jurys de soutenances ne dessinent pas un monde fragmenté, où une faction serait ostracisée par toutes les autres. Au contraire, des liens multiples relient tout le monde avec tout le monde.
Certes la méthode ici utilisée a ses nombreuses limites : il faudrait, sur une période plus longue, mettre en valeur les liens répétés, ou les invitations rendues. Pour l’instant, mes données permettent de repérer certains liens habituels (qui sont épais, sur le graphe), mais ces liens sont peu nombreux (et tendraient à faire ressortir les politistes). Rendez-vous l’année prochaine pour une étude sur deux ans.
 
Notes : [1] n’ont été retenues que les individus invitées au moins 2 fois ou ayant été directeures d’au moins une thèse.

Ah… 36 000 communes feront toujours la différence

Je viens de découvrir que l’IGN mettait maintenant gratuitement à disposition de tous le fichier shapefile GEOFLA communes, qui permet de produire des cartes de toutes les communes de France. Combinez cette carte avec des données en provenance de l’INSEE (par exemple sur la répartition des revenus), et hop :

Sur cette carte, plus c’est bleu, plus, en gros, “c’est riche”, et plus c’est rouge, plus, en gros, “c’est pauvre”. [l’indicateur est la médiane du revenu fiscal des ménages divisé par le nombre d’unité de consommation du ménage, en 2009]
Cette carte a été réalisé avec R, assez simplement : voir mon tutoriel sur la cartographie avec R pour en savoir plus, et en faire autant.

Quand s’arrêter ?

Il est conseillé d’arrêter l’enquête ethnographique quand est atteinte une certaine “saturation”.

Lorsqu’une hypothèse, par rectifications successives, atteint un degré de pertinence, vient un moment où les données empiriques diverses lui apportent une confirmation régulière. Cette régularité, est-il besoin de le dire, n’a jamais rien d’une «loi» de la nature, mais renvoie simplement à la notion approximative de «bonne résistance» dans des situations empiriques variées. Alors on peut estimer que cette hypothèse est «saturée», c’est-à-dire qu’elle se comporte suffisamment bien au cours de nombreuses mises à l’épreuve pour pouvoir être considérée comme fiable.
(p. 286 de la postface au Hobo de Nels Anderson, le fameux texte sur “l’empirisme irréductible”)

La petite recherche que je mène actuellement sur les affichage des assemblées pentecôtistes africaines en région parisienne n’est pas vraiment ethnographique… Je constitue un corpus. Mais quand saurais-je que j’ai atteint un moment de saturation. Pas de saturation des hypothèses, mais de saturation des données ?
Je me dis actuellement que c’est quand j’aurai une vision assez complète des personnes présentes sur les affiches. On peut représenter cela par des points noirs (les personnes) sur des affiches (des carrés gris). Quand une personne se trouve sur une affiche, alors un point noir relie un carré gris.
Le dessin suivant montre six mois d’observation.

Ce graphe comporte une grosse vingtaine de “composantes connexes” (de groupes non reliés entre eux). Comme le montre le graphique suivant, le nombre de composantes ne cesse d’augmenter : pour l’instant, après trois ans de recueil, je vois toujours arriver des affiches qui ne comportent aucun individu qui était déjà présent dans mon corpus. [Vous pouvez voir ce phénomène dans l’animation du réseau proposée ici].

Mais depuis début 2009, il arrive que des nouvelles affiches fassent chuter le nombre de composantes, en reliant entre elles des composantes qui n’avaient aucun lien avant.
Peut-être que la saturation sera atteinte quand une nouvelle affiche ne pourra plus que faire diminuer le nombre de composantes.

Animer un réseau

Depuis 2008, je recueille des données sur des “grandes croisades”, événements organisés par des assemblées protestantes “noires” ou “africaines”, en région parisienne. La récurrence de certaines personnes sur les affiches publicitaires liées à ces “nuits de délivrance” permet de dresser un graphe, et surtout, parce qu’il y a un événement en moyenne par semaine, d’animer ce graphe :

C’est bien joli, tout ça, mais on me dit que, pour de tels réseaux dynamiques, il faut utiliser Siena.

(Fait avec R, package “igraph”, imageMagick et un peu de post-processing ensuite…)

En dents de scie

Il y a, dans un recoin caché d’Amazon, « Author Central » qui permet de créer des “pages auteurs” sur le site de vente. Quel intérêt ?
Amazon a bien compris que certains auteurs apprécient de consulter leur “rang” parmi les ventes. J’avais, il y a quelques années, installé un “script” qui aspirait une fois par jour ce chiffre. C’est plus difficile maintenant, semble-t-il… mais Amazon met à disposition des auteurs de jolis graphiques. Voici le “rang” de mes livres depuis août :

Aux Etats-Unis, Amazon donne accès aux données “Nielsen”, qui permettent de savoir dans quel “marché” son livre se vend le mieux. C’est en lisant l’article du L.A. Times que j’ai cédé à la tentation.
Je vois ainsi que “Sociologie des prénoms [lien amzn]” se vend, plus que le manuel, et le manuel plus que “Sex-shops [lien amzn]”. Et je sais que leur destin, à tous les trois, est de se retrouver, un jour, bien au chaud au fond du classement…

Des réseaux de prénoms

Les prénoms indiquent indirectement et grossièrement l’âge (un Téo est probablement plus jeune qu’un Maurice), le sexe (un Léa est très probablement une Léa), mais aussi l’origine nationale ou régionale d’une partie des ancêtres du porteur (une Samira n’a pas les mêmes parents qu’une Nolwenn).
Parce qu’il existe des entrepreneurs identitaires, intéressés par la stabilisation de formes culturelles, l’on trouve des dictionnaires de prénoms, arabes, occitans, turcs ou bretons. Mais toutes les formes culturelles n’ont pas leurs entrepreneurs. Comment “mettre ensemble” des prénoms qui ont toutes chances d’aller ensemble ?
Un article récent de Pablo Mateos et alii, publié dans PLoS One (Ethnicity and Population Structure in Personal Naming Networks), expose une méthode, qui s’appuie sur le fait qu’aux prénoms sont associés des noms de famille : Nolwenn est plus probablement une Le Kergourvehnec’h qu’une Aattabah. Et les Aattabah ont peut-être pour prénom Samira, Yanis et Inès.
En disposant d’une très grande liste d’individus, il est possible de recomposer des relations de proximité qu’entretiennent les prénoms (et les noms de famille). On peut résumer graphiquement cela ainsi (graphique issu de l’article cité plus haut) :

Le premier graphique représente un réseau “bimodal”, les deux suivants (B et C) les deux réseaux unimodaux que l’on peut déduire du premier, si l’on se concentre sur les noms de famille (B) ou les prénoms (C). Les auteurs de l’article exposent l’intérêt de cette méthode (et certaines des opérations nécessaires pour repérer les relations significatives entre prénoms).
Disposant d’une liste nominative de plus de 400000 bacheliers, j’ai appliqué une partie des recettes, et cela donne des choses plus ou moins intéressantes.
 
Graphe (illisible)

 
Extrait 1 : au coeur de la composante principale

 
Extrait 2 : une composante “ethnique”

 
Extrait 3 : une autre composante “ethnique”

 
Cette méthode peut se comprendre comme une méthode de classification automatique : l’on part d’une liste de “Jean Dupont” et l’on aboutit à mettre en évidence des groupes de prénoms qui sont indirectement liés entre eux (par le nom de famille).
Et cette classification combine ici deux choses : d’un côté le choix des parents pour un prénom (choix qui exprime tout une série d’éléments, principalement le goût pour telle ou telle sonorité, mais aussi des attachements identitaires); de l’autre une forme héritée (on ne choisit pas son nom de famille, très souvent encore le nom de famille de son père).

Travail de députés

Avec qui travaillent nos députés ? Restent-ils entre membres du même parti ou vont-ils voir ailleurs ? Parce que le congrès de l’AFSP se termine, voici une deuxième petite excursion dans le monde politique. Pour répondre à la question précédente, on peut prendre comme indicateur d’un travail en commun la liste des “sponsors” des propositions de loi. On dira ici que travaillent ensemble des députés dont les noms apparaissent sur un même projet de loi.

Ainsi la proposition de loi 3698 visant à pénaliser les insultes à la nation a-t-elle été signée de ces noms-là :

Lionnel LUCA, Élie ABOUD, Philippe MEUNIER, Damien MESLOT, Claude BODIN, Claude GATIGNOL, Jean-Philippe MAURER, Christian MÉNARD, Jean-Pierre DECOOL, Bérengère POLETTI, Muriel MARLAND-MILITELLO, Jean-Marc ROUBAUD, Yves NICOLIN, Isabelle VASSEUR, Gérard HAMEL, Bernard DEPIERRE, Dominique DORD, Guy MALHERBE, Alain MOYNE-BRESSAND, Michel ZUMKELLER, Jean-Claude GUIBAL, Jean-Marie SERMIER, Bernard REYNÈS, Michel LEJEUNE, Jean-Claude BOUCHET, Guy LEFRAND, Michel VOISIN, Éric DIARD, Michel TERROT, André WOJCIECHOWSKI, Jacques MYARD, Édouard COURTIAL, Daniel MACH, Marc FRANCINA, Josette PONS, François-Michel GONNOT, Jean-Michel FERRAND, Jean-Pierre GORGES, Jean-Pierre SCHOSTECK, Daniel SPAGNOU, Patrice VERCHÈRE, Philippe VITEL, Jacques REMILLER, Sauveur GANDOLFI-SCHEIT, Franck GILARD, Hervé NOVELLI et Patrick LABAUNE,

On peut penser que ces gens-là partagent certaines idées.

J’ai examiné les 250 dernières propositions de loi. Dans le graphique suivant, chaque député est représenté par un petit rond, et quand 2 députés apparaissent signataires d’une même proposition, un lien gris les relie.

La répartition des points (plus les députés sont fréquemment ensemble sur des propositions de loi, plus ils sont proches) fait apparaître trois groupes. Que l’on peut faire ressortir automatiquement (avec la fonction walktrap.community du package igraph, dans R)

Dans le graphique précédent, les Oranges sont un groupe comprenant les noms suivants : Brard, Buffet, Dolez, Billard, Braouezec, Amiable, Gosnat… Les spécialistes auront reconnus.
Les Bleus ce sont les proches de Montebourg, Mamère, Emmanuelli, Le Guen, Blisko, Filipetti, Queyranne, Cambadelis.
Les Prunes, ce sont les Poniatowski, Santini, Antier, de Courson, Jégo et autres Woerth.

Le travail de signature de proposition de loi, assez souvent, relie ensemble des personnes du même parti. Je ne comprends pas trop pourquoi les Communistes ne se retrouvent pas plus proches des Socialistes/Verts. C’est peut-être du à un effet de sélection (les 250 dernières propositions de loi).

Il y a quelques individus étranges, situés “in between” plusieurs groupes. On peut calculer cette “betweeness”, cette “centralité d’intermédiarité” : dans le graphique suivant, les individus les plus “intermédiaires” sont en bleu (et j’ai mis le nom de certains à côté de leurs points) :

Et là, j’avoue ma perplexité : je ne connais pas ces députés. J’ai entendu parler de Gremetz (qui s’est fait exclure ou s’est auto-exclu, je ne sais plus trop). Braouezec est probablement un communiste réformateur (encore plus réformateur que les autres). Martine Billard est peut-être en voie de “socialistisation”. Il faudrait un/une spécialiste de la politique parlementaire pour m’en dire plus… ou alors, il faudrait vraiment travailler sur ces données réticulaires, et plus précisément sur l’ensemble des propositions de loi d’une mandature plutôt que sur les 250 dernières.

Notes : cette petite étude graphique a été réalisée avec R, packages XML et igraph.

Mise à jour : on me demande en commentaire si l’on repère des proximités entre groupes politiques plus précises. Dans le graphe ci-dessous, chaque point est colorié en fonction du groupe d’appartenance du (de la) député(e). Rose et rouge : socialistes et “gauche républicaine”, les bleus : UMP et apparentés, orange et jaune : “nouveau centre” et apparentés…, les blancs sont “sans groupe politique”…

Deuxième mise à jour : voici ce qu’une étude sur les 1000 dernières propositions de vote donne.

Il est toujours trompeur de se baser sur une représentation graphique pour interpréter… mais je pense pouvoir déceler, ici, des “sous-groupes” au sein des gros groupes politiques. Et notamment au sein des groupes “UMP” et socialistes. Le “centre” n’existe pas dans l’assemblée actuelle, mais il y a de la part de certains à droite et de certains à gauche un plus grand détachement du bloc que leur parti constitue. Ce n’est probablement pas un “centre” que ces deux sous-groupes, mais plutôt des députés proposant de nombreuses lois, ou signant de nombreuses propositions. A droite, on y trouve Yvan Lachaud, JM Morisset, A. Grosskost, C. Gatignol, mais aussi Lionnel Luca (voir tout en haut du billet), JP Decool, Morel-à-l’huissier, Roatta, JM Lefranc, etc… et à gauche, on y trouve Guigou, M. Rogemont, J. Giraud, Martine Carillon-Couvreur, François Loncle, Monique ibora, michel vergnier, JP Dulau, Philippe Plisson, françois Imbert…
Je pense que seuls des spécialistes du parlement pourront donner une autre explication à l’existence de ces sous-groupes.

Encore une mise à jour : J’ai restreint les liens, ici, aux liens entre le dépositaire de la proposition de loi (le premier nom qui apparaît sur les listes) et les personnes qu’il a réussi à mobiliser. On peut en effet penser qu’une proposition de loi a une origine individuelle. Le graphe ci-dessous ne s’intéresse qu’à celles et ceux qui 1- ont déposé plusieurs projets de loi ET 2- dont le nom est apparu sur plusieurs projets de loi. J’ai fait s’afficher les noms des député-e-s qui sont recherchés et recherchent des signatures du camp opposé.
[Dans ce graphe, ce sont des députés de gauche qui apparaissent, car les députés de droite, par l’algorithme de placement des points, déposent tellement de propositions de loi qu’ils n’échappent pas à la gravité du groupe].

Il s’établit, au fur et à mesure de la mandature, des liens réciproques : tu signes, je signe… Ainsi, Gremetz appelle 9 fois Candelier à signer, et Candelier appelle 17 fois Gremetz.

maxime gremetz    jean-jacques candelier  9      17
jean-pierre decool pierre morel-a-l-huissier  8      14
jean-jacques candelier            maxime gremetz 17       9
yannick favennec pierre morel-a-l-huissier  9       9
jean-pierre decool       andre wojciechowski  7       8
...

Certains, qui proposent beaucoup de lois, demandent beaucoup plus de signatures qu’ils ne sont appelés à signer.

Encore une mise à jour : J’ai maintenant limité les données aux liens réciproques. N’ont été gardés que les députés formant couple (c’est à dire ayant signé une proposition de loi d’un collègue qu’ils avaient sollicité pour une signature).


Sur ce dessin, les noms qui apparaissent sont ceux des “cutpoints” (ou points d’articulation), qui, s’ils étaient absents, découperaient le réseaux en composantes non reliées. Ce graphe renforce encore l’effet de groupe (de groupe politique) qui semble être le canevas sur lequel se tissent les relations de travail.

Carrières de députés

Il s’agit ici d’explorer un peu qui sont nos députés (et il s’agit de le faire aujourd’hui en accompagnement du congrès de l’AFSP). J’ai proposé à une collègue, Catherine Achin (qui avait commencé à le faire), de récupérer, sur le site de l’Assemblée nationale, des informations biographiques sur les 577 députés. Le site de l’A.N. est suffisamment bien fait pour que, avec le package XML, on puisse demander à R d’aspirer tout seul certaines informations. (Encore merci à François Guillem d’avoir mis en ligne son tutoriel et répondu à mes questions).
Professeure Achin ne s’intéressait pas seulement aux caractéristiques actuelles des députés, mais à leur carrière. Comment sont-ils arrivés où ils en sont aujourd’hui ? Car l’on devient député à un âge fort avancé : l’âge à la première élection réussie est de 46 ans en moyenne. Ils ont du faire autre chose avant, mais quoi donc ?
Plus de 95% des députés au moment de leur élection, avaient déjà été détenteurs d’un mandat local : ce sont visiblement des professionnels de la politique. Les 5% restants, qui n’indiquent pas, sur le site de l’assemblée nationale, avoir déjà été élus, sont en partie des petits cachottiers, comme Edwige Antier (élue dès 1977 en Nouvelle Calédonie, puis en 2001 à Paris). Dans les paragraphes qui suivent, je n’étudie pas le cumul des mandats, mais la présence, ou non, avant dans la carrière, d’autres mandats (qui sont peut-être terminés).

Voici les séquences de carrière les plus fréquentes
C-M-G-D (d’abord conseiller municipal, puis maire, puis conseiller général, puis député) : 58 députés
C-D : de conseiller municipal à député : 49 députés
C-M-D de conseiller municipal à maire, à député : 43 députés

Toutes les carrières ne se terminent pas par “D” (Députés), certains se lançant aussi dans des carrières locales après la députation. R, ici, signifie membre d’un conseil régional.

Ne se trouvent, dessous, que les successions de mandats les plus fréquentes, car avec les permutations possibles G-D-R-M et autres… il y a une centaine de séquences possibles

C-M-G-D	58
C-D     49
C-M-D   43
D       29
C-G-D	26
C-G-M-D	22
C-R-D	22
G-C-M-D	20
C-M-R-D	19
G-C-D	14
C-M-G-R-D 12
R-D	12
C-D-M	11
D-C-M	9
D-R	8

… etc…

Voici une autre représentation. Les députés (chaque ligne correspond à un°e député°e) sont classés en fonction de l’année de leur premier mandat électif. Nous n’étudions ici que les mandats municipaux (conseillers, ici M, et maires, ici MA). Les carrières “toutes vertes” (uniquement député) sont rares : ceux qui commencent députés acquièrent rapidement un mandat municipal. Un député, ici, finit “bleu” ou “marron” (il a, à un moment de sa carrière, un mandat municipal), et commence “jaune” ou “rouge” (conseiller municipal ou maire).

Une conclusion ? La carrière locale est toujours bien intéressante. Et les députés hostiles au cumul des mandats, quand un mandat local s’ouvre à eux, ne résistent pas souvent.

L’idée que j’avais au départ, avec toutes ces données, était de faire de l'”analyse de séquence” (pour en savoir encore plus il existe cet article par Laurent Lesnard et Thibaut de Saint Pol, Introduction aux méthodes d’appariement optimal (Optimal Matching Analysis). J’ai d’ailleurs utilisé, avec R, le package TraMineR. Mais cela n’a d’intérêt que pour un connaisseur de la vie politique française et, surtout, les données “brutes” extraites directement du site de l’A.N. nécessitent un nettoyage. Je reviendrai peut-être sur ces données un jour. [d’ici là, les voici deputes-20110831.zip]

Le Vortex

Le lien entre le prénom et la fréquence de mentions “Très Bien” au bac continue à m’intéresser, en ce qu’il révèle une structure sociale sous-jacente, et la complexité des stratégies culturelles des parents.
Mais jusqu’à présent, j’avais proposé quelques analyses “statiques”. Or le monde des prénoms évolue chaque année. Les Léa d’aujourd’hui ne sont pas celles d’avant-hier.
Se pourrait-il que les prénoms évoluent ainsi ?

On aurait une sorte de “vortex” : les prénoms naissent, à petits effectifs, dans des milieux artistes (les professions des arts et du spectacle), qui sont certes très innovants, mais qui n’idolâtrent pas les diplômes, leur préférant la libre expression du génie personnel. Ces prénoms (certains d’entre eux du moins) sont ensuite repris par des groupes plus enclins à maximiser les profits de l’investissement scolaire. Ces groupes, plus nombreux, font augmenter la fréquence du prénom et, simultanément, sa propension à capter le profit (ici la mention).
Ensuite, le prénom a atteint une certaine surface sociale, il est connu, il est peut-être identifié aux classes supérieures, mais entre dans les classes moyennes ou les professions tirant de l’école un profit secondaire aux autres capitaux dont ils peuvent disposer. La pression à la mention diminue. Les prénoms gagnent en popularité, ils sont presque les plus fréquents…
Et enfin, ces prénoms commencent à perdre en fréquence et à recevoir moins de mentions TB que la moyenne des bacheliers. Ils sont adoptés par des groupes exclus de la répartition des profits scolaires.

Ca, c’était la théorie. Est-ce que la réalité s’accorde avec la théorie ? J’ai comparé les résultats nominatifs au bac général et technologique en 2008 et 2011. Mes données portent sur plus de 600 000 individus.

cliquez pour avoir le graphique en PDF

Le mouvements des prénoms entre 2008 et 2011 est représenté par des flèches de couleur. Si les flèches vont “vers la droite” alors les prénoms ont plus de mentions TB en 2011 qu’en 2008. “Vers le haut” : les prénoms deviennent plus fréquents parmis les bacheliers (en haut du graphique sont placés les prénoms très fréquents). Les flèches violettes (Paul, Alice, Juliette, Louis, Louise, Alexis, Hugo…) représentent des prénoms relativement peu fréquents, et qui deviennent populaires dans des “groupes à mention”. Les flèches rouges (Camille, Marie, Pierre, Mathilde, Manon, Lea, Alexandre, Antoine, Maxime, Marine) des prénoms qui, tout en devenant plus populaires, perdent en mention TB, et les flèches oranges (Thomas, Pauline, Marion, Nicolas, Julie, Guillaume, Claire, Charlotte, Julien, Romain) des prénoms qui, globalement, sont sur le déclin au début des années 1990 (quand naissent les bacheliers de 2011).

La réalité est grosso-modo en accord avec la théorie. Il semble y avoir une relation qui pourrait être expliquée comme je l’ai fait. D’ailleurs, si on regarde ce qui se passe avec ces groupes de prénoms, les uns continuent à “grimper” après 1993 (année de naissance moyenne des bacheliers de 2011) et les autres à perdre des places.

Mentionnons quand même les précautions suivantes :
1- je n’ai pas de données longitudinales, mais juste 2 dates, qui concernent des populations différentes. Je ne peux donc pas suivre un prénom le long du vortex, mais juste repérer des prénoms à deux moments différents (ce qui permet de repérer la direction du courant du vortex).
2- il y a des prénoms qui ont un comportement non prévu par la théorie (les flèches bleues sur le graphique) : ces prénoms (Hélène, Cécile, Rémi, Sébastien, Laure, Olivier…) perdent des places, mais gagnent des mentions.

Le vieux qui hante

A quoi vous fait penser cette liste ?
“Marie, Pierre, Jean, Michel, Andre, Francois, Claude, Louis, Paul, Anne, Jeanne, Philippe, Isabelle, Jacques, Rene, Françoise, Bernard, Dominique…”
Peut-être à votre génération, si vous êtes nés avant 1970. Ou, pour certains prénoms, à la génération de vos grands-parents ou parents.
Je peux continuer : “Marcel, Nathalie, Alain, Sylvie, Nicole, Georges, Jacqueline, Christian, Roger”.
La plupart de ces prénoms sont aujourd’hui démodés. Et pourtant on les retrouve assez fréquemment portés par les bacheliers et bachelières de 2011. Ce sont leur seconds prénoms. [les premiers prénoms sont ici]
Un peu moins de la moitié des bacheliers de ma base (N~250000) portent des seconds ou troisièmes prénoms. Et ces prénoms, souvent, semblent arriver tout droit du passé. Les 50 premiers seconds prénoms, selon leur fréquence parmi les bacheliers et bachelières, sont caractéristiques du début du XXe siècle, avec un maximum au début des années 1940 (ils nomment 45% de la population née à ce moment là). Les 50 premiers “premiers” prénoms, eux, sont caractéristiques du début des années 1990 (ce qui est normal : les bachelières de 2011 sont nées vers 1993).

Ceci soutient l’idée selon laquelle les seconds prénoms, en France, sont aujourd’hui utilisés pour manifester un lien avec les générations précédentes. Au risque de donner à son fils le prénom de “Bernard”. Mais ces seconds prénoms mènent une existence fantômatique, ne se manifestant que dans des situations formelles comme le baccalauréat.

Mais tous les parents, et tous les grands-parents n’avaient pas les mêmes premiers prénoms — ces prénoms devenus maintenant des seconds prénoms. Il est ainsi possible de mettre en évidence un lien entre le second prénom et la réussite au baccalauréat (mesuré par la proportion de mentions TB obtenues par les bacheliers et bachelières). Ainsi plus de 10% des bachelières ayant comme second prénoms “Clementine, Laure, Anna, Elisabeth, Suzanne, Claire, Charlotte ou Anne” ont obtenu la mention TB. C’est le cas de moins de 2% des porteurs de seconds prénoms comme “Jose, Daniele, Justine, Amandine, Romain, Fernand, Jessica, Danielle ou Jennifer”.
Cette toute dernière liste me perturbe un peu : on y trouve en effet des prénoms, comme Jessica ou Jennifer (et, très proches, à moins de 3% de mention TB, des prénoms comme Kevin, Sandra, Elodie, Cindy, Karine…) qui ne sont pas des prénoms de générations éloignées, pas des prénoms de grands-parents, mais des prénoms que pourraient porter des personnes de la même génération.

Cela indique, peut-être, que les seconds prénoms sont ici ceux qui n’ont pas recueilli le consensus des parents pour être mis en première position. On les aimait, mais pas assez. Essayons de voir si les données corroborent cette idée. Qui sont, par exemple, les enfants dont le second prénom est “Kevin” ? On trouve un peu de tout, des Thomas Kévin, des Florian Kevin, une série de Jordan Kévin, des Alexis K et des Anthony K. Mais aucun Louis Kévin, aucun Paul Kévin, aucun Grégoire Kévin, aucun Etienne Kevin… pour prendre les premiers prénoms masculins ayant plus de 10% de mentions TB au bac 2011.

Le second prénom semble ainsi renforcer certains des effets que le premier prénom rendait visible. Il faudrait continuer l’étude. Les Thomas, Pauline, Camille et Marie qui obtenaient une proportion moyenne de mention TB… sont-ils différents si leurs seconds prénoms sont Kevin ou Jeremy ou Jessica (par comparaison avec des seconds prénoms qui seraient Emma, Louise ou Louis) ?
Je parie que “Thomas Prénom à mention” a plus de mentions TB que “Thomas Prénom sans mention”.

Mise à jour : c’est en effet le cas :

Camille suivi d’un prénom “à mention” (comme “Louise”) : 10,3% de mention TB
Camille suivi d’un prénom “faible mention” (comme “Melissa”): 3,3% de mention TB
Marine + prénom à mention : 5,8% de mentions TB
Marine + prénoms à faible mention : 2,9%