Categories

Archives

Ah… 36 000 communes feront toujours la différence

Je viens de découvrir que l’IGN mettait maintenant gratuitement à disposition de tous le fichier shapefile GEOFLA communes, qui permet de produire des cartes de toutes les communes de France. Combinez cette carte avec des données en provenance de l’INSEE (par exemple sur la répartition des revenus), et hop :

Sur cette carte, plus c’est bleu, plus, en gros, “c’est riche”, et plus c’est rouge, plus, en gros, “c’est pauvre”. [l’indicateur est la médiane du revenu fiscal des ménages divisé par le nombre d’unité de consommation du ménage, en 2009]
Cette carte a été réalisé avec R, assez simplement : voir mon tutoriel sur la cartographie avec R pour en savoir plus, et en faire autant.

Quand s’arrêter ?

Il est conseillé d’arrêter l’enquête ethnographique quand est atteinte une certaine “saturation”.

Lorsqu’une hypothèse, par rectifications successives, atteint un degré de pertinence, vient un moment où les données empiriques diverses lui apportent une confirmation régulière. Cette régularité, est-il besoin de le dire, n’a jamais rien d’une «loi» de la nature, mais renvoie simplement à la notion approximative de «bonne résistance» dans des situations empiriques variées. Alors on peut estimer que cette hypothèse est «saturée», c’est-à-dire qu’elle se comporte suffisamment bien au cours de nombreuses mises à l’épreuve pour pouvoir être considérée comme fiable.
(p. 286 de la postface au Hobo de Nels Anderson, le fameux texte sur “l’empirisme irréductible”)

La petite recherche que je mène actuellement sur les affichage des assemblées pentecôtistes africaines en région parisienne n’est pas vraiment ethnographique… Je constitue un corpus. Mais quand saurais-je que j’ai atteint un moment de saturation. Pas de saturation des hypothèses, mais de saturation des données ?
Je me dis actuellement que c’est quand j’aurai une vision assez complète des personnes présentes sur les affiches. On peut représenter cela par des points noirs (les personnes) sur des affiches (des carrés gris). Quand une personne se trouve sur une affiche, alors un point noir relie un carré gris.
Le dessin suivant montre six mois d’observation.

Ce graphe comporte une grosse vingtaine de “composantes connexes” (de groupes non reliés entre eux). Comme le montre le graphique suivant, le nombre de composantes ne cesse d’augmenter : pour l’instant, après trois ans de recueil, je vois toujours arriver des affiches qui ne comportent aucun individu qui était déjà présent dans mon corpus. [Vous pouvez voir ce phénomène dans l’animation du réseau proposée ici].

Mais depuis début 2009, il arrive que des nouvelles affiches fassent chuter le nombre de composantes, en reliant entre elles des composantes qui n’avaient aucun lien avant.
Peut-être que la saturation sera atteinte quand une nouvelle affiche ne pourra plus que faire diminuer le nombre de composantes.

Animer un réseau

Depuis 2008, je recueille des données sur des “grandes croisades”, événements organisés par des assemblées protestantes “noires” ou “africaines”, en région parisienne. La récurrence de certaines personnes sur les affiches publicitaires liées à ces “nuits de délivrance” permet de dresser un graphe, et surtout, parce qu’il y a un événement en moyenne par semaine, d’animer ce graphe :

C’est bien joli, tout ça, mais on me dit que, pour de tels réseaux dynamiques, il faut utiliser Siena.

(Fait avec R, package “igraph”, imageMagick et un peu de post-processing ensuite…)

Des prénoms à la mode en Turquie ?

Par Elifsu Sabuncu (https://penserclasser.wordpress.com/) et Baptiste Coulmont
 

L’INSEE turc [Turkish Statistical Institute] met à disposition deux fichiers donnant le rang des 100 premiers prénoms, depuis 19501.

La belle longévité de certains prénoms, la mort d’autres

Certains prénoms connaissent une belle longévité : Zeynep, prénom féminin, est dans le “top 10” de 1950 à 2010; Mehmet, prénom masculin, est presque constamment le prénom le plus donné. On le voit assez facilement dans le graphique suivant, qui donne le rang de quatre prénoms masculins et quatre prénoms féminins depuis 1950 en Turquie.

Mais cette image de grande stabilité est trompeuse. On voit déjà que Elif, prénom féminin, connaît un succès grandissant, et que Hasan, prénom classique, a tendance être de moins en moins donné (relativement aux autres).

Et l’on pourrait tout aussi bien, comme nous le faisons dans le graphique suivant, insister sur les abandons. Certains prénoms, très populaires dans les années 1950, quittent le palmarès, abandonnés par les parents, qui ne nomment plus leur fille, ni leur garçon, ainsi.

Ainsi Serife disparaît du “top 100” avant 2000, et Bayram, prénom masculin, un peu après 2000. Visiblement, tous les grands-pères et toutes les grands-mères n’arrivent pas à transmettre leurs prénoms. En Turquie comme en France, les prénoms des vieux ne sont plus toujours les prénoms des plus jeunes.

Sous la stabilité, de nombreux mouvements

Les abandons (c’est à dire des prénoms qui passent sous la barre du 100e rang) sont très fréquents. Pour les filles : seuls 12 prénoms dans le “top 100” de 1950 sont encore présents dans le “top 100” en 2010 : Zeynep, Elif, Zehra, Fatma, Meryem, Ayşe, Medine, Hatice, Rabia, Emine, Melek, Esma. Les 88 autres prénoms de 2010 sont des prénoms “neufs” (ou peut-être, comme en France, d’anciens prénoms revenus au goût du jour2). Il en va de même pour les garçons, même si les changements sont un peu moins rapides (En 2010, il reste encore 29 prénoms présents en 1950, Yusuf, Mustafa, Mehmet, Ahmet, Ömer, Ali, Ibrahim, Hüseyin, Hasan, Ismail, Hamza, Abdullah, Ramazan, Murat, Mehmet-Ali, Salih, Yakup, Osman, Kadir, Bilal, Halil, Mehmet-Emin, Abdülkadir, Halil-Ibrahim, Süleyman, Musa, Adem, Mahmut et Isa).
Cette première différence entre garçons et filles est importante : en Turquie, tout comme dans les autres pays européens pour lesquels l’on dispose de données, les prénoms des filles se renouvellent plus vite que les prénoms des garçons. Les parents turcs en Turquie, aussi bien que ceux nés en Turquie mais immigrés en Allemagne ou en France, se permettent de donner aux filles des prénoms ayant une “carrière culturelle” plus courte que celle des prénoms masculins. Il y a plus d’inertie associée aux prénoms donnés aux garçons.

Si des prénoms disparaissent, il faut bien que d’autres les remplacent. Et ils ne sont pas remplacés par des prénoms aussi “classiques”. Les Turcs ont bien l’équivalent de nos “Martine” (1950-1960), “Aurélie” (1980-1990) ou “Manon” (1990-2000), prénoms générationnels qui connaissent un engouement très rapidement suivi par un désintérêt.

Le graphique montre bien le succès éphémère de quelques prénoms : Tuǧba pour les filles, ou Emrah pour les garçons ne restent pas longtemps au sommet du classement. Un prénom comme Sıla semble arriver de nulle part et disparaître aussi vite : il semble lié à la diffusion d’une série de télévision du même titre, dans lequelle une pauvre fille est recueillie par une famille riche d’Istanbul (vidéo ici)

Certains prénoms, qui se trouvent dans le “top 10″en 2009, n’ont que quelques années de popularité réelle : Ecrin (qui viendrait de l’arabe, et qui se prononce “edjrine”), Irem, Merve, Yaǧmur, Eylül et Nisanur pour les filles, Yiǧit ou Arda pour les garçons.

De la mode, donc !

Le cas turc est intéressant. L’étude des variations temporelles de la popularité des prénoms s’est appuyée sur les exemples de pays comme les Etats-Unis, la France, les Pays-Bas… pour lesquels un état civil ancien permettait de repérer des phénomènes de mode. Rares sont les travaux à avoir essayé d’observer les mêmes phénomènes dans des pays, disons “extérieurs au G7”.
Dans les études portant sur les conséquences de la migration sur le choix des prénoms, il est parfois écrit que les prénoms des immigrés et de leurs enfants sont “traditionnels”, comme si, dans “leurs pays”, il n’y avait que “tradition”.

This corresponds to the results of Lieberson (2000), and Sue and Telles (2007), who have reported a higher use of more traditional (ethnic) first names for boys than for girls in Mexican-American families. This gender difference in naming is not easy to interpret. One possibility is that parents want traditions to be continued primarily by their male offspring.
Becker, B. [2009], Immigrants’ emotional identification with the host society. Ethnicities, 9[2], p.200-225.

Oftentimes, ethnic groups voluntarily give up their traditional first names and adopt names of the dominant ethnic group without state in- tervention.
Gerhards, J. & Hans, S. [2009], From Hasan to Herbert: Name-Giving Patterns of Immigrant Parents between acculturation and Ethnic Maintenance. American Journal of Sociology, 114[4], p.1102-1128.

De ce fait, il est implicitement sous-entendu que les pays à majorité musulmane (ou, plus largement, les pays d’émigration) auraient des “prénoms traditionnels” (Ali, Mohamed, Fatima…), qui, en plus, seraient hérités de (grand-)père à (petit-)fils. Ces pays ne connaîtraient pas la mode… et le fait de porter des prénoms ressemblant à des prénoms “musulmans” serait une preuve d’attachement à des “traditions”.

De rares travaux ont montré que ce n’était pas le cas, la mode n’est pas une spécificité occidentale. Et l’on peut, en cherchant bien, disposer maintenant de données statistiques au niveau national, qui le prouvent.

Peut-on repérer autre chose ?

Accessoirement, les données turques permettent d’autres interprétations. Par exemple, le succès récent de Muhammed (que l’on voit dans le graphique précédent), semble remplacer Mehmet. Si l’on fait l’hypothèse que Mehmet, forme turquisée de “Mohamed”, pouvait être lié au nationalisme des parents (préférant des prénoms “turcs” pour leurs enfants), alors on peut supposer que Muhammed est donné par des parents plus islamistes que nationalistes (ou trouvant désuet le recours à une forme éloignée de l’arabe).

Un premier classement des prénoms origine etymologique (“arabe”, “turc”, “persan”…) donne des résultats incertains (ci-dessous, pour les prénoms des filles). Les prénoms “turcs” (en bleu) ont tendance à être de moins en moins nombreux dans le “top 100”, alors que les prénoms “arabes” se maintiennent. Apparaît très visible, en revanche, l’augmentation du nombre de prénoms “difficiles à classer”, prénoms neufs ou sans ancrage.

Sources et bibliographie
Données turques :
http://tuik.gov.tr/PreIstatistikTablo.do?istab_id=1331 #filles
et
http://tuik.gov.tr/PreIstatistikTablo.do?istab_id=1332 #garçons

Aslan, S. [2009], Incoherent State: The Controversy over Kurdish Naming. European Journal of Turkish Studies, [10]. Available at: http://ejts.revues.org/index4142.html [Consulté août 16, 2011].
Bulliet, R.W. [1978], First Names and Political Change in Modern Turkey. International Journal of Middle East Studies, 9[4], p.489-495.
Borrmans, M. [1968], Prénoms arabes et changement social en Tunisie. IBLA, revue de l’Institut des Belles Lettres Arabes, 121, p.97-112.

Notes
1 Ces données ne représentent pas directement les naissances, mais les personnes nées une année donnée, et encore vivantes vers 2009. Nous allons faire ici comme si ces données étaient assez fidèles aux naissances.
2 Mais pour le savoir, il faudrait disposer de données remontant aux siècles précédents. Les spécialistes d’histoire turque nous renseigneront en commentaire.

Des réseaux de prénoms

Les prénoms indiquent indirectement et grossièrement l’âge (un Téo est probablement plus jeune qu’un Maurice), le sexe (un Léa est très probablement une Léa), mais aussi l’origine nationale ou régionale d’une partie des ancêtres du porteur (une Samira n’a pas les mêmes parents qu’une Nolwenn).
Parce qu’il existe des entrepreneurs identitaires, intéressés par la stabilisation de formes culturelles, l’on trouve des dictionnaires de prénoms, arabes, occitans, turcs ou bretons. Mais toutes les formes culturelles n’ont pas leurs entrepreneurs. Comment “mettre ensemble” des prénoms qui ont toutes chances d’aller ensemble ?
Un article récent de Pablo Mateos et alii, publié dans PLoS One (Ethnicity and Population Structure in Personal Naming Networks), expose une méthode, qui s’appuie sur le fait qu’aux prénoms sont associés des noms de famille : Nolwenn est plus probablement une Le Kergourvehnec’h qu’une Aattabah. Et les Aattabah ont peut-être pour prénom Samira, Yanis et Inès.
En disposant d’une très grande liste d’individus, il est possible de recomposer des relations de proximité qu’entretiennent les prénoms (et les noms de famille). On peut résumer graphiquement cela ainsi (graphique issu de l’article cité plus haut) :

Le premier graphique représente un réseau “bimodal”, les deux suivants (B et C) les deux réseaux unimodaux que l’on peut déduire du premier, si l’on se concentre sur les noms de famille (B) ou les prénoms (C). Les auteurs de l’article exposent l’intérêt de cette méthode (et certaines des opérations nécessaires pour repérer les relations significatives entre prénoms).
Disposant d’une liste nominative de plus de 400000 bacheliers, j’ai appliqué une partie des recettes, et cela donne des choses plus ou moins intéressantes.
 
Graphe (illisible)

 
Extrait 1 : au coeur de la composante principale

 
Extrait 2 : une composante “ethnique”

 
Extrait 3 : une autre composante “ethnique”

 
Cette méthode peut se comprendre comme une méthode de classification automatique : l’on part d’une liste de “Jean Dupont” et l’on aboutit à mettre en évidence des groupes de prénoms qui sont indirectement liés entre eux (par le nom de famille).
Et cette classification combine ici deux choses : d’un côté le choix des parents pour un prénom (choix qui exprime tout une série d’éléments, principalement le goût pour telle ou telle sonorité, mais aussi des attachements identitaires); de l’autre une forme héritée (on ne choisit pas son nom de famille, très souvent encore le nom de famille de son père).

Travail de députés

Avec qui travaillent nos députés ? Restent-ils entre membres du même parti ou vont-ils voir ailleurs ? Parce que le congrès de l’AFSP se termine, voici une deuxième petite excursion dans le monde politique. Pour répondre à la question précédente, on peut prendre comme indicateur d’un travail en commun la liste des “sponsors” des propositions de loi. On dira ici que travaillent ensemble des députés dont les noms apparaissent sur un même projet de loi.

Ainsi la proposition de loi 3698 visant à pénaliser les insultes à la nation a-t-elle été signée de ces noms-là :

Lionnel LUCA, Élie ABOUD, Philippe MEUNIER, Damien MESLOT, Claude BODIN, Claude GATIGNOL, Jean-Philippe MAURER, Christian MÉNARD, Jean-Pierre DECOOL, Bérengère POLETTI, Muriel MARLAND-MILITELLO, Jean-Marc ROUBAUD, Yves NICOLIN, Isabelle VASSEUR, Gérard HAMEL, Bernard DEPIERRE, Dominique DORD, Guy MALHERBE, Alain MOYNE-BRESSAND, Michel ZUMKELLER, Jean-Claude GUIBAL, Jean-Marie SERMIER, Bernard REYNÈS, Michel LEJEUNE, Jean-Claude BOUCHET, Guy LEFRAND, Michel VOISIN, Éric DIARD, Michel TERROT, André WOJCIECHOWSKI, Jacques MYARD, Édouard COURTIAL, Daniel MACH, Marc FRANCINA, Josette PONS, François-Michel GONNOT, Jean-Michel FERRAND, Jean-Pierre GORGES, Jean-Pierre SCHOSTECK, Daniel SPAGNOU, Patrice VERCHÈRE, Philippe VITEL, Jacques REMILLER, Sauveur GANDOLFI-SCHEIT, Franck GILARD, Hervé NOVELLI et Patrick LABAUNE,

On peut penser que ces gens-là partagent certaines idées.

J’ai examiné les 250 dernières propositions de loi. Dans le graphique suivant, chaque député est représenté par un petit rond, et quand 2 députés apparaissent signataires d’une même proposition, un lien gris les relie.

La répartition des points (plus les députés sont fréquemment ensemble sur des propositions de loi, plus ils sont proches) fait apparaître trois groupes. Que l’on peut faire ressortir automatiquement (avec la fonction walktrap.community du package igraph, dans R)

Dans le graphique précédent, les Oranges sont un groupe comprenant les noms suivants : Brard, Buffet, Dolez, Billard, Braouezec, Amiable, Gosnat… Les spécialistes auront reconnus.
Les Bleus ce sont les proches de Montebourg, Mamère, Emmanuelli, Le Guen, Blisko, Filipetti, Queyranne, Cambadelis.
Les Prunes, ce sont les Poniatowski, Santini, Antier, de Courson, Jégo et autres Woerth.

Le travail de signature de proposition de loi, assez souvent, relie ensemble des personnes du même parti. Je ne comprends pas trop pourquoi les Communistes ne se retrouvent pas plus proches des Socialistes/Verts. C’est peut-être du à un effet de sélection (les 250 dernières propositions de loi).

Il y a quelques individus étranges, situés “in between” plusieurs groupes. On peut calculer cette “betweeness”, cette “centralité d’intermédiarité” : dans le graphique suivant, les individus les plus “intermédiaires” sont en bleu (et j’ai mis le nom de certains à côté de leurs points) :

Et là, j’avoue ma perplexité : je ne connais pas ces députés. J’ai entendu parler de Gremetz (qui s’est fait exclure ou s’est auto-exclu, je ne sais plus trop). Braouezec est probablement un communiste réformateur (encore plus réformateur que les autres). Martine Billard est peut-être en voie de “socialistisation”. Il faudrait un/une spécialiste de la politique parlementaire pour m’en dire plus… ou alors, il faudrait vraiment travailler sur ces données réticulaires, et plus précisément sur l’ensemble des propositions de loi d’une mandature plutôt que sur les 250 dernières.

Notes : cette petite étude graphique a été réalisée avec R, packages XML et igraph.

Mise à jour : on me demande en commentaire si l’on repère des proximités entre groupes politiques plus précises. Dans le graphe ci-dessous, chaque point est colorié en fonction du groupe d’appartenance du (de la) député(e). Rose et rouge : socialistes et “gauche républicaine”, les bleus : UMP et apparentés, orange et jaune : “nouveau centre” et apparentés…, les blancs sont “sans groupe politique”…

Deuxième mise à jour : voici ce qu’une étude sur les 1000 dernières propositions de vote donne.

Il est toujours trompeur de se baser sur une représentation graphique pour interpréter… mais je pense pouvoir déceler, ici, des “sous-groupes” au sein des gros groupes politiques. Et notamment au sein des groupes “UMP” et socialistes. Le “centre” n’existe pas dans l’assemblée actuelle, mais il y a de la part de certains à droite et de certains à gauche un plus grand détachement du bloc que leur parti constitue. Ce n’est probablement pas un “centre” que ces deux sous-groupes, mais plutôt des députés proposant de nombreuses lois, ou signant de nombreuses propositions. A droite, on y trouve Yvan Lachaud, JM Morisset, A. Grosskost, C. Gatignol, mais aussi Lionnel Luca (voir tout en haut du billet), JP Decool, Morel-à-l’huissier, Roatta, JM Lefranc, etc… et à gauche, on y trouve Guigou, M. Rogemont, J. Giraud, Martine Carillon-Couvreur, François Loncle, Monique ibora, michel vergnier, JP Dulau, Philippe Plisson, françois Imbert…
Je pense que seuls des spécialistes du parlement pourront donner une autre explication à l’existence de ces sous-groupes.

Encore une mise à jour : J’ai restreint les liens, ici, aux liens entre le dépositaire de la proposition de loi (le premier nom qui apparaît sur les listes) et les personnes qu’il a réussi à mobiliser. On peut en effet penser qu’une proposition de loi a une origine individuelle. Le graphe ci-dessous ne s’intéresse qu’à celles et ceux qui 1- ont déposé plusieurs projets de loi ET 2- dont le nom est apparu sur plusieurs projets de loi. J’ai fait s’afficher les noms des député-e-s qui sont recherchés et recherchent des signatures du camp opposé.
[Dans ce graphe, ce sont des députés de gauche qui apparaissent, car les députés de droite, par l’algorithme de placement des points, déposent tellement de propositions de loi qu’ils n’échappent pas à la gravité du groupe].

Il s’établit, au fur et à mesure de la mandature, des liens réciproques : tu signes, je signe… Ainsi, Gremetz appelle 9 fois Candelier à signer, et Candelier appelle 17 fois Gremetz.

maxime gremetz    jean-jacques candelier  9      17
jean-pierre decool pierre morel-a-l-huissier  8      14
jean-jacques candelier            maxime gremetz 17       9
yannick favennec pierre morel-a-l-huissier  9       9
jean-pierre decool       andre wojciechowski  7       8
...

Certains, qui proposent beaucoup de lois, demandent beaucoup plus de signatures qu’ils ne sont appelés à signer.

Encore une mise à jour : J’ai maintenant limité les données aux liens réciproques. N’ont été gardés que les députés formant couple (c’est à dire ayant signé une proposition de loi d’un collègue qu’ils avaient sollicité pour une signature).


Sur ce dessin, les noms qui apparaissent sont ceux des “cutpoints” (ou points d’articulation), qui, s’ils étaient absents, découperaient le réseaux en composantes non reliées. Ce graphe renforce encore l’effet de groupe (de groupe politique) qui semble être le canevas sur lequel se tissent les relations de travail.

Carrières de députés

Il s’agit ici d’explorer un peu qui sont nos députés (et il s’agit de le faire aujourd’hui en accompagnement du congrès de l’AFSP). J’ai proposé à une collègue, Catherine Achin (qui avait commencé à le faire), de récupérer, sur le site de l’Assemblée nationale, des informations biographiques sur les 577 députés. Le site de l’A.N. est suffisamment bien fait pour que, avec le package XML, on puisse demander à R d’aspirer tout seul certaines informations. (Encore merci à François Guillem d’avoir mis en ligne son tutoriel et répondu à mes questions).
Professeure Achin ne s’intéressait pas seulement aux caractéristiques actuelles des députés, mais à leur carrière. Comment sont-ils arrivés où ils en sont aujourd’hui ? Car l’on devient député à un âge fort avancé : l’âge à la première élection réussie est de 46 ans en moyenne. Ils ont du faire autre chose avant, mais quoi donc ?
Plus de 95% des députés au moment de leur élection, avaient déjà été détenteurs d’un mandat local : ce sont visiblement des professionnels de la politique. Les 5% restants, qui n’indiquent pas, sur le site de l’assemblée nationale, avoir déjà été élus, sont en partie des petits cachottiers, comme Edwige Antier (élue dès 1977 en Nouvelle Calédonie, puis en 2001 à Paris). Dans les paragraphes qui suivent, je n’étudie pas le cumul des mandats, mais la présence, ou non, avant dans la carrière, d’autres mandats (qui sont peut-être terminés).

Voici les séquences de carrière les plus fréquentes
C-M-G-D (d’abord conseiller municipal, puis maire, puis conseiller général, puis député) : 58 députés
C-D : de conseiller municipal à député : 49 députés
C-M-D de conseiller municipal à maire, à député : 43 députés

Toutes les carrières ne se terminent pas par “D” (Députés), certains se lançant aussi dans des carrières locales après la députation. R, ici, signifie membre d’un conseil régional.

Ne se trouvent, dessous, que les successions de mandats les plus fréquentes, car avec les permutations possibles G-D-R-M et autres… il y a une centaine de séquences possibles

C-M-G-D	58
C-D     49
C-M-D   43
D       29
C-G-D	26
C-G-M-D	22
C-R-D	22
G-C-M-D	20
C-M-R-D	19
G-C-D	14
C-M-G-R-D 12
R-D	12
C-D-M	11
D-C-M	9
D-R	8

… etc…

Voici une autre représentation. Les députés (chaque ligne correspond à un°e député°e) sont classés en fonction de l’année de leur premier mandat électif. Nous n’étudions ici que les mandats municipaux (conseillers, ici M, et maires, ici MA). Les carrières “toutes vertes” (uniquement député) sont rares : ceux qui commencent députés acquièrent rapidement un mandat municipal. Un député, ici, finit “bleu” ou “marron” (il a, à un moment de sa carrière, un mandat municipal), et commence “jaune” ou “rouge” (conseiller municipal ou maire).

Une conclusion ? La carrière locale est toujours bien intéressante. Et les députés hostiles au cumul des mandats, quand un mandat local s’ouvre à eux, ne résistent pas souvent.

L’idée que j’avais au départ, avec toutes ces données, était de faire de l'”analyse de séquence” (pour en savoir encore plus il existe cet article par Laurent Lesnard et Thibaut de Saint Pol, Introduction aux méthodes d’appariement optimal (Optimal Matching Analysis). J’ai d’ailleurs utilisé, avec R, le package TraMineR. Mais cela n’a d’intérêt que pour un connaisseur de la vie politique française et, surtout, les données “brutes” extraites directement du site de l’A.N. nécessitent un nettoyage. Je reviendrai peut-être sur ces données un jour. [d’ici là, les voici deputes-20110831.zip]

Le Vortex

Le lien entre le prénom et la fréquence de mentions “Très Bien” au bac continue à m’intéresser, en ce qu’il révèle une structure sociale sous-jacente, et la complexité des stratégies culturelles des parents.
Mais jusqu’à présent, j’avais proposé quelques analyses “statiques”. Or le monde des prénoms évolue chaque année. Les Léa d’aujourd’hui ne sont pas celles d’avant-hier.
Se pourrait-il que les prénoms évoluent ainsi ?

On aurait une sorte de “vortex” : les prénoms naissent, à petits effectifs, dans des milieux artistes (les professions des arts et du spectacle), qui sont certes très innovants, mais qui n’idolâtrent pas les diplômes, leur préférant la libre expression du génie personnel. Ces prénoms (certains d’entre eux du moins) sont ensuite repris par des groupes plus enclins à maximiser les profits de l’investissement scolaire. Ces groupes, plus nombreux, font augmenter la fréquence du prénom et, simultanément, sa propension à capter le profit (ici la mention).
Ensuite, le prénom a atteint une certaine surface sociale, il est connu, il est peut-être identifié aux classes supérieures, mais entre dans les classes moyennes ou les professions tirant de l’école un profit secondaire aux autres capitaux dont ils peuvent disposer. La pression à la mention diminue. Les prénoms gagnent en popularité, ils sont presque les plus fréquents…
Et enfin, ces prénoms commencent à perdre en fréquence et à recevoir moins de mentions TB que la moyenne des bacheliers. Ils sont adoptés par des groupes exclus de la répartition des profits scolaires.

Ca, c’était la théorie. Est-ce que la réalité s’accorde avec la théorie ? J’ai comparé les résultats nominatifs au bac général et technologique en 2008 et 2011. Mes données portent sur plus de 600 000 individus.

cliquez pour avoir le graphique en PDF

Le mouvements des prénoms entre 2008 et 2011 est représenté par des flèches de couleur. Si les flèches vont “vers la droite” alors les prénoms ont plus de mentions TB en 2011 qu’en 2008. “Vers le haut” : les prénoms deviennent plus fréquents parmis les bacheliers (en haut du graphique sont placés les prénoms très fréquents). Les flèches violettes (Paul, Alice, Juliette, Louis, Louise, Alexis, Hugo…) représentent des prénoms relativement peu fréquents, et qui deviennent populaires dans des “groupes à mention”. Les flèches rouges (Camille, Marie, Pierre, Mathilde, Manon, Lea, Alexandre, Antoine, Maxime, Marine) des prénoms qui, tout en devenant plus populaires, perdent en mention TB, et les flèches oranges (Thomas, Pauline, Marion, Nicolas, Julie, Guillaume, Claire, Charlotte, Julien, Romain) des prénoms qui, globalement, sont sur le déclin au début des années 1990 (quand naissent les bacheliers de 2011).

La réalité est grosso-modo en accord avec la théorie. Il semble y avoir une relation qui pourrait être expliquée comme je l’ai fait. D’ailleurs, si on regarde ce qui se passe avec ces groupes de prénoms, les uns continuent à “grimper” après 1993 (année de naissance moyenne des bacheliers de 2011) et les autres à perdre des places.

Mentionnons quand même les précautions suivantes :
1- je n’ai pas de données longitudinales, mais juste 2 dates, qui concernent des populations différentes. Je ne peux donc pas suivre un prénom le long du vortex, mais juste repérer des prénoms à deux moments différents (ce qui permet de repérer la direction du courant du vortex).
2- il y a des prénoms qui ont un comportement non prévu par la théorie (les flèches bleues sur le graphique) : ces prénoms (Hélène, Cécile, Rémi, Sébastien, Laure, Olivier…) perdent des places, mais gagnent des mentions.

L’unité nationale

A l’échelle nationale, certains prénoms apparaissent comme des prénoms “mixtes” ou “épicènes”, portés à la fois par des filles et par des garçons. Mais c’est le résultat d’un effet de composition, d’une moyenne qui cache la dispersion. Le passage à l’échelle départementale vient modifier, parfois, les conclusions dressées à l’échelle nationale.
Ainsi “Dominique” apparaît aujourd’hui comme un prénom masculin au Nord (dans un croissant reliant Bordeaux à Strasbourg en passant par Paris) et féminin au Sud, de Toulouse à Monaco). “Claude”, tout en restant un prénom presque toujours masculin, est plus féminisé, disons, autour de Lyon et de la Bourgogne (les pointes du triangle seraient Clermont, Grenoble et Dijon).
Sur ces deux cartes, Paris a des Claude et des Dominique un peu plus féminines que les départements alentours.

D’autres exemples viennent soutenir l’idée que les Parisiennes et Parisiens donnent à leurs filles des prénoms qui sont donnés à des garçons au delà du périphérique. Deux exemples : Morgan et Noa. Morgan est toujours très masculin, mais moins à Paris. Noa est une fille à Paris (et plutôt un garçon en dehors).

Mon exemple préféré, j’en ai déjà parlé, concerne le prénom “Yael”.
L’on constate sur cette carte que les Yael sont des filles à Paris, dans sa banlieue, ainsi qu’à Strasbourg, Lyon et Marseille. Mais ailleurs, ce sont plutôt des garçons, les Yael. Le prénom est peu répandu, d’où un grand nombre de départements “blancs” (sans information statistique disponible). Mon hypothèse, spécifique à ce prénom : les unes naissent dans des familles juives, ou des familles ayant choisi de donner à leur enfant le nom d’une héroïne biblique n’ayant pas froid aux yeux ; les autres dans des familles inspirées par les modes celtiques, mais préférant Yael à Gael ou Mael (disposant d’une forme féminine, Yaelle, comme Gaelle et Maelle).

La mention du prénom

Le graphique suivant (cliquez dessus pour l’avoir en grande taille lisible) place les prénoms sur un plan en fonction de la fréquence des mentions “Très bien” au Bac général en 2011 (en abscisses) et en fonction du nombre de candidats admis (en ordonnées).


Cliquez sur le graphique pour pouvoir le lire.

Vous trouvez donc en bas, les prénoms peu fréquents, en haut les prénoms fréquents. A gauche les prénoms ayant reçu peu de mentions au bac, à droite les prénoms ayant reçu beaucoup de mentions TB. A dessein, les graduations ont été enlevées.
Il n’y a bien entendu aucune relation directe entre un prénom et la réussite au bac. Si les enfants de professeurs, d’instituteurs et de médecins s’appelaient Potiron et Potironne, alors Potiron et Potironne recevraient beaucoup de mention. Et si vous appelez votre fille “Emma” aujourd’hui, elle n’obtiendra pas, dans 18 ans, une mention TB avec des chances égales aux Emma qui avaient 18 ans en 2011.
La relation est indirecte : c’est parce que les prénoms sont donnés en proportion différentes suivant le milieu social des parents. Les ouvriers et employés, depuis une bonne trentaine d’année, ont tendance à préférer des prénoms “anglo-saxons”. Alison, Jennifer, Dorian, Cindy, Jordan, Kevin… se retrouvent donc à gauche du graphique, ayant reçus, en 2011, très peu de mentions TB. On trouve aussi, à gauche, des prénoms qui sont, lors de la naissance de ces enfants, sur le déclin : Loïc, Rémy, Mélodie, Elodie, Amandine, Matthieu… qui ont alors déjà été abandonnés par les cadres et professions intermédiaires.
Les prénoms très courants au moment de la naissance de ces bacheliers de 2011 (Thomas, Pauline, Camille, Marie, Marion, Nicolas…) reçoivent une proportion de mentions TB très proche de la moyenne : Il est très probable que leur répartition dans la société française, à l’époque de leur naissance, soit bien dispersée. Ce sont des prénoms en “milieu de carrière”.

Notes : Pour réaliser ceci, j’ai “aspiré” les résultats individuels publiés cette année sur internet. J’ai quelques 250 000 personnes dans la base. Pour ce faire, j’ai suivi les tutoriels rédigés par François Guillem. Ce travail a été fait rapidement, je ne garantis pas l’exactitude du placement de chaque prénom sur le graphique. Mais globablement, je suis certain que ce n’est pas faux.
Considérez cette petite étude comme une continuation de celle-ci sur les résultats au brevet.