Billet

L’indicateur d’un milieu

Billet publié le 31/03/2011

Les prénoms sont des indicateurs de la position sociale des parents. Ils ne font pas qu’assurer l’identification des individus, ils sont associés à des caractéristiques collectives.
Je vais analyser ici des données recueillies par Henry Ciesielski. La plupart des académies publient, sur internet, les résultats individuels au brevet des collèges, sous la forme suivante : Coulmont, Baptiste, Mention, (collège).
Il est possible de retrouver, pour chaque collège, sa composition sociale, sous une forme très agrégée, donnant la proportion d’enfant de 4 catégories (fav a = enfants de chefs d’entreprise, cadres et enseignants, fav b = enfants de professions intermédiaires, moy = enfants d’artisans, commerçants et employés, défav = enfants d’ouvriers, de retraités employés et ouvriers et d’inactifs). L’on sait aussi si le collège est un collège privé ou public.
Ces données se prêtent à une “analyse en composante principale”, qui va proposer, sur un plan, une représentation synthétique des proximités sociales.

[L’image ci-dessus n’est qu’un extrait. Cliquez pour le PDF]

J’ai restreint l’analyse aux prénoms les plus fréquents, ceux qui avaient été donnés à plus de 1000 enfants en 1994, 1995 ou 1996. Sur l’image précédente, la place de chaque prénom dans le plan dépend de la composition sociale du collège et de deux scores. Le premier est la proportion de personne portant tel prénom se trouvant dans un collège privé. Le deuxième est un score de succès liées aux mentions reçues par les porteurs de tel prénom.
Le graphique oppose clairement les porteurs de prénoms “anglo-saxons” ou “arabes” aux porteurs de prénoms “anciens” : Sabrina se retrouve à côté de Brandon et Myriam et fort loin d’Agathe, Victor et Juliette. Ces deux types de prénom se trouvent dans des collèges fort différents socialement (les uns dans des collèges où sont surreprésentés les enfants d’ouvriers, les autres dans des collèges où sont surreprésentés des enfants de cadres). Et ils s’opposent aux prénoms des classes qualifiées ici de moyennes : Romain, Romane, Rémy, Sylvain et Bastien…
Cette cartographie sociale ne va pas vraiment surprendre : le sens commun arrive très bien à classer les prénoms des uns et des autres. Mais elle pourrait surprendre, pourtant. Je n’ai pas ici utilisé uniquement des données portant directement sur les porteurs de prénoms (par exemple la catégorie sociale des parents), mais des données portant sur le collège dans lequel les personnes se trouvent, des données portant donc sur un milieu social, des données “écologiques”. Les Brandon, ici, ne sont pas nécessairement des enfants d’ouvriers ou d’inactifs, mais des enfants se trouvant scolarisés dans des collèges comprenant une surreprésentation d’enfants d’ouvriers ou d’inactifs. C’est, d’une certaine manière, la ségrégation scolaire qui apparaît, violemment.
 
Et Ines me direz-vous ? que fait-elle, seule, à une place étrange sur ce graphique. C’est, vers 1995, un des rares prénoms donnés aussi bien aux filles d’ouvriers maghrébins qu’aux filles des bourgeois de la région parisienne (et apparemment peu donné en dehors de ces deux milieux). Sur le graphique, c’est donc un prénom en “tension” entre deux positions.
 
Voici la “roue des variables”.

Je remercie encore Henry de m’avoir transmis ces données (ses données) ainsi que l’idée du traitement statistique.

Mise à jour
Arthur C. me signale que le traitement suivant est plus juste. Voici donc une analyse des correspondances :

Lien vers le fichier PDF

Et là, avec la prise en compte de la mention, on voit apparaître le genre, sur le 2e axe (les filles en bas, avec des résultats meilleurs, et les garçons en haut).

14 commentaires

Un commentaire par Stéphane Dorin (31/03/2011 à 12:22)

Comment interprètes-tu le deuxième axe, si le premier est celui de l’origine sociale ? Que signifie le fait que Stéphane soit proche, sur cet axe, de Dimitri, de Wendy et d’Inès, mais très loin de Bastien, Yoann, Dorian et Sylvain ?

Un commentaire par Baptiste Coulmont (31/03/2011 à 12:43)

> Aucune idée pour “Stéphane”. Mais le 2e axe oppose des collèges “extrêmes” (très populaires, très élitistes) à des collèges “moyens”.

Un commentaire par Arthur (31/03/2011 à 15:25)

En fait tu retrouves la banane classique en ACM, car finalement les prénoms tu peux les voir comme les modalités d’une variable quali… ce qui voudrait dire que le 2e axe n’a pas forcément d’interprétation, c’est juste une distorsion artificielle
sinon tu aurais du garder la variable de la région, pour croiser… j’aurais bien aimé la voir comme variable supplémentaire, voir comment elle se projette…
autre suggestion (oui, je suis pénible), ça serait marrant de faire cette analyse d’un point de vue dynamique, voir comment les prénoms se baladent dans le nuage
En tous les cas, ça m’a fait marrer de voir que le prénom que mes parents avaient hésité à me donner est mon voisin sur ta carte !

Un commentaire par MB (31/03/2011 à 15:26)

Et le genre n’intervient pas ? (il n’y a pas plus de filles qui ont une mention ?)

Un commentaire par Baptiste Coulmont (31/03/2011 à 15:30)

> Arthur : merci !
> MB : on pourrait le savoir avec un autre traitement, mais pas avec cette ACP. Avec le même tableau de données, une analyse des correspondances fait apparaître autre chose (une opposition garçons-filles sur le 2e axe) : mais je ne retrouve plus ma fiche qui me rappelle la différence entre une ACP et une AC….

Un commentaire par Henry (31/03/2011 à 16:07)

> MB : exact, les filles ont de meilleurs résultats au brevet.

De mon côté je pense que l’analyse devrait gommer l’effet d’appartenance géographique afin de raisonner “toutes choses égales par ailleurs”. Ex : un prénom plus souvent donné en Ile de France aura un niveau social plus élevé alors qu’au sein de cette région il pourra avoir une position sociale relativement faible. Autre exemple : des prénoms plus souvent donnés dans l’ouest (Bretagne, Pays de la Loire) augmentent généralement le niveau scolaire de ce prénom, ce qui les placera à un niveau élevé sur l’ACP.

Un commentaire par Léo D. (31/03/2011 à 16:48)

Sur la différence entre ACP et AFC, il me semble que l’AFC s’utilise avec des variables qualitatives tandis que l’ACP s’utilise uniquement sur des variables quantitatives.

Il y a aussi des différences au niveau des méthodes de calcul, mais je préfère ne rien dire, car j’ai peur d’écrire des âneries…

Un commentaire par Avner (31/03/2011 à 23:15)

C’est marrant comme analyse. On utilise en général l’AFC pour des données qualitatives et l’ACP pour des données quantitatives à cause de la distance entre les individus. Dans mes souvenirs on peut montrer assez facilement que l’ACP sur les proportions est équivalente à l’AFC sur les comptages. Sinon pour faire chic, la banane s’appelle un “effet Guttman ” (horseshoe effect ou Arch effect pour pouvoir frimer en anglais) et montre (en général) qu’il y a une structure uni-dimensionnelle sous-jacente.

Un commentaire par J'ai pas de titre (31/03/2011 à 23:19)

Il y aurait peut être des choses intéressantes à découvrir en testant la fréquence des prénoms rares suivant le type de collège.

Un commentaire par Camille (01/04/2011 à 18:31)

Ines était à la fois Ines de la Fresange et un prénom d’origine maghrébine

Un commentaire par Régis (02/04/2011 à 9:42)

et Ines de Castro, née en Castille mais reine de Portugal…

Un commentaire par ODI (05/04/2011 à 13:50)

Vous pouvez trouver un résumé des études économiques évaluant l’impact du prénom sur la réussite professionnelle:

http://observatoiredesidees.blogspot.com/2010/02/les-inegalites-liees-la-naissance_24.html

Un commentaire par Prénoms, régions et analyse en composantes principales (3ème partie) | Le blog de François Guillem (22/04/2011 à 17:38)

[…] lieu d’utiliser les CSP, on pourrait adopter la même stratégie que celle utilisée dans cet article de Baptiste Coulmont et utiliser le niveau de diplôme. La régression est un peu moins robuste et l’on trouve que […]

Un commentaire par Madame Mercury (07/08/2011 à 10:36)

Que penser du prénom “Sophie”?