Categories

Archives

Le beau linge

Il y a le tissu social. Et il y a le beau linge social [*]. Mais parfois le beau linge est caché dans de vieilles armoires grinçantes. Ouvrons une de ces armoires : les noms à particules (et, parfois, à armoiries). Je vais m’appuyer sur les résultats nominatifs au bac général et technologique, entre 2012 et 2017, soit 2,2 millions d’individus.
Parmi eux, 25 000 ont un nom à particule (la particule ici étant “de”, “du”, “des” ou “d'” : d’Hauterives, de La Tour d’Aigues, des Restifs, Chabault du Fals, etc…), et parmi eux quelques De Souza. 68 000 ont un des 30 noms de famille les plus fréquents en France (Martin, Durand) mais aussi Da Silva. Les autres, qui sont donc 2,1 millions environ, représentent le tout-venant.
Si la particule ne disait rien (mais vraiment rien du tout) de la position sociale, alors les prénoms des bacheliers à particule devraient ressembler très fort aux prénoms des bacheliers sans particule. Si l’on pense que la particule est quand même un signe d’immigration potentiellement lointaine, alors on peut comparer avec les prénoms de celles et ceux qui ont un nom de famille très fréquent en France (un des trente noms de famille les plus fréquents). Les choix de monsieur et madame Dupont ne devraient pas trop différer des choix de Monsieur et Madame du Pont.

Le tableau des prénoms les plus fréquents ne révèle que peu de différences. Les prénoms des “Dupont” (c’est à dire des personnes ayant un des 30 noms de famille les plus fréquents en France) sont, grosso modo, rangés dans le même ordre que les prénoms de l’ensemble de la population des bacheliers. Les prénoms des “du Pont” (c’est à dire des personnes ayant un nom à particule) montrent de légères différences de rang : on y préfère Marie à Camille, on apprécie un peu moins Léa et Manon. On adoooore Louis et Paul.

rang DUPONT TOUS DU PONT
1 Camille Camille Marie
2 Thomas Thomas Antoine
3 Manon Marie Thomas
4 Lea Manon Alexandre
5 Marie Lea Camille
6 Pauline Alexandre Louis
7 Antoine Antoine Paul
8 Mathilde Maxime Guillaume
9 Maxime Nicolas Nicolas
10 Nicolas Pauline Pierre
11 Alexandre Mathilde Lea
12 Marine Chloe Charlotte
13 Julie Marine Marine
14 Chloe Laura Hugo
15 Quentin Julie Mathilde
16 Clement Quentin Manon
17 Julien Clement Maxime
18 Guillaume Pierre Quentin
19 Laura Marion Pauline
20 Valentin Julien Alexis

Sources : Résultats nominatifs au bac

Ainsi, pour ce qui est des choix les plus fréquents, les choix des Dupont et des du Pont se ressemblent. Les prénoms les plus fréquents n’ont qu’un faible pouvoir de distinction.

Le diable est dans les détails. Certains prénoms (des prénoms relativement fréquents, présents chez plus de 500 bacheliers et bachelières) ne sont pas répartis de la même manière entre Dupont et du Pont. Examinons la “sur-représentation” et la “sous-représentation” de ces prénoms fréquents. Pour ce faire, on divise la fréquence du prénom dans la population à particule par la fréquence du prénom dans la population complète. Quand ce rapport est supérieur à 1, cela signifie que les du Pont choisissent un peu plus souvent ce prénom que la population générale. Et l’on fait la même chose pour les Dupont.

Là, les différences apparaissent très visibles. Les parents à particules choisissent Sixtine, Maylis et Stanislas beaucoup plus souvent que le commun des mortels. Les Dupont, eux, ont des choix peu spécifiques : à la fois Teddy et Thibaud, Andy et Léonie : c’est que l’on trouve de tout dans les Dupont, qu’ils ont des choix très peu différents des choix du commun des mortels.

rang (de surreprésentation) DUPONT DU PONT
1 Solenne Sixtine
2 Alexane Maylis
3 Suzanne Stanislas
4 Andy Gaspard
5 Timothe Albane
6 Xavier Hugues
7 Segolene Hortense
8 Cassandra Henri
9 Joffrey Philippine
10 Gwenaelle Marin
11 Gabin Bertrand
12 Teddy Diane
13 Thibaud Victoire
14 Antony Alix
15 Charlene Astrid
16 Corentin Alban
17 Leonie Joseph
18 Coraline Malo
19 Etienne Amaury
20 Leopold Augustin

Sources : Résultats nominatifs au bac

Alors que nous serions bien en peine de distinguer les Dupont sur le tissu social (ce sont, collectivement, des omnivores culturels), les du Pont, eux, s’y distinguent bien, notamment par leurs choix spécifiques : ils sous-utilisent les prénoms les plus fréquents, et ils sur-utilisent un corpus de prénoms rares. Ainsi, alors que rien ne devrait distinguer les Dupont des du Pont, si la particule n’était vraiment rien, certaines de leurs pratiques culturelles les différencient encore, à la marge, du reste de la société. Quand donc arriveront-ils à s’intégrer ?

[*] La métaphore n’est pas seulement filée, elle est ici cousue de fil d’or.

Le mystère des garçons en avance

L’avance scolaire des garçons m’étonne, depuis quelques temps déjà (voir les épisodes précédents ici ou encore ). J’ai commencé à explorer les données du “Panel 2007” (qui suit des élèves sur plusieurs années), mais ce n’est pas encore assez abouti.
L’avance scolaire des garçons est bizarre car elle n’est pas entièrement liée à leurs performances scolaires : à notes égales, les garçons sautent plus souvent une classe que les filles. Et cela se vérifie quelque soit la série ou filière du bac et quelque soit l’origine sociale des élèves. Cela peut s’illustrer avec les résultats nominatifs au bac, en prenant les prénoms comme des indicateurs (flous) d’origine sociale.
En abscisse : le pourcentage de mention “Très bien”. En ordonnées : le pourcentage d’élèves en avance. Chaque point représente un groupe d’élèves portant un prénom donné plus de 200 fois. La ligne bleue montre la relation (issue d’une régression linéaire) entre la proportion de garçons obtenant la mention Très bien et la proportion de garçons “en avance”. La ligne rouge montre la même chose pour les filles. Quelque soit l’année (non représentée), quelque soit la série, quelque soit l’origine sociale, les garçons, en moyenne, ont plus souvent sauté une classe que les filles qui ont les mêmes performances scolaires.

cliquez pour agrandir

Quand on connaît les primes diverses accordées à la précocité, on ne peut s’empêcher de penser que, décidément, les avantages masculins commencent tôt dans la vie.

Pour l’anonymisation, voir Coulmont ?

Il y a quelques années, j’ai mis en ligne un outil permettant l’anonymisation des enquêtés : à partir des résultats nominatifs au bac, j’ai regroupé les prénoms qui obtenaient le même profil de résultats.
Après quelques années, cet outil commence à être utilisé [j’en avais parlé en 2012]. Et parfois, celles et ceux qui l’utilisent font le plaisir de le citer. Comme je suis un peu bête, j’ai oublié d’indiquer une manière unique de citer cet outil : voilà qui ne facilite pas la citation. Un petit bilan quantitatif s’impose donc.

Nicolas Jounin le mentionne dans Voyage de classes.

Et on en trouve l’usage dans une poignée de thèses soutenues récemment :


Thèse de Géraldine Comoretto

 


Thèse de Maud Gelly

 


Thèse de François Reyssat

 


Thèse de Marjorie Gerbier-Aublanc

 

Youpi ! N=5 ! [Si vous l’avez utilisé dans votre thèse, n’hésitez pas à me le signaler]

Un peu d’imputation

Les résultats électoraux publiés sur opendata.paris.fr sont de bonne qualité : ils proviennent directement du bureau des élections de la ville de Paris. Mais il y a de petites bizarreries dans le nombre de votes par procuration de quelques bureaux de vote. C’est assez habituel : le nombre de votes par procuration ne change pas le résultat, et il ne fait pas partie des données scrutées avec attention (le nombre de voix reçues par les candidats, le nombre de votants…). C’est une donnée annexe, d’un peu moins bonne qualité.
Par exemple, les bureaux 10-1 et 16-46 ont indiqué zéro vote par procuration au premier tour des présidentielles. Tous les autres bureaux de vote ont au moins 9 procurations. Et les bureaux qui ont moins de 15 votes par procurations se trouvent tous dans les 18e, 19e ou 20e arrondissements. Les bureaux immédiatement adjacents au 10-1 et au 16-46 ont eux aussi bien plus de procurations.
J’ai donc été vérifier les listes d’émargement, à la préfecture de Paris. J’ai compté les procurations. Et en effet, le 10-1 a vu 81 procurations au premier tour, et le 16-46 a vu 44 votes par procuration. Aurai-je pu prédire ces chiffres et m’épargner un aller-retour en métro ?


Comme le montre le graphique ci-dessus, dans les deux bureaux concernés, le “vrai” taux de procuration ne devrait pas être zéro, mais plutôt 3% pour l’un et 4,5% pour l’autre.
Au lieu d’une régression sur une seule variable, on peut prendre en compte simultanément d’autres variables. L’idée est ici de se servir des corrélations assez fortes entre variables : taux d’abstention, proportion de votes Fillon ou Macron, taux de bulletins nuls… pour assigner une valeur probable au taux de procurations au premier tour.

Si l’on fait cette régression en enlevant les bureaux “problématiques”, alors on obtient 6,3% de procurations pour le bureau 10-1 et 4,6% pour le bureau 16-46. Soit, en valeur absolue : 74 procurations pour le 10-1 et 44 pour le 16-46. On tombe pipe-poil sur le vrai nombre pour le bureau du 16e, on est en dessous de 7 votants pour le bureau du 10e arrondissement. Pas mal !

Le problème se repose pour le second tour : certains bureaux ont des nombres de procurations très improbables, près de 400. Et d’autres assesseurs semblent avoir au contraire oublié un 1 devant le chiffre 11 ou 27. Et encore un bureau à zéro procuration.

Pour estimer le nombre de procurations réelles dans ces bureaux (que je n’avais pas pu identifier avant ma visite à la préfecture), je peux utiliser les résultats du second tour (vote Macron, abstention, bulletins nuls), mais aussi ceux du premier tour : ainsi le vote Fillon au premier tour est assez prédictif, ainsi que, bien entendu, le recours à la procuration au premier tour.

Une première régression permet d’identifier les bureaux aux chiffres aberrants : ce sont les bureaux dont le taux de procuration prédit est très éloigné du taux de procuration observé. On les enlève du jeux de données, on répète la régression, et on affecte à ces bureaux le taux de procuration prédit par cette nouvelle regression.

Cette procédure va faire augmenter artificiellement le « R^2 » de la régression, puisqu’on enlève les points aberrants et qu’on les remplace par des points prédits. Heureusement, cela ne porte que sur moins de 10 bureaux sur les 896 bureaux parisiens. Et ça permet de tracer des cartes un peu plus jolies.

Les immigrés cadres

Dans l’ancien département de la Seine (Paris et sa banlieue proche), où résident les cadres ?
La carte suivante s’intéresse aux personnes non immigrées : dans les zones en rouge, la population active est composée de plus de 70% de cadres et de professions intermédiaires, dans les zones en bleu, de moins de 34%.


Cliquez pour agrandir

On voit que Paris et l’Ouest ont une proportion importante de cadres et de professions intermédiaires.

Interessons-nous maintenant aux immigrés. La proportion de cadres et de professions intermédiaires dans la population active immigrée est plus faible. Mais grosso modo la distribution géographique ressemble à la précédente. Parmi les immigrés, il y a aussi plus de cadres à l’Ouest.

Cliquez pour agrandir

Les distributions géographiques sont proches, mais pas semblables. On peut voir qu’il y a certaines zones où semblent résider relativement plus de cadres immigrés (en proportion du total des actifs immigrés) que de cadres non-immigrés (en proportion du total des actifs natifs). Par exemple des zones où, parmi les immigrés actifs, il y a 45% de cadres (ce qui est bien supérieur à la moyenne — chez les immigrés) et où il n’y a “que” 50% de cadres parmi les natifs actifs (ce qui serait inférieur à la moyenne — chez les natifs).
Il y a des lieux où les immigrés de classe sup sont plus fréquents qu’attendus (par comparaison avec les natifs de classe sup) — et des lieux où ils sont relativement moins fréquents. Ce sont des différences de différences. Des lieux où, finalement, les immigrés cadres s’installeront un peu moins fréquemment que les immigrés natifs (des lieux refusés) et des lieux où il y aura un peu plus d’installation par comparaison aux natifs (des lieux recherchés).

Pour tracer la carte suivante, j’ai lissé les données en prenant en compte les 4 plus proches voisins (en pondérant par la population des IRIS).


Cliquez pour agrandir

Ces lieux : Anthony, Chatenay Malabry, Courbevoie et un morceau de Nanterre, mais aussi la zone frontière entre les 13e et 14e arrondissements.

Il s’agit de « différences de différences » : cette carte ne représente pas les zones où se trouvent beaucoup d’immigrés, mais où, après avoir pris en compte les différences et similitudes de distributions (géographique et statistique) entre les populations actives “natives” et “immigrées”, on repère un « résidu », des zones où l’on ne s’attendrait pas à voir “autant” ou “si peu” de cadres immigrés. … Mais il n’est pas certain qu’une telle carte soit très utile.

Les épreuves classantes nationales : âge, sexe et prestige

Il y a, en France, un concours pour devenir interne en médecine, et les listes des reçus sont publiées au journal officiel chaque année, m’apprend nc233.com qui a étudié les prénom des reçus.
J’ai récupéré les listes pour les trois dernières années.
Comme dans toute épreuve scolaire, on remarque que les plus précoces réussissent mieux :

En 2016, 50 % les candidats nés en 1993 sont dans le “top 1000”, alors que moins de 5% de ceux qui sont nés en 1988 s’y trouvent.

Mais à la différence des épreuves scolaires, les filles réussissent moins bien les “Epreuves nationales classantes” que les hommes. La pénalité est d’environ une demi-année : les filles réussissent autant que les garçons qui ont six mois de plus qu’elles.

Et cette plus grande réussite masculine est visible si l’on s’intéresse à la proportion d’hommes en fonction du rang de classement. Plus on se rapproche du début du classement, plus les hommes sont représentés : quand il y a 45% d’hommes au total, ils sont 60% dans les tous premiers rangs :

Et cette prime masculine se reproduit année après année.
Il est intéresssant de voir que la proportion d’homme augmente aussi vers la fin du classement, mais pas aux toutes dernières places, où il n’y a plus que 40% de garçons. Les femmes, elles, sont plus fréquemment représentées au milieu du classement.

Est-ce lié au refus de féminiser les internats et les spécialités médicales les plus prestigieuses ? Ou est-ce un effet du rendement inégal du rang de classement entre hommes et femmes ? Ne sachant pas comment ces épreuves sont organisées, je ne peux pas répondre.

Les arrêtés d’affectation sont aussi publié, et l’on peut voir qui choisit quoi en fonction de son rang de classement. Les premiers classés obtiennent ce qu’ils souhaitent. Les dernières classées prennent ce qui reste.

Dans le tableau suivant, par exemple, on peut lire que la spécialité “pédiatrie” est féminisée. Alors que la chirurgie générale (que ce soit à Paris, à Lille ou à Lyon) l’est peu. La colonne “max” indique la position du dernier reçu (50 indique que le dernier reçu était dans les 50% les mieux classés). Cela indique l’attractivité de la Discipline*Région : ainsi pour espérer une place en cardiologie ou en anesthésie, il vaut mieux être bien classé. En revanche, pour avoir psychiatrie, pas de problème. Et si on est bien classé, en général, on ne demandera pas “medecine générale” à Caen : personne parmi les 20% les mieux classés, entre 2014 et 2016, n’a demandé cette spécialité (ce qu’indique la colonne “min”).

Attractivités des spécialités et des régions
Région Spécialité min max N % Hommes
1 Aix-Marseille. pédiatrie 1 51 50 8
2 Ile-de-France. dermatologie et vénérologie 0 76 52 15.4
3 Lyon. pédiatrie 0 73 51 15.7
4 Ile-de-France. pédiatrie 1 76 253 17.8
5 Ile-de-France. gynécologie obstétrique 1 42 94 18.1
6 Lille. pédiatrie 1 49 65 20
7 Nancy. psychiatrie 7 100 52 25
8 Rennes. médecine générale 0 95 322 30.7
9 Besançon. médecine générale 6 100 237 31.2
10 Aix-Marseille. psychiatrie 5 88 76 31.6
11 Grenoble. médecine générale 4 97 328 31.7
12 Lyon. médecine générale 3 98 555 32.4
13 Nantes. médecine générale 3 90 348 33.9
14 Ile-de-France. pneumologie 1 27 58 34.5
15 Montpellier. médecine générale 1 97 475 34.9
16 Angers. médecine générale 4 97 346 35
17 Bordeaux. psychiatrie 15 92 68 35.3
18 Tours. médecine générale 10 100 263 35.7
19 Ile-de-France. médecine générale 0 100 1730 36.1
20 Strasbourg. médecine générale 4 99 413 36.1
21 Bordeaux. médecine générale 0 98 577 36.4
22 Toulouse. médecine générale 1 98 472 38.3
23 Ile-de-France. psychiatrie 2 91 308 38.6
24 Nice. médecine générale 2 95 247 40.1
25 Saint-Etienne. médecine générale 4 97 234 40.2
26 Aix-Marseille. médecine générale 4 99 653 40.3
27 Clermont-Ferrand. médecine générale 2 100 258 40.7
28 Nancy. médecine générale 17 100 398 40.7
29 Toulouse. psychiatrie 2 96 73 41.1
30 Lyon. psychiatrie 4 75 72 41.7
31 Ile-de-France. médecine interne 0 27 93 41.9
32 Ile-de-France. médecine du travail 29 100 57 42.1
33 Brest. médecine générale 6 99 284 42.3
34 Ile-de-France. gastro-entérologie et hépatologie 0 27 66 42.4
35 Lille. psychiatrie 6 93 120 43.3
36 Rouen. psychiatrie 15 98 62 43.5
37 Ile-de-France. biologie médicale 4 99 55 43.6
38 Ile-de-France. oto-rhino-laryngologie et chirurgie cervico-faciale 2 28 55 43.6
39 Rouen. médecine générale 12 100 296 43.6
40 Ile-de-France. neurologie 0 29 64 43.8
41 Poitiers. médecine générale 5 96 368 43.8
42 Lille. médecine générale 1 99 715 43.9
43 Océan-Indien. médecine générale 13 97 169 45
44 Reims. médecine générale 17 100 236 46.6
45 Limoges. médecine générale 10 100 130 46.9
46 Caen. médecine générale 20 100 271 47.6
47 Antilles-Guyane. médecine générale 8 96 212 49.1
48 Dijon. médecine générale 8 100 244 50.4
49 Ile-de-France. oncologie 0 34 76 52.6
50 Poitiers. psychiatrie 6 99 57 54.4
51 Amiens. médecine générale 16 100 246 54.9
52 Ile-de-France. ophtalmologie 0 47 90 55.6
53 Ile-de-France. radiodiagnostic et imagerie médicale 0 22 155 56.1
54 Lyon. anesthésie-réanimation 0 23 50 58
55 Ile-de-France. cardiologie et maladies vasculaires 0 21 141 58.9
56 Montpellier. chirurgie générale 1 51 61 59
57 Lille. anesthésie-réanimation 1 38 60 60
58 Ile-de-France. anesthésie-réanimation 0 41 193 60.6
59 Ile-de-France. santé publique 3 97 51 62.7
60 Ile-de-France. anesthésie réanimation 0 39 92 66.3
61 Lille. radiodiagnostic et imagerie médicale 0 22 57 66.7
62 Lyon. chirurgie générale 2 44 64 67.2
63 Lille. chirurgie générale 1 50 96 67.7
64 Aix-Marseille. chirurgie générale 0 52 66 68.2
65 Ile-de-France. chirurgie générale 0 72 190 68.4
Source : Légifrance

Et un bonus pour celles et ceux qui sont arrivés jusqu’ici : la proportion de candidats “précoces” (qui ont au moins un an de moins que le gros du peloton) par spécialité. 17% des internes en “néphrologie” sont des précoces, et ce n’est que 2,7% des internes en médecine générale (les plus nombreux).

Proportion de candidats précoces
Spécialité % précoces Effectif
santé publique 1.4 222
médecine du travail 1.7 293
médecine générale 2.8 11027
biologie médicale 3.2 339
médecine physique et de réadaptation 3.2 311
endocrinologie, diabète, maladies métaboliques 3.3 246
psychiatrie 3.4 1546
gynécologie-obstétrique 4.7 214
anesthésie réanimation 6.1 460
chirurgie générale 6.4 1260
oncologie 6.6 392
cardiologie et maladies vasculaires 7.1 644
pneumologie 7.1 366
pédiatrie 7.3 995
gynécologie obstétrique 7.5 456
anesthésie-réanimation 8 922
rhumatologie 8.1 271
neurologie 8.6 373
radiodiagnostic et imagerie médicale 9 787
gastro-entérologie et hépatologie 9.1 397
dermatologie et vénérologie 9.4 299
oto-rhino-laryngologie et chirurgie cervico-faciale 9.5 262
ophtalmologie 12.6 461
médecine interne 14.7 409
néphrologie 17 265
Source : Légifrance

Quels prénoms ?

Depuis le 1er septembre, et pour un an — jusque fin août 2017 donc —, je suis en délégation pour recherches à l’INED. Mon travail va porter sur les prénoms que les immigrés (et les descendants d’immigrés) donnent à leurs enfants, à partir de l’enquête TeO. C’est une étude que j’avais commencée il y a quelques années déjà, mais que je n’avais pu terminer (en raison de la rédaction d’un ouvrage sur les changements de prénoms, d’une habilitation à diriger des recherches et de responsabilités administratives variées, au sein du département de sociologie de Paris 8).
Dans un contexte juridique entièrement libéral, quels prénoms les parents choisissent-ils ? A quelles caractéristiques individuelles (niveau de diplôme, ancienneté de résidence en France…) et contextuelles (lieu de résidence, environnement familial, amical et de travail…) sont associés certains choix ? Garçons et filles reçoivent-ils des prénoms du même registre ? Y a-t-il un lien entre l’expérience du racisme (en raison du nom ou du prénom) et le choix de tel ou tel prénom ?
Il existe une poignées d’articles sur les prénoms que reçoivent les enfants des immigrés, et même des travaux récents, qui montrent une tendance à l'”acculturation conservatrice” (le choix de prénoms “qui ont fait leur preuve” plutôt que de prénoms neufs). Mais ces enquêtes ne portaient pas sur la France. Essayons donc d’en savoir un peu plus.

En avance !

Dès le primaire, et jusqu’à l’Université, les résultats scolaires des filles sont meilleurs que ceux des garçons. L’avantage masculin lors des tests de mathématiques au début du collège est entièrement compensé par le plus grand avantage féminin dans les autres disciplines. Et au bac, les filles obtiennent de meilleurs résultats : moins d’échecs, moins de passages à l’oral, et plus de mentions.

L’on ne peut donc être étonné par le fait que, depuis l’après seconde guerre mondiale, la proportion de filles “en avance” d’un an ou plus en Terminale soit plus élevée que la proportion de garçons “en avance”. Les élèves qui ont “sauté une classe” sont celles et ceux qui avaient de meilleurs résultats que les autres, qui restent “à l’heure” ou qui redoublent. Les statistiques du ministère de l’éducation le prouvent. En 1971, 7,7% des filles en terminale sont “en avance”, et c’est le cas de 6,3% des garçons. En 2005, après une trentaine d’années de limitation des sauts de classe, 3% des filles de terminale et 2,5% des garçons sont “en avance”.
avance1985-2015
Mais aujourd’hui, l’avantage est masculin : 5,5% des garçons de terminale sont en avance, ce n’est le cas que de 4,5% des filles. Les résultats scolaires des garçons, dans leur ensemble, n’ont pas rejoint ceux des filles. Il est même possible d’aller plus loin : les résultats scolaires des garçons qui ont sauté une classe sont moins bons que ceux des filles qui ont sauté une classe. Le saut de classe n’est plus indexé sur les résultats scolaires. Comment alors expliquer la proportion plus importante de garçons en avance ? Une explication liée à la structure des orientations est probable (les garçons sortent plus vite du système scolaire, et ils se dirigent plus vers les bac pro). Une autre explication est possible : dans les classes supérieures, l’investissement dans l’éducation des garçons s’est renforcé (même si l’égalitarisme est toujours affirmé). Un dernier mécanisme est à explorer, il combine les deux précédentes explications : l’avance scolaire était utilisée par les parents de garçons souhaitant les faire accéder au “bac S”, en anticipant un redoublement possible, en seconde ou en première… La très forte diminution des redoublements au cours des vingt dernières années fait accéder ces garçons aux Terminales sans qu’ils perdent leur avance.

Durkheim et les statistiques, petite note

François Simiand, dans son compte-rendu du Suicide paru dans la Revue de métaphysique et de morale en 1898 (dans une rubrique intitulée “L’année philosophie 1897”), critique les usages non-réflexifs des données statistiques dans cet ouvrage : “une critique préalable de la valeur respective des statistiques, selon les pays et selon les dates serait en pareille matière toujours souhaitable : tout fait, que quelqu’un a des raisons de dissimuler, est difficilement atteint par la statistique”

La plupart du temps, en effet, Émile Durkheim ne propose aucun examen critique des sources statistiques qu’il utilise. Comme on le voit, cela lui a très tôt été reproché, même au sein du premier cercle durkheimien. Est-ce à dire que Durkheim serait aveugle à la qualité des données statistiques ? Non. Dans Le Suicide, il use à plusieurs reprises d’un regard critique envers les chiffres dont il dispose. Voici quelques exemples :

  • p87. Durkheim récuse la significativit dde chiffres trop faibles qui n’ont pas “toute l’autorité désirable”.
  • p144. « ce qu’on appelle statistique des motifs de suicides, c’est, en réalité, une statistique des opinions que se font de ces motifs les agents, souvent subalternes, chargés de ce service d’information » : les statistiques produites, le plus souvent, ne sont pas dignes de foi car les agents qui les recueillent sont mal formés pour le faire ; Durkheim est de plus très sceptique face à la possibilité d’étudier les opinions.
  • p166. « la statistique du suicide par profession et par classe ne [peut] être établie avec une suffisante précision » : ces données sont complexes à recueillir
  • p168. (note 2)  « l’exactitude de la statistique espagnole nous laisse sceptique » : l’appareil administratif espagnol est beaucoup moins précis que celui d’autres pays, nous dit Durkheim
  • p219. « en temps de crise […] la constatation des suicides se fait avec moins d’exactitude » car l’action de l’autorité administrative est paralysée.
  • p398-400. Durkheim discute de la qualité des statistiques judiciaires et des statistiques de décès : « le nombre des morts par la foudre a encore beaucoup plus augmenté; il a doublé. La malveillance criminelle n’y est pourtant pour rien. La vérité, c’est, d’abord que les recensements statistiques se font plus exactement et, pour les cas de submersion, que les bains de mer plus fréquentés, les ports plus actifs, les bateaux plus nombreux sur nos rivières donnent lieu à plus d’accidents »

Ces critiques sont à la fois radicales (il ne faut pas étudier les « motifs » des suicides, bien qu’ils soient disponibles dans les annuaires statistiques, car ce ne sont que des « appréciations personnelles ») et de détail (tel chiffre est faux, tel autre est mal recueilli). Durkheim n’est donc absolument pas dupe de la qualité des chiffres qu’il utilise. Le Suicide est un ouvrage de combat, et Durkheim va sélectionner les données qui l’intéressent : il ne va critiquer que les données numériques qui lui posent problème.
Vous voudriez en savoir plus : Sociologie du Suicide de Durkheim (document PDF).

Côté prénoms : chiens, mode, assimilations et modélisation

Du nouveau, côté “prénoms”. Deux ou trois mots sur quelques articles parus récemment.

D’abord un petit article sur les prénoms des chiens des “punk-à-chiens”. Les prénoms des animaux domestiques servent d’indicateurs du parcours de vie des zonards. Ils disent la survie difficile, la loyauté introuvable, l’enfance perdue mais aussi la transgression. « Les Subut, Kéta, Cock, LSD et Cannabis que nous avons rencontrés durant nos enquêtes de terrain témoignent quant à eux, de façon exemplaire, que les pratiques toxicologiques couvrent un éventail très large. »

Blanchard, Christophe. 2015. « Ce que les noms des chiens des sans-abris révèlent de leurs maîtres », Anthropozoologica, vol. 50, no 2 : 99‑107. En ligne, open access, sur http://sciencepress.mnhn.fr/sites/default/files/articles/pdf/az2015n2a3.pdf

Passons aux Etats-Unis, où un papier s’intéresse aux transgenre, en essayant d’estimer leur nombre à partir des changements de prénoms et des changements de sexe dans le fichier nominatif de la Social Security Administration, qui est quasi-exhaustif. Entre 1936 et 2010, plus de 135 000 individus, ayant changé de prénom ou de sexe sont identifiés comme “transgenres probables”, et près de 90 000 étaient vivant.e.s au moment du recensement de 2010. La méthode permet aussi de repérer la temporalité des transitions : « Of those who change both their names and their sex-coding, most update both concurrently, although just over a quarter change their name first and their sex-coding 5–6 years later. Most are in their mid-thirties when they begin to register these changes with the SSA, although transgender women begin the process somewhat later in life. »

Harris, Benjamin Cerf. 2015. Likely Transgender Individuals in U.S. Federal Administrative Records and the 2010 Census, Washington (DC). Center for Administrative Records Research and Applications U.S. Census Bureau. En ligne https://www.census.gov/srd/carra/15_03_Likely_Transgender_Individuals_in_ARs_and_2010Census.pdf

Passons à la Chine, et plus spécifiquement à Beijing. La Révolution culturelle a-t-elle eu un impact sur les prénoms donnés aux bébés ? Pour les auteurs de l’article, à ce moment là, « la politique a figé la mode ». Il valait mieux alors, pour sa sécurité, ne pas faire preuve d’une trop grande exubérance individuelle. Les parents ont donc eu tendance à faire preuve de conformisme et à faire des choix “sûrs”, choix politiques et choix plutôt neutres (en choisissant un prénom relativement répandu).

Obukhova, Elena, Ezra W. Zuckerman et Jiayin Zhang. 2014. « When Politics Froze Fashion: The Effect of the Cultural Revolution on Naming in Beijing », American Journal of Sociology, vol. 120, no 2 : 555‑583.

Retour aux Etats-Unis, et plus particulièrement à la première moitié du XXe siècle, période de forte migration. Quatre articles récents s’intéressent au choix onomastiques des migrants.

Deux articles s’intéressent au bénéfice de l’américanisation. Biavaschi et ses collègues s’intéressent aux naturalisations vers 1930 : les migrants qui changent de prénoms et prennent un prénom courant aux Etats-Unis voient leur salaire augmenter. L’américanisation du prénom a un impact sur la mobilité ascendante. Goldstein et Stecklov, de leur côté, repèrent que les descendants de migrants qui reçoivent un prénom américain ont, toutes choses égales par ailleurs, un salaire plus élevé que ceux qui ont reçu un prénom typique du pays d’origine de leurs parents. Un des intérêts de leur article est de montrer que cet effet perdure quel que soit le nom de famille de la personne : même quand le nom de famille semble allogène, il existe un avantage au prénom américain. Les résultats sont similaires chez Abramitzky et Boustan : «Men given foreign names earned less than comparable sons of immigrant parents in 1940.» Heureusement ! Car ces deux papiers s’appuient sur des sources semblables, le recensement US numérisé.

Le dernier papier s’intéresse à l’acculturation conservatrice des migrants. Il est souvent apparu que les migrants, quand ils donnent à leurs enfants des prénoms typiques du pays d’accueil, vont avoir tendance à choisir des prénoms un peu démodés. Ils font le choix du classique plutôt que de l’exubérant. Le papier de Zhang et ses collègues porte sur les prénoms de soldats juifs aux Etats-Unis pendant la seconde guerre mondiale. Ils repèrent bien une forme d’acculturation conservatrice, le choix qu’avait fait leurs parents « was both selective (as it was marked by avoidance of names with strong Christian associations) and conservative (as it was marked by a preference for names that were established in popularity relative to newly-popular names). » Mais ces parents n’ont pas choisi des prénoms alors en déclin : des prénoms établis, mais encore en croissance.

Biavaschi, Costanza, Giulietti Corrado et Zahra Siddique. 2013. The Economic Payoff of Name Americanization, Berlin. Forschunginstitut zur Zukunft der Arbeit (IZA). En ligne : http://ftp.iza.org/dp7725.pdf

Zhang, Jiayin, Ezra W. Zuckerman et Elena Obukhova. 2014. A Lack of Security or of Cultural Capital? Acculturative Conservatism in the Naming Choices of Early 20th-Century U.S. Jews, Rochester, NY. Social Science Research Network en ligne : http://papers.ssrn.com/sol3/papers.cfm?abstract_id=2507677.

Abramitzky, Ran et Leah Boustan. 2014. « Cultural Assimilation during the Age of Mass Migration », Working paper, en ligne.

Goldstein, Joshua R. et Guy Stecklov. 2016. « From Patrick to John F. Ethnic Names and Occupational Success in the Last Era of Mass Migration », American Sociological Review: 0003122415621910.

Un petit tour vers l’Allemagne maintenant. L’article de Panagiotidis examine les changements de noms et de prénoms des Spä̈taussiedler, c’est à dire des immigrés d’origine allemande vers l’Allemagne après 1945. L’Allemagne considère en effet comme ethniquement allemands les descendants des Allemands s’étant établis, au cours des siècles précédents, en Pologne, Hongrie, Roumanie… Mais ces descendants “co-ethniques” n’avaient pas souvent de prénoms allemands. L’article s’intéresse alors à la germanisation d’Allemands : un processus parfois fortement recommandé par les agents chargés de l’accueil de ces migrants.

Panagiotidis, Jannis. 2015. « Germanizing Germans: Co-ethnic Immigration and Name Change in West Germany, 1953–93 », Journal of Contemporary History: 50(4), 854-874.

Je signale en fin de billet un article dont je suis le co-auteur, avec Romulus Breban et Virginie Supervie. Cet article modélise la diffusion des prénoms, et cette modélisation permet de distinguer la popularité et la mode, en repérant des phénomènes de mode à toutes les échelles (et pas seulement au niveau des prénoms les plus donnés).

Coulmont, Baptiste, Virginie Supervie et Romulus Breban. 2015. « The diffusion dynamics of choice: From durable goods markets to fashion first names », Complexity: n/a ‑ n/a. En ligne (paywalled) http://onlinelibrary.wiley.com/doi/10.1002/cplx.21748/abstract