Archives de la catégorie : 'General'

The little guys of French sociology. Anonyms and pseudonyms in sociological litterature.

This text is a quick and dirty translation of the main arguments of le petit peuple des sociologues” (published in Genèses, 2017, n.107).

First names are often used to identify characters in books and article written by French sociologists. This is rather new. Why are French sociologists increasingly using first names? Who gets to be called by a first name?

This paper is an analysis of the argumentative styles in sociology. It is also an analysis of the consequences of anonymization. Sociologists write that they anonymize in order to protect the privacy of the people who were interviewed or observed: they use pseudonyms to anonymize. But this ethical framing hinders the analysis of the consequences of anonymization. In the last part of the article, I propose an analysis of the power relations that are intertwined with the uses of a first name. One should note that the use of first names in everyday social relations is different in France and the USA. The use of “tu” instead of “vous” and the use of first names are both a way to mark closeness and a way to mark hierarchy, depending on the reciprocity of these uses.

To explore these themes I have read the 8 main French sociological journals from 1960 to 2015 (every 5 years) and, for each issue, I have counted the number of articles that used first names to refer to the people interviewed, observed or surveyed. There are many ways to refer to someone: the name (Monsieur Dupont), the first name (Pierre), the first letter (P.), a combination of letters (P. D.), some letters or numbers (“A” for the first interviewee, or “Interviewee n.1”), a position (“the head of the bureau”, “the cousin of…”), or even dates (“Interview realized on 1/1/2000”)… but I only focused on the presence or not of a first name.

The first result is the increasing use of first names:



Number of Articles

Number of articles
with first names

Proportion (%)

















































Table 1: The increasing use of first names in French sociological articles


In 2010, 182 articles were published in the main journals. 37 articles anonymized the surveyed people with a first name: 20% of the corpus.

Why do French sociologist use first names?

  • (1) Recent sociology textbooks and manuals [I have read 53 methodology textbooks published between 1945 and 2016] recommend first names to anonymize (whereas there was no recommendation for anonymization in older sociology textbooks) but sociologist never write in their article why they chose to use first names instead of another anonymization technic. It has become a routine.
  • (2) First names are increasingly used in French society: beginning in the 1970s first names are increasingly used in professional settings and in various social settings.
  • (3) First names are useful in a narrative context, and the “narrative turn” in French sociology may have increased this use. They establish recurring characters: “Sophie” is more memorable than “interviewee n.37”. First names are also useful as a narrative technic, to differenciate characters within a sociological text : whereas “Baptiste Coulmont” or “Coulmont” would be another sociologist [such as “as Coulmont (2011) shows…”] , “Baptiste” (without a last name) would be an interviewee [“at some time during our conversation, Baptiste stated that…”], and the main author refers to herself/himself as “the sociologist”.
  • (4) Using a first name is a generational marker : “young” sociologists use first names as a routine (that is, sociologists who were “young” in the 1990 and that, increasingly, get involved in the editorial board of these journal) – to establish this, I looked at the journals : the newer the journal is (some were created in the 1950, some in the 1960, some in the 1970…), the larger is the frequency of first names. I also looked at the “prize for the young author” (prix du jeune auteur, best graduate paper): articles written by “young” sociologists use first names at a much higher frequency than articles written by other sociologists.

Who gets a first name?

Because first names are used as marker of familiarity and as marker of hierarchy, it is crucial to understand who gets a first name in the sociological literature. I looked closely at 123 articles published in 2010. 58 articles do not use any pseudonyms (purely quantitative article, purely theoretical articles, or article about historical individuals: Mao Zedong, Charles de Gaulle…). 65 articles refer to individual actors, and among those articles, 33 are using first names.

  1. Surveyed people (interviewees, people met during fieldwork…) getting first names are: “genitally mutilated migrant women”, “farm workers”, “supermarket cashier”, “students”, “women”, “homeless people”, “pupils”, “migrants”, “civil servants”, “young women”, “musicians”, “campaigner / political canvasser”. Very often, those people have very little power.
  2. Surveyed people without a first name are: “high class bourgeois”, “writers”, “supervisors”, “wine-grower”, “high ranking official in the European commission”, “head of service”, “veterinarian”, “engineer”, “manager”, “senior citizen”, “activist”… Mostly, those are people in a power position, often presented as male (or in the French grammatical male formulation: “les ingénieurs”).

In 15 articles, the authors used first names for some surveyed people, and another reference for the other surveyed people. The more power someone has, the less likely he [rarely she] is to get a first name. On the same page, the blue collar workers is assigned a first name, the manager gets “the manager”; children have a first name (“Léa”) parents get a name (“Madame Dupont, la mère de Léa” : “Mrs Dupont, mother of Léa”)

Sociologists (almost) never write that they used first names to refer to people with whom they used first names during their fieldwork. Naming is a “a staging of the methodological self” (une mise en scène de soi): the use of first names to refer to the little guys shows “whose side we are on” (we are close to the little guys, whom we refer to by a first name, we exhibit a distance with the upper class, whom we refer to by a title). But as a consequence domination always appears disembodied: domination is always performed by “managers”, “head of services”, never embodied in a “Jean-Luc”.

Zones de sur-performance

À partir des résultats au premier tour de l’élection présidentielle de 2017, à Paris, on peut tracer cette carte montrant les zones où les différents candidats ont réalisé des scores supérieurs à leur moyenne parisienne.

cliquez pour agrandir

Et voici le code, non commenté. Je commence par repérer où se trouvent les zones de sur-performance (les bureaux de votes). J’extrait du fond de carte parisien les 4 zones distinctes. Je trace ensuite quatre cartes les unes sur les autres.



# le "shapefile" se trouve sur

# frontières des arrondissements
parisarr <- readOGR ("../procurations/paris/arrondissements/parisarr.shp", layer="parisarr")
# les résultats électoraux se trouvent sur
df <- read_csv2("~/Dropbox/procurations/paris/paris-2017/resultats_electoraux.csv")
df <- df %>% filter(`date du scrutin`=="2017-04-23") %>% 
  select(3,4,6,7,8,9,10,12,14,15,16,17) %>% 
  spread(key=`nom du candidat ou liste`,value=`nombre de voix du candidat ou liste obtenues pour le bureau de vote`) %>% 
  mutate(numbv=paste(`numero d'arrondissement 01 a 20`,`numero de bureau de vote 000 a 999`,sep="-"))

res <- df %>% group_by(numbv) %>% 
  summarize(arr=mean(as.numeric(`numero d'arrondissement 01 a 20`)),
            prop_macron=100*MACRON/`nombre d'exprimes du bureau de vote`,
            prop_lepen=100*`LE PEN`/`nombre d'exprimes du bureau de vote`,
            prop_fillon=100*FILLON/`nombre d'exprimes du bureau de vote`,
            prop_melenchon=100*(HAMON+`MÉLENCHON`)/`nombre d'exprimes du bureau de vote`) %>% 

res <- res %>% group_by(type) %>% 
  mutate(sur_rep=valeur/(mean(valeur)+.2*sd(valeur))) %>% # "la moyenne et un peu plus" (.2 écart type)
  filter(sur_rep>1) %>% group_by(numbv) %>% 
  mutate(keep=type[which.max(sur_rep)],valeur_keep=valeur[which.max(sur_rep)]) # on garde le candidat "le plus au dessus" de sa moyenne

# on ne garde pas les bureaux dupliqués
res <- res[!duplicated(res$numbv),]

# extraction des zones-candidats
macron <- subset(paris,paris$id_bv %in% res$numbv[res$keep=="prop_macron"])
lepen  <- subset(paris,paris$id_bv %in% res$numbv[res$keep=="prop_lepen"])
melenchon <- subset(paris,paris$id_bv %in% res$numbv[res$keep=="prop_melenchon"]) # avec le score d'Hamon ajouté
hamon <- subset(paris,paris$id_bv %in% res$numbv[res$keep=="prop_hamon"])
fillon <- subset(paris,paris$id_bv %in% res$numbv[res$keep=="prop_fillon"])

plot(paris) # on commence par "tracer" Paris 

nclr <- 3
plotclr <- brewer.pal(nclr,"Greens")
class <- classIntervals(plotvar[m], nclr, style="fisher",dataPrecision=1)
colcode <- findColours(class, plotclr)

nclr <- 3
plotclr <- brewer.pal(nclr,"Blues")
class <- classIntervals(plotvar[m], nclr, style="fisher",dataPrecision=1)
colcode <- findColours(class, plotclr)

nclr <- 3
plotclr <- brewer.pal(nclr,"Reds")
class <- classIntervals(plotvar[m], nclr, style="fisher",dataPrecision=1)
colcode <- findColours(class, plotclr)

nclr <- 3
plotclr <- brewer.pal(nclr,"Purples")
class <- classIntervals(plotvar[m], nclr, style="fisher",dataPrecision=1)
colcode <- findColours(class, plotclr)

plot(parisarr,add=T,lwd=.1) # on ajoute les frontières des arrondissements
legend(2.232, 48.91,legend=c("Hamon/Melenchon","Le Pen","Fillon","Macron"), fill=c("red","purple","deepskyblue","chartreuse3"), cex=1, bty="n",title="")
title(main="Zone de sur-performance des candidats. Paris. Présidentielles 2017.")
title(sub="Fond : | données : Ville de Paris | Cartographie : B. Coulmont\nZones où les candidats font mieux que leur moyenne",line=-.5,cex.sub=.8)

Et, en bonus, le code, amélioré par Christophe P. :


rep_data_secteurs < - 'DATA/secteurs-des-bureaux-de-vote'
# "../data/2017-listes-paris/secteurs-des-bureaux-de-vote-3/"


# le "shapefile" se trouve sur

# frontières des arrondissements
parisarr <- readOGR ("../procurations/paris/arrondissements/parisarr.shp", layer="parisarr")
# les résultats électoraux se trouvent sur
df <- read_csv2("~/Dropbox/procurations/paris/paris-2017/resultats_electoraux.csv")
df <- df %>% filter(`date du scrutin`=="2017-04-23") %>% 
  select(3,4,6,7,8,9,10,12,14,15,16,17) %>% 
  spread(key=`nom du candidat ou liste`,value=`nombre de voix du candidat ou liste obtenues pour le bureau de vote`) %>% 
  mutate(numbv=paste(`numero d'arrondissement 01 a 20`,`numero de bureau de vote 000 a 999`,sep="-"))

res < - df %>% group_by(numbv) %>% 
  summarize(arr=mean(as.numeric(`numero d'arrondissement 01 a 20`)),
            prop_macron=100*MACRON/`nombre d'exprimes du bureau de vote`,
            prop_lepen=100*`LE PEN`/`nombre d'exprimes du bureau de vote`,
            prop_fillon=100*FILLON/`nombre d'exprimes du bureau de vote`,
            prop_melenchon=100*(HAMON+`MÉLENCHON`)/`nombre d'exprimes du bureau de vote`) %>% 

res < - res %>% group_by(type) %>% 
  mutate(sur_rep=valeur/(mean(valeur)+.2*sd(valeur))) %>% # "la moyenne et un peu plus" (.2 écart type)
  filter(sur_rep>1) %>% group_by(numbv) %>% 
  mutate(keep=type[which.max(sur_rep)],valeur_keep=valeur[which.max(sur_rep)]) # on garde le candidat "le plus au dessus" de sa moyenne

# on ne garde pas les bureaux dupliqués
res < - res[!duplicated(res$numbv),]

# extraction des zones-candidats
extract_zone <- function (name)
    field <- paste0("prop_", name)
    return(subset(paris,paris$id_bv %in% res$numbv[res$keep==field]))

macron <- extract_zone('macron')
lepen  <- extract_zone('lepen')
melenchon <- extract_zone('melenchon') # avec le score d'Hamon ajouté
hamon <- extract_zone('hamon')
fillon <- extract_zone('fillon')

plot(paris) # on commence par "tracer" Paris 

plot_candidate <- function (cand, color)
    nclr <- 3
    plotclr <- brewer.pal(nclr, color)
    class <- classIntervals(plotvar[m], nclr, style="fisher",dataPrecision=1)
    colcode <- findColours(class, plotclr)

plot_candidate(macron, "Greens")
plot_candidate(fillon, "Blues")
plot_candidate(melenchon, "Reds")
plot_candidate(lepen, "Purples")

plot(parisarr,add=T,lwd=.1) # on ajoute les frontières des arrondissements
legend(2.232, 48.91,legend=c("Hamon/Melenchon","Le Pen","Fillon","Macron"), fill=c("red","purple","deepskyblue","chartreuse3"), cex=1, bty="n",title="")
title(main="Zone de sur-performance des candidats. Paris. Présidentielles 2017.")
title(sub="Fond : | données : Ville de Paris | Cartographie : B. Coulmont\nZones où les candidats font mieux que leur moyenne",line=-.5,cex.sub=.8)

Un enthousiasme débordant

« Par procuration, mais pas par défaut » : quelques pages qui décryptent le vote par procuration, à partir des données de l’Enquête électorale française du CEVIPOF (ENEF). Il apparaît bien comme une modalité préférentiellement choisie par des jeunes, des cadres, des diplômés du supérieur…
Mais ce que j’ai trouvé de plus intéressant, c’est le niveau d’intérêt des mandataires, celles et ceux qui reçoivent une procuration : ce sont des enthousiastes. J’imaginais, peut-être un peu naïvement, que les mandants (celles et ceux qui ne peuvent voter et qui font une procuration) étaient les plus enthousiastes (les plus intéressés par la politique en général, les plus décidés à voter, les plus intéressés par l’élection en particulier), notamment parce qu’ils doivent faire la queue, remplir un formulaire, etc… Mais non.
Mais alors pourquoi un tel enthousiasme ?

  • Voter est coûteux (en temps, en déplacement…) pour un rendement faible : que vaut sa toute petite voix individuelle ? Mais le rendement double pour les mandataires : ils sont porteurs de deux voix, la leur et celle de leur mandant. Doublement du rendement. Doublement de l’utilité de son déplacement. Création d’enthousiasme ! C’est la version pour économiste.
  • La confiance accordée par le mandant ou la mandante apporte de la satisfaction. « Vote pour Fillon. Je te fais confiance. » L’échange du secret (celui du vote) a un effet psychologique qui se traduit par une forme d’enthousiasme à l’idée de satisfaire la confiance qui nous a été faite. La version pour psychologue.
  • Le pouvoir détenu sur celle qui nous a donné sa voix pourrait aussi être une des pistes à suivre. « J’ai tout pouvoir sur cette voix. » La version libidinale.
  • C’est un effet de sélection. Face à divers choix possibles, les mandants ont sélectionné celui ou celle qui apparaît la mieux disposée à voter. « Théo BOF ? Non. Léa MOUAIS ? Non. Cléo WAOUH ? Ah oui. » On ne donne qu’aux plus enthousiastes du lot. La version à ne pas oublier.
  • L’enthousiasme préexiste, et il est même à l’origine de la procuration. « Quoi, tu n’es pas là dimanche ? Voter c’est important. En plus Mélenchon il a le meilleur programme ! Sérieusement. C’est facile de faire une procu. Ca te prendra même pas 15 minutes. Tu vois, tu télécharges et hop. T’as plus qu’à aller au commissariat. Non, c’est facile. Je t’y emmène. Là oui, tout de suite ! » La version dispositionaliste.
  • Ce n’est qu’un effet de la composition socio-démographique du groupe des mandataires : un peu plus âgés, plus “cadres sup”, plus diplômés, avec un peu plus d’enfants… que la moyenne. Si l’on compare à composition égale, il n’y a plus de débordement d’enthousiasme. L’enthousiasme n’est ici qu’un mirage. C’est la version toute-chose-égale-par-ailleuriste.

Tant d’hypothèses à tester ! N’est-ce pas formidable ?
Vous pouvez lire l’étude (sans la mise à l’épreuve des hypothèses) sur

Ma vie dans l’EDP (1)

Une demi-journée par semaine, voire un peu plus, je me plonge via Big_Stat à l’INED dans l’Echantillon démographique permanent (EDP). Le but : comprendre “l’inscription ailleurs”, le fait d’être inscrit ailleurs que sur son lieu de résidence. C’est quelque chose de fréquent : cela concerne près d’un.e inscrit.e sur cinq.

Première découverte : l’EDP est découpé en “bases études”. Chaque base-étude contient l’ensemble de l’EDP, pour un millésime donné (avec les informations rétrospectives, recensements, etc…). Mais attention : les identifiants individuels de l’EDP-2012 ne sont pas ceux de l’EDP-2014. Première demi-journée de perplexité, avant de comprendre, et de tout reprendre à zéro.

Deuxième découverte : le lieu d’inscription électorale, quand ce n’est pas le lieu de résidence, n’est pas un lieu abandonné. C’est un lieu investi. Si on n’a pas été radié, c’est qu’on a encore (parfois) des attachements dans ce lieu. Une des bases de l’EDP porte sur les mariages. Et on peut regarder où se marient (en 2014) les personnes qui, en 2014 par exemple, sont “inscrites ailleurs” que sur leur lieu de résidence. Ca fait peu de monde (il faut sélectionner les individus EDP recensés en 2014, français, majeurs, inscrits sur les listes électorales, mais “inscrits ailleurs” que sur leur lieu de résidence, et qui se sont mariés en 2014). Nous partîmes 4 millions, nous arrivâmes 600.

     Femmes Hommes Effectifs
2012 27,5   19,5   600
2014 26,5   19,4   620

J’ai aussi fait le calcul pour 2012 aussi. Un quart des femmes, un cinquième des hommes (inscrits ailleurs et qui se marient) choisissent comme lieu du mariage non pas le lieu de résidence, mais le lieu de l’inscription électorale.

Alors certes, les effectifs ne sont pas énormes. Il faut que je fasse la même opération de sélection avec, par exemple, les recensements de 2008 à 2014. Il faudrait aussi que je travaille sur le lieu de résidence antérieur, ou sur les lieux d’inscription postérieurs au mariage : car le mariage est peut-être le dernier moment d’inscription ailleurs (le moment où certains arrêtent d’être inscrits chez leurs parents et où, enfin, ils s’inscrivent là où ils résident).

Viens chez moi, j’habite chez une copine…

… chantait Renaud il y a quelques années.
Cette chanson relevait, avec humour, qu’un «chez soi», c’est parfois chez un.e autre. Il n’est pas simple de saisir cette forme de résidence, mais on peut l’approcher à partir des listes électorales parisiennes. En effet, un champ, sur ces listes, donne la possibilité d’indiquer que l’on habite « chez Madame Dupont » ou « chez Monsieur Durand », que son nom n’est pas sur la boîte aux lettres, n’est pas sur d’autres documents, mais qu’on est joignable au 45 rue des Fleurs, « chez Madame Durand ».
Ces «chez» sont sur ces fichiers, explorons-les.
Ils ne sont pas nombreux : seulement 1,3% des inscrits. Mais comme il y a beaucoup d’inscrits, ça fait quand même près de 17 000 individus.
On peut voir qu’être “chez quelqu’un d’autre” est le fait des plus jeunes : Entre 19 ans et 40 ans, plus de 1,5% des inscrits ont un chez-soi chez l’autre. Plutôt des femmes, à cet âge. Mais après 35 ans, ce sont les hommes qui sont plus souvent que les femmes dans cette situation.

La proportion diminue avec l’âge, après 24 ans, à mesure qu’on se construit un chez soi chez soi.

Les inscrites qui habitent chez quelqu’un d’autre, pour la moitié d’entre elles, habitent chez un homme. Les inscrits, eux, sont près de 6 sur 10 à habiter chez une femme :

Sexe de la personne inscrite, sexe de la personne hébergeant
Sexe Autre cas Hébergeuse Hébergeur
F 5.7 43.9 50.4
M 6.3 57.1 36.6
Source : Listes électorales

À croire que ces hommes, en effet, “habitent chez leur copine”.

Aux jeunes âges, ce sont surtout des femmes qui habitent chez une femme. Entre 30 ans et 40 ans, la situation la plus fréquente, c’est une femmes qui habite chez un homme. Et après 40 ans, c’est surtout un homme qui habite chez une femme.

Les épreuves classantes nationales : âge, sexe et prestige

Il y a, en France, un concours pour devenir interne en médecine, et les listes des reçus sont publiées au journal officiel chaque année, m’apprend qui a étudié les prénom des reçus.
J’ai récupéré les listes pour les trois dernières années.
Comme dans toute épreuve scolaire, on remarque que les plus précoces réussissent mieux :

En 2016, 50 % les candidats nés en 1993 sont dans le “top 1000”, alors que moins de 5% de ceux qui sont nés en 1988 s’y trouvent.

Mais à la différence des épreuves scolaires, les filles réussissent moins bien les “Epreuves nationales classantes” que les hommes. La pénalité est d’environ une demi-année : les filles réussissent autant que les garçons qui ont six mois de plus qu’elles.

Et cette plus grande réussite masculine est visible si l’on s’intéresse à la proportion d’hommes en fonction du rang de classement. Plus on se rapproche du début du classement, plus les hommes sont représentés : quand il y a 45% d’hommes au total, ils sont 60% dans les tous premiers rangs :

Et cette prime masculine se reproduit année après année.
Il est intéresssant de voir que la proportion d’homme augmente aussi vers la fin du classement, mais pas aux toutes dernières places, où il n’y a plus que 40% de garçons. Les femmes, elles, sont plus fréquemment représentées au milieu du classement.

Est-ce lié au refus de féminiser les internats et les spécialités médicales les plus prestigieuses ? Ou est-ce un effet du rendement inégal du rang de classement entre hommes et femmes ? Ne sachant pas comment ces épreuves sont organisées, je ne peux pas répondre.

Les arrêtés d’affectation sont aussi publié, et l’on peut voir qui choisit quoi en fonction de son rang de classement. Les premiers classés obtiennent ce qu’ils souhaitent. Les dernières classées prennent ce qui reste.

Dans le tableau suivant, par exemple, on peut lire que la spécialité “pédiatrie” est féminisée. Alors que la chirurgie générale (que ce soit à Paris, à Lille ou à Lyon) l’est peu. La colonne “max” indique la position du dernier reçu (50 indique que le dernier reçu était dans les 50% les mieux classés). Cela indique l’attractivité de la Discipline*Région : ainsi pour espérer une place en cardiologie ou en anesthésie, il vaut mieux être bien classé. En revanche, pour avoir psychiatrie, pas de problème. Et si on est bien classé, en général, on ne demandera pas “medecine générale” à Caen : personne parmi les 20% les mieux classés, entre 2014 et 2016, n’a demandé cette spécialité (ce qu’indique la colonne “min”).

Attractivités des spécialités et des régions
Région Spécialité min max N % Hommes
1 Aix-Marseille. pédiatrie 1 51 50 8
2 Ile-de-France. dermatologie et vénérologie 0 76 52 15.4
3 Lyon. pédiatrie 0 73 51 15.7
4 Ile-de-France. pédiatrie 1 76 253 17.8
5 Ile-de-France. gynécologie obstétrique 1 42 94 18.1
6 Lille. pédiatrie 1 49 65 20
7 Nancy. psychiatrie 7 100 52 25
8 Rennes. médecine générale 0 95 322 30.7
9 Besançon. médecine générale 6 100 237 31.2
10 Aix-Marseille. psychiatrie 5 88 76 31.6
11 Grenoble. médecine générale 4 97 328 31.7
12 Lyon. médecine générale 3 98 555 32.4
13 Nantes. médecine générale 3 90 348 33.9
14 Ile-de-France. pneumologie 1 27 58 34.5
15 Montpellier. médecine générale 1 97 475 34.9
16 Angers. médecine générale 4 97 346 35
17 Bordeaux. psychiatrie 15 92 68 35.3
18 Tours. médecine générale 10 100 263 35.7
19 Ile-de-France. médecine générale 0 100 1730 36.1
20 Strasbourg. médecine générale 4 99 413 36.1
21 Bordeaux. médecine générale 0 98 577 36.4
22 Toulouse. médecine générale 1 98 472 38.3
23 Ile-de-France. psychiatrie 2 91 308 38.6
24 Nice. médecine générale 2 95 247 40.1
25 Saint-Etienne. médecine générale 4 97 234 40.2
26 Aix-Marseille. médecine générale 4 99 653 40.3
27 Clermont-Ferrand. médecine générale 2 100 258 40.7
28 Nancy. médecine générale 17 100 398 40.7
29 Toulouse. psychiatrie 2 96 73 41.1
30 Lyon. psychiatrie 4 75 72 41.7
31 Ile-de-France. médecine interne 0 27 93 41.9
32 Ile-de-France. médecine du travail 29 100 57 42.1
33 Brest. médecine générale 6 99 284 42.3
34 Ile-de-France. gastro-entérologie et hépatologie 0 27 66 42.4
35 Lille. psychiatrie 6 93 120 43.3
36 Rouen. psychiatrie 15 98 62 43.5
37 Ile-de-France. biologie médicale 4 99 55 43.6
38 Ile-de-France. oto-rhino-laryngologie et chirurgie cervico-faciale 2 28 55 43.6
39 Rouen. médecine générale 12 100 296 43.6
40 Ile-de-France. neurologie 0 29 64 43.8
41 Poitiers. médecine générale 5 96 368 43.8
42 Lille. médecine générale 1 99 715 43.9
43 Océan-Indien. médecine générale 13 97 169 45
44 Reims. médecine générale 17 100 236 46.6
45 Limoges. médecine générale 10 100 130 46.9
46 Caen. médecine générale 20 100 271 47.6
47 Antilles-Guyane. médecine générale 8 96 212 49.1
48 Dijon. médecine générale 8 100 244 50.4
49 Ile-de-France. oncologie 0 34 76 52.6
50 Poitiers. psychiatrie 6 99 57 54.4
51 Amiens. médecine générale 16 100 246 54.9
52 Ile-de-France. ophtalmologie 0 47 90 55.6
53 Ile-de-France. radiodiagnostic et imagerie médicale 0 22 155 56.1
54 Lyon. anesthésie-réanimation 0 23 50 58
55 Ile-de-France. cardiologie et maladies vasculaires 0 21 141 58.9
56 Montpellier. chirurgie générale 1 51 61 59
57 Lille. anesthésie-réanimation 1 38 60 60
58 Ile-de-France. anesthésie-réanimation 0 41 193 60.6
59 Ile-de-France. santé publique 3 97 51 62.7
60 Ile-de-France. anesthésie réanimation 0 39 92 66.3
61 Lille. radiodiagnostic et imagerie médicale 0 22 57 66.7
62 Lyon. chirurgie générale 2 44 64 67.2
63 Lille. chirurgie générale 1 50 96 67.7
64 Aix-Marseille. chirurgie générale 0 52 66 68.2
65 Ile-de-France. chirurgie générale 0 72 190 68.4
Source : Légifrance

Et un bonus pour celles et ceux qui sont arrivés jusqu’ici : la proportion de candidats “précoces” (qui ont au moins un an de moins que le gros du peloton) par spécialité. 17% des internes en “néphrologie” sont des précoces, et ce n’est que 2,7% des internes en médecine générale (les plus nombreux).

Proportion de candidats précoces
Spécialité % précoces Effectif
santé publique 1.4 222
médecine du travail 1.7 293
médecine générale 2.8 11027
biologie médicale 3.2 339
médecine physique et de réadaptation 3.2 311
endocrinologie, diabète, maladies métaboliques 3.3 246
psychiatrie 3.4 1546
gynécologie-obstétrique 4.7 214
anesthésie réanimation 6.1 460
chirurgie générale 6.4 1260
oncologie 6.6 392
cardiologie et maladies vasculaires 7.1 644
pneumologie 7.1 366
pédiatrie 7.3 995
gynécologie obstétrique 7.5 456
anesthésie-réanimation 8 922
rhumatologie 8.1 271
neurologie 8.6 373
radiodiagnostic et imagerie médicale 9 787
gastro-entérologie et hépatologie 9.1 397
dermatologie et vénérologie 9.4 299
oto-rhino-laryngologie et chirurgie cervico-faciale 9.5 262
ophtalmologie 12.6 461
médecine interne 14.7 409
néphrologie 17 265
Source : Légifrance

La « mise au pas » de l’Annuaire statistique

zilsel-couv-1Le premier numéro de la revue Zilsel publie un article de Everett C. Hughes que j’ai traduit il y a quelques années : La Gleichschaltung de l’Annuaire statistique allemand.
Dans cet article datant du début des années 1950, le sociologue étatsunien étudie les conséquences de l’arrivée au pouvoir des Nazis sur la production statistique allemande. Il se concentre particulièrement sur les modifications des catégories religieuses et raciales.
C’est un article que j’apprécie fortement. Hughes s’intéresse d’abord aux données statistiques parce qu’elles lui apprennent des choses sur l’Allemagne : les différentes éditions de l’Annuaire statistique permettent de repérer l’Aryanisation de l’Allemagne. Mais il s’intéresse aussi aux marges de manoeuvre des statisticiens : si leur “mandat” est la description quantifiée du monde sociale, ils ont une certaine “licence” au détachement du politique. On remarque ainsi, dans cet article, la place particulière que joue la Prusse, jusque 1939. Mais cette licence s’efface progressivement : les statisticiens sont, au fil des années, “mis au pas” (gleichgeschaltet).

Hétéro ?

Vous parcourez peut-être ces lignes parce que vous venez de lire le billet publié dans Le Monde, dans le cahier « Science & Médecine » du mercredi 15 décembre 2016, et que vous avez voulu en savoir un peu plus ?
Pour écrire cette chronique, je me suis principalement appuyé sur l’ouvrage de Jane Ward, professeure à l’Université de Californie, Not Gay. Sex between Straight White Men. L’ouvrage repose sur un paradoxe : l’existence d’interactions sexuelles, génitales, entre hommes hétérosexuels. Je vous invite — si vous lisez l’anglais — à lire son livre.
Ward est loin d’être la seule à étudier ainsi l’hétérosexualité masculine. C’est ce que faisait en partie George Chauncey, dans Gay New YorkBud-Sex: Constructing Normative Masculinity among Rural Straight Men That Have Sex With Men».
Toutes ces études montrent par l’exemple que les frontières sociales et symboliques entre homosexualité et hétérosexualité donnent naissance à des pratiques de “boundary crossing” (de traversée des frontières), de “boundary blurring” (de floutage des frontières) et de “boundary brokering” (de négociation des frontières)…
En envoyant la chronique au journal, j’ai demandé un commentaire à Mathieu Trachman. Parce que sa lecture aide à mieux comprendre mon texte, je la reproduits ci-dessous

Tu prends la question des frontières pour monter en généralité, c’est une bonne idée, mais ensuite tu insistes plus sur les processus de catégorisation. La référence à l’actualité est tentante, elle tend sans doute à mettre en regard de situations plutôt différentes (frontières de l’espace public, frontières entre groupes sexuels,
rapport clivé à soi-même…). Par exemple, partir du triptyque pratique / attirance / identification et de ses non recoupements serait plus simple, mais moins accrocheur…

D’une certaine manière, ce qui est premier, ce ne sont pas les frontières, c’est le soupçon d’homosexualité – ce qui permettrait de faire allusion implicitement à toutes les rumeurs circulant sur l’homosexualité de tel ou tel personnage public ?

Ces hommes jouent avec les catégories si tu veux, ils les reconduisent largement : j’insisterai plus sur le genre et la masculinité, dans un contexte où les pratiques sexuelles entre hommes sont spontanément codées comme une identité ou un désir profond. Et l’homosexualité ne se définit pas uniquement par des actes, une identification, c’est sans doute aussi des codes, une culture… Ce qui est aussi présent chez Chauncey.

Je parlerai moins d’excuses (ce qui pourrait laisser entendre qu’ils sont “en fait” gays ou qu’ils n’assument pas leurs désirs) que de justifications que le système sexuel et sexué impose, qu’ils le veuillent ou non. De plus, c’est difficile de saisir si la prolifération des catégories est un effet de ce système ou une manière plus juste et plus précise de saisir des identifications et des désirs.

Toutes ces remarques sont extrêmement pertinentes, notamment parce qu’elles pointent la complexité des catégories d’orientation sexuelle, faites de culture, de désirs, d’opportunités, de contraintes, d’identification, de pratiques, de genre… Mais en 3700 caractères (la taille de la chronique), il est était difficile de déployer toutes ces dimensions. D’où ce petit billet.

Le petit remplacement : note sur la fécondité des nobles (d’apparence)

À la fin du XIXe siècle, les bébés à particule ne représentaient que 0,4% des naissances. À la fin du XXe siècle, 100 ans après, ils représentent 0,9% des naissances. Comment expliquer cela ? Une hypothèse, c’est de dire que les “de Souza” ont remplacé les “de Rochechouart”, et qu’on n’est même plus chez nous en France, hein !
Mais il semble que d’autres hypothèses moins farfelues soient envisageables, ma bonne dame, si seulement vous étiez moins xénophobe.
Je commence par retenir les noms de famille n’apparaissant qu’une seule fois dans les naissances de la fin du XIXe siècle : entre 1890 et 1914, ces familles n’ont produit qu’un seul bébé. J’examine ensuite combien de bébés sont produits vers 1980, en comparant les noms à particule et les autres noms. La méthode est grossière, mais elle permet probablement de comparer la fécondité des descendants de noms très rares, présents en France à la fin du XIXe siècle, à celle des personnes portant un tel nom rare à la fin du XIXe siècle.

Pour être plus précis : Prenons les familles qui n’ont qu’un seul enfant à la fin du XIXe siècle, qui ont moins de 5 enfants 25 ans après, moins de 17 50 ans après et moins de 64 75 ans après. C’est une manière de retenir principalement les familles qui n’augmentent pas grâce à l’immigration mais surtout par la fécondité naturelle (en produisant au maximum 4 enfants tous les 25 ans).
7732 familles “nobles” correspondent à ce cas. Lors de la dernière période, elles ont produit 8238 enfants, soit une croissance de 1,06.
Les familles non-nobles sont plus nombreuses. Mais en fin de période, elles n’ont plus que 0,81 enfant pour chaque enfant produit à la fin du XIXe siècle. (Pour repérer cela, et avoir une idée du rapport plus élevé des nobles d’apparence, je prends 3000 échantillons de non-nobles de même taille que la population des familles à particule d’un même niveau de rareté).

Cliquez pour agrandir

De la même manière, comparons les familles qui, à la fin du XXe siècle, ont 2 enfants (puis moins de 9, moins de 33 et enfin moins de 129). Les “nobles” se retrouvent avec 1,6 enfants pour chaque enfant de la fin du XIXe, les non nobles avec seulement 1,3 enfants.
Un dernier exemple : les familles qui démarrent avec 3 enfants : si elles ont une particule, elles produisent en fin de période 1,9 enfant pour chaque enfant; les familles sans particules n’en produisent que 1,4. Avec 4 enfants : 1,9 pour les nobles, 1,4 pour les manants.

Dans tous les cas, les familles à particule présentes en France à la fin du XIXe siècle et très rares semblent avoir une fécondité plus importante que les familles sans particule. Ou alors elles arrivaient mieux à transmettre leurs noms (mais comment le feraient-elles ?). Est-ce parce qu’elles se trouvent, plus souvent, au sommet de l’échelle sociale et qu’elles disposent d’un patrimoine plus fourni ? Qu’elles sont plus souvent que de coutume catholiques ? Qu’elles connaissent une mortalité infantile moindre ?

Les grandes familles sont des familles nombreuses (du moins un peu plus nombreuses).

Un autre indice des différences de fécondité peut être calculé à partir de la proportion de noms qui disparaissent, qui cessent de produire des bébés.

cliquez pour agrandir

80% des noms sans particule très très rares à la fin du XIXe siècle ne produisent aucun bébé à la fin du XXe siècle. Ce n’est le cas que de 75% des noms à particule aussi rares. La différence est faible, mais elle signifie que les noms à particule très rares il y a 100 ans se maintiennent mieux sur la distance : et la comparaison entre nobles d’apparence et manants d’apparence est toujours au profit des gens à particule.

Note finale : n’étant pas démographe, il est fort possible que ma lecture et mon analyse du fichier des patronymes soit une hérésie.

Namyboo… et recommander des prénoms

Pour aider les futurs parents à choisir un prénom, maintenant qu’ils peuvent choisir n’importe lequel des prénoms qu’ils aiment, il existe des livres, les conseils des grands-parents, des forums… etc. Et un site ( qui aide dans le processus lui-même, en permettant aux parents de dresser une liste ordonnée de prénoms sur lesquels ils s’accordent.

Si j’aime ça, j’aimerai ça est un nouveau site permettant aux parents angoissés de trouver un prénom qu’ils aiment. Plusieurs dizaines de milliers d’individus y ont déja cherché un prénom. Le principe est simple : après avoir sélectionné des listes thématiques de prénoms, il suffit de cliquer “j’aime / je n’aime pas”, puis de classer les prénoms entre eux. Le créateur du site m’a donné accès à un extrait, entièrement anonymisé, des choix réalisés par quelques dizaines de milliers d’internautes.

On peut considérer que deux prénoms sont liés entre eux quand plusieurs personnes les ont appréciés tous les deux. C’est ainsi que “Margaux” et “Margot”, logiquement, se trouvent reliés. Mais quels autres prénoms sont appréciés des Margophiles ? et des Marceauphiles ?

cliquez pour agrandir

Le graphique précédent – qui ne représente qu’une petite partie du réseau de relations entre prénoms – colorie de la même couleur des prénoms qui sont proches, souvent appréciés ensemble ou appréciés par des personnes qui apprécient un prénom proche (j’ai comparé avec la matrice d’indépendance pour faire ressortir les liens forts). Mathis, Dorian et Julian se trouvent dans le même groupe. Augustin, Octave et Charles dans un autre. C’est Quentin qui les relie. On voit aussi ici que Margot est plus proche de Jeanne que de Margaux.

La structure principale reste l’opposition entre prénoms de garçons et prénoms de filles : la recherche d’un prénom est avant tout la recherche d’un prénom “pour un garçon” ou d’un prénom “pour une fille”.

Un amour conditionnel

Un autre calcul est possible : regarder, pour chaque prénom, les prénoms appréciés par au moins un tiers des individus qui apprécient ce prénom. Dans le tableau suivant, on voit que plus d’un tiers de ceux qui apprécient Augustin apprécient Arthur, Jules et Louis. Mais que les fans d’Arthur préfèrent Louis et Jules à Augustin. Les appréciations ne sont pas symétriques : on peut “prédire” qu’un Augustinophile moyen aura Arthur en second choix, et aussi prédire qu’un Arthurophile n’aura pas Augustin en second choix.

prénom apprécié autres prénoms aussi appréciés
Arthur Louis; Jules; Gabriel
Adam Gabriel
Augustine Joséphine; Léonie; Célestine
Alan Liam; Maël; Léo
Milan Eden
Augustin Arthur; Jules; Louis
Guillemette Aliénor; Blanche; Suzanne
Milane Eden; Lila; Mila
Quitterie Éléonore; Alix; Domitille
Doriane Oriane; Romane; Roxane
Addison Emery; Camélia; Jamie
Adama Kobe; Ada; Enu

On peut alors dessiner le réseau des voisins de tel ou tel prénom (ici, je retiens jusqu’aux voisins d’ordre deux, les voisins des voisins). Les flèches vont du prénom initial vers le prénom aussi apprécié. Les futurs parents qui apprécient Loana n’apprécient pas tout à fait les mêmes prénoms que les parents qui sont fans de Quitterie, Amicie ou Guillemette.

cliquez pour agrandir

cliquez pour agrandir

Mais comme on peut le constater, un groupe de prénoms, Louise, Alice, Rose… sont des prénoms souvent “appréciés aussi”, quel que soit le prénom de départ. Ils constituent des attracteurs de choix qu’un bon système de recommandation ne devrait pas proposer – ils sont déjà dans la tête des parents.

Chez les garçons, Gabriel, mais aussi Arthur et Adam forment un tel attracteur.

cliquez pour agrandir

cliquez pour agrandir présente les prénoms dans des “silos” : par genre et par thème. Le site ne proposera pas des prénoms turcs, par exemple, si l’internaute n’a pas présélectionné ce groupe de prénoms, sauf si, par hasard, quelques prénoms “turcs” se trouvent dans un autre groupe (par exemple le groupe des prénoms donnés à Paris). Il est évident que cela structure l’expression des préférences des internautes-futurs-parents (et donc les réseaux ici présentés, qui reflètent en partie ces silos).