Categories

Archives

En cas d’absence : la procuration

La Revue française de science politique vient de publier «In absentia. Le vote par procuration, une participation électorale à distance?» un article dans lequel, à partir des données de l’Enquête participation électorale 2017 (Insee), j’étudie le recours inégal à la procuration, lors de l’élection présidentielle et des élections législatives de 2017.

Cette modalité de vote accroît les inégalités de participation. Tout d’abord parce que c’est une modalité complexe, qui demande du temps et une familiarité avec les procédures administratives dérogatoires, et que les individus dont les ressources sociales (temps, niveau de vie, diplôme, profession…) sont limitées y ont peu recours. Mais aussi parce que donner sa voix à un truchement de confiance nécessite un réseau de relation mobilisable (et mobilisable électoralement) : et là, il semble bien que si les personnes les plus dotées en ressources arrivent à mobiliser leur réseau à distance, ce n’est pas le cas des moins dotés. Suite à un déménagement, les cadres multiplient le recours à la procuration, alors que les ouvriers — qui votaient déjà peu par procuration — voient leur recours à la procuration divisé par trois.
J’ai essayé de développer aussi un autre thème dans l’article — c’est le point d’interrogation final. Le vote par procuration est certes une modalité fréquente dans les classes supérieures, mais c’est une forme de délégation. Que se passe-t-il finalement quand l’habitude est prise, jeune, de déléguer son vote — à ses parents ? Est-ce que cela se convertit en vote physique — avec déplacement au bureau de vote — plus tard, ou est-ce une première étape vers un désengagement bourgeois, un vote à distance qui deviendrait, au fil du temps, une distance au vote, une abstention ?
L’article est disponible sur cairn.info, et d’autres informations le sont sur la page du site consacrée à l’article

Prénoms et mention, édition 2020

Les résultats nominatifs au bac 2020 ont été publiés hier. Ce millésime est particulier : l’épidémie de covid19 a empêché les épreuves habituelles, et ce sont les notes harmonisées du contrôle continu qui ont servi de notes au bac.
Cela ne semble pas avoir modifié la distribution des mentions par prénom (ci-dessous, pour les bacs généraux et technologiques). En gros, pour tout le monde (ou presque, ça reste à calculer), la fréquence d’accès à la mention très bien a été multipliée par 1,5. Mais les prénoms qui avaient peu accès à la mention « très bien » en 2019 ou 2018 n’ont — comparativement au reste — pas vu leur position dans le nuage se déplacer.

 

cliquez pour agrandir (sinon ce n’est pas très lisible)

Pour les années précédentes, voir l’édition 2019, ou l’édition 2018, 2017, ou en 2016 ou encore en 20152014,2013, 2012 ou 2011. Vous pouvez aussi lire Sociologie des prénoms (édition La Découverte) [sur amazon, dans une librairie indépendante].

Économies d’échelles : couples et professions

Vivre à deux est économique : il est possible d’économiser sur le logement par exemple (une chambre pour deux), ou sur la voiture (une pour deux). Il est aussi possible d’accumuler des ressources : ce n’est pas la même chose d’être en couple avec un.e conjointe « inactif.ve » (c’est à dire quelqu’un qui n’est ni en emploi, ni au chômage) ou en emploi.
Or tout le monde n’est pas en couple, ni en couple avec un.e conjoint.e en emploi. On peut le constater en explorant le Fichier détail du recensement 2016.

Le graphique suivant se concentre sur les hommes et les professions ayant les plus gros effectifs masculins.

Tout en haut, les hommes ayant déclaré être serveurs. Environ 60% d’entre eux ont déclaré ne pas être en couple cohabitant (voir la définition). Par comparaison, ce n’est le cas que de 25% environ des professeurs du secondaire. 15% environ des ouvriers non qualifiés du gros oeuvre du bâtiment, des maçons qualifiés (ouvriers), des artisans maçons ou des nettoyeurs ont des conjointes « inactives » (moins de 5% pour les professeurs du secondaire, les agents de police, ou éducateurs sportifs). Plus de 15% des cadres commerciaux des PME, des cadres des services administratifs des PME, des artisans maçons et des artisans peintres en bâtiment ont des conjointes qui exercent à temps partiel.
 

cliquez pour agrandir

Penchons-nous maintenant sur des professions aux effectifs masculins un peu moins nombreux. Ce que l’on voyait déjà sur le graphique précédent (des employés et des ouvriers plus souvent célibataires ou avec des conjointes inactives, au chômage ou à temps partiel) se répète sur celui-ci. Les professeurs des écoles, comparés aux ouvriers non qualifiés de type artisanal, sont moins souvent célibataires, et très peu d’entre eux ont une conjointe inactive.


cliquez pour agrandir

Et au milieu… les médecins libéraux généralistes. Plus de 15% d’entre eux ont une conjointe « inactive », 20% une conjointe qui exerce un emploi à temps partiel. Peu d’entre eux déclarent ne pas être en couple.

Si l’on place en abcisses la proportion d’hommes “célibataires” (c’est à dire pas en couple selon la définition de l’insee) et en ordonnées la proportion de conjointes inactives, au chômage ou à temps partiel (uniquement pour les hommes en couple), voici le graphique qui apparaît :


cliquez pour agrandir

En rose, et dans le quadrant nord-est, les ouvriers. Les employés sont plutôt au sud-est : une fréquence importante de célibataires, mais leurs conjointes sont moins souvent “inactives, à temps partiel ou au chômage”. Les artisans sont dans le quadrant ouest/nord-ouest : peu de célibataires, mais une proportion assez élevé de conjointes sans emploi ou à temps partiel. En vert, les cadres : souvent en couple, et en couple avec une conjointe qui n’est pas inactive, au chômage ou à temps partiel. Les médecins généralistes ressemblent, sur ce point, à des “artisans, commerçants, chefs d’entreprise”.

Au final, donc, des situations très différentes suivant les professions individuelles, ce qui inciterait à concevoir — encore plus qu’on ne le fait habituellement — la position sociale à l’échelle du ménage (voir par exemple cet article récent). Ou alors à garder en tête que derrière un médecin, il y a souvent une conjointe, et une conjointe avec du temps, que derrière un ouvrier non qualifié, il n’y a souvent pas de conjointe (du moins, plutôt, pas de conjointe avec qui l’ouvrier cohabite, ce qui est différent), et que derrière un professeur (des écoles ou du secondaire), il y a souvent une conjointe en emploi. Et donc des possibilités d’économie, ou d’épargne, bien différentes.
Une partie de ces différences est due à la distribution par âge de ces professions : les serveurs sont plutôt jeunes. Une autre au poids des immigrés : s’ils habitent en France au moment du recensement mais que leur conjointe est au Portugal ou en Pologne, sont-ils considérés comme vivant en couple ?

[Note : j’ai considéré que les “étudiantes” n’étaient pas “inactives”, ni au chômage, ni à temps partiel. Les positions changeraient un peu si j’avais inclus les étudiantes dans la catégorie inactive, au chômage ou à temps partiel.]

2020 : une mortalité spécifique

Dans le cadre de l’épidémie de covid19, l’INSEE a décidé de publier, chaque semaine, le nombre de décès quotidien des semaines précédentes, avec une partie des informations que l’on trouve dans le Fichier des personnes décédées, récemment déposé sur data.gouv.
Ces informations, publiées quasiment en « temps réel », permettent de visualiser la hausse de la mortalité en mars-avril 2020 par rapport aux années précédentes.
Le graphique suivant représente le nombre de décès quotidiens de 2001 à 2019 (en grisé) et le nombre de décès en 2020 (en rouge). En règle générale, le nombre de décès est élevé l’hiver, diminue régulièrement jusque vers juillet-août, pour ré-augmenter à l’automne. Les décès causés par la vague de chaleur de 2003 sont particulièrement visibles : pendant trois semaines, les décès avaient été bien plus nombreux que la moyenne, et pendant une dizaine de jours supérieurs au maximum des années 2001-2019.
Comme on peut le constater aussi, l’année 2020 avait commencé comme une année on ne peut plus normale : les décès quotidiens se trouvaient très proches de la moyenne.


cliquez pour agrandir

Ce graphique permet déjà de se faire une idée de l’importance de la pandémie : à partir de début mars 2020 et pendant un mois, la courbe de l’année (en rouge) s’écarte de la moyenne. À partir de début avril, un peu plus de deux semaines après le début du Confinement, le nombre de décès commence à diminuer. On constate la rapidité et la brutalité de l’augmentation au regard des autres épisodes épidémiques. Car on peut aussi mettre en lumière des épisodes de grippe particulièrement meurtriers au cours des années récentes, comme en 2015, 2017 et 2018, quand la courbe des décès quotidiens s’écarte, pendant plusieurs semaines, de la courbe moyenne. [Même s’il faudrait tenir compte de l’augmentation de la population française : il y a bien plus de résidents en 2018 (65 millions) qu’en 2001 (60 millions).] Tous ces décès “en plus” n’ont pas pour origine des grippes, mais, comme l’illustre Arthur Charpentier, ces données permettent d’estimer la surmortalité.


cliquez pour agrandir

On peut aller un peu plus loin, au risque de rendre le graphique moins clair. Tout d’abord on peut prendre en considération la sous-estimation du nombre de décès, dans les chiffres publiés par l’INSEE en « temps réel » : les chiffre publiés en “semaine 1” sont révisés à la hausse en “semaine 2”, et encore en “semaine 3”. Dans le graphique, il est donc très probable que le nombre de décès entre les 7 et 14 avril 2020, publié aujourd’hui, soit revu à la hausse la semaine prochaine : je vais m’appuyer sur les révisions passées pour estimer un nombre définitif. Dans le graphique suivant donc, le nombre de décès estimé — toutes causes de décès confondues — est en rouge pointillé.
On dispose aussi des décès suite à la covid19 recensés par les hôpitaux et les établissements d’hébergement pour personnes âgées dépendantes (Ehpad) : le nombre de ces décès est publié chaque jour, et on peut les récupérer sur le site de l’European Centre for Disease Prevention and Control, ce qui peut nous indiquer la tendance entre le 15 et le 24 avril 2020. Ces données (lissées par une moyenne mobile hebdomadaire) sont représentées en vert sur le graphique suivant. On constate un décalage : les chiffres hospitaliers sont publiés rapidement, ceux des Ehpad plus lentement, avec plusieurs jours de décalage.


cliquez pour agrandir

Au final, il y a eu, en mars et jusqu’au 24 avril 2020, plus de 29 300 décès en plus de la moyenne (mais comme c’est une moyenne bi-décennale, elle prend en compte des populations moins nombreuses).

Mourir, une activité comme une autre ?

Mourir, ça semble être une activité sociale comme une autre. Avec les petits problèmes posés par les difficultés à interroger les personnes ayant accompli cette activité.
On ne meurt donc pas tout à fait au même moment suivant l’âge et la période :


cliquez pour agrandir

Alors certes, sur le graphique précédent, les demi-savants vont me dire “l’axe des ordonnées ne commence pas à zéro”, et cette visualisation laisse croire à des écarts plus importants qu’en réalité. Mais certaines tendances sont intéressantes : mis à part entre 10 et 39 ans, on meurt moins le week-end qu’en semaine, parce qu’on meurt aujourd’hui “à l’heure de l’hôpital”. On meurt le week-end quand on meurt d’un accident de voiture, mais les politiques visant à réduire l’alcoolisme au volant semblent, depuis les années 1970, avoir une certaine efficacité… au sens où la distribution s’égalise dans la semaine.

Si, au lieu de s’intéresser à la base des décès, on s’intéresse à la base des accidents de la circulation (qui recense les personnes décédées mais aussi les personnes blessées ou non), on peut aussi distinguer des variations suivant l’heure de l’accident.


cliquez pour agrandir

L’âge moyen des personnes accidentées varie de 30 ans vers 3 heures du matin (les vieux dorment, à cette heure là) à 46 ans vers 10 heures du matin (les jeunes sont occupés, à l’école ou au travail). Et si l’on distinguait par jour de la semaine, on verrait que l’âge moyen passe nettement sous les 30 ans dans la nuit du vendredi au samedi, et du samedi au dimanche.

Sources : Fichier des personnes décédées (sur data.gouv.fr) et Base de données accidents corporels de la circulation (aussi sur data.gouv.fr). Code R sur Github

Le deuxième prénom et la mention « très bien »

Entre 2012 et 2018, 9,64% des candidates et candidats au bac (général ou techno) ont obtenu la mention “Très bien”. Ce fut le cas de 8,92% des candidats et candidates qui n’avaient qu’un seul prénom, et 10,5% des candidat.e.s avec 2 prénoms ou plus. Un écart de 1,5 points. Ou 17% en plus. Ou un ratio de 1,17..

Bien entendu, ce n’est pas le prénom en lui-même qui joue : les copies sont anonymes. Et le second prénom est le plus souvent invisible : de qui connaissez-vous tous les prénoms ? Mais la probabilité d’avoir plusieurs prénoms n’est pas aléatoirement répartie sur l’espace social. Pour dire bref, les parents du haut de l’échelle sociale donnent plus fréquemment plusieurs prénoms à leurs enfants. 40% des Jessica ont plus d’un prénom, c’est le cas de 59% des Apolline. Et c’est une pratique à laquelle n’ont pas souvent recours les immigrés d’Afrique du nord (ou leurs descendants ?) : Seuls 10% des Yassine ont plus d’un prénom.

Cependant, l’effet associé aux prénoms multiples n’est pas restreint aux classes supérieures, bien au contraire.

Comme le montre le graphique suivant (restreint aux prénoms les plus fréquents), « l’effet » du prénom multiple est plus “fort” pour les prénoms des candidats qui ont peu de mention Très bien… mais c’est aussi parce que passer de 3% à 4% c’est un ratio de 1,33% en plus, alors que passer de 15% à 17%, c’est à peine un ratio de 1,15. [On pourrait regarder la différence : et là, on verrait que « l’effet » est de 0,5 points en plus quand les candidats ont 3% de mention TB et d’environ 1 points quand ils (et elles) ont 10% de mention… pour retomber à 0,5 points autour de 20% de mention TB.

prénoms multiples
cliquez pour agrandir

Ce graphique est construit en prenant en abscisse la proportion de mention TB pour les candidats n’ayant qu’un seul prénom, et en ordonnée j’ai représenté le rapport entre cette proportion et la proportion de mention pour les candidats ayant plus d’un prénom. Un exemple : Lina : 9,8% des “Lina tout court” ont une mention TB, mais c’est 15,4% quand elles ont plus d’un prénom. D’autres prénoms ressemblent à Lina : Adam, Yassine, Anissa, Sofiane, Myriam, Sonia… où la présence d’un second prénom multiplie le taux d’accès à la mention “Très bien”. Les « Anissa-avec-un-second-prenom » ne sont pas tout à fait comme les « Anissa-tout-court » (elles préparent un peu plus souvent un bac S, et leur second prénom, assez souvent, n’est pas Aïcha mais Claire ou Aurore) : elles n’ont pas les mêmes parents.

On sait que la proportion de candidat.e.s obtenant la mention “Très bien” diffère suivant les prénoms. Jennifer a moins de mention qu’Adèle. Et une Adèle qui aurait comme second prénom Jennifer ? Ou une Jennifer qui aurait comme second prénom Adèle ? Est-ce que le fait d’avoir un second prénom est toujours associé à un surplus de mention «Très bien»?

Dans le graphique suivant, pour les prénoms les plus fréquents, je différencie les seconds prénoms. Prenons Anissa. Trois cas se présentent : 1- son second prénom est un prénom qui (quand il est en première position) est associé à une proportion plus faible de mention « Très bien » qu’Anissa (1,2 fois moins), 2- son second prénom est un prénom qui est associé à une proportion presque égale, et 3- son second prénom est un prénom qui est associé à une proportion bien plus importante de mention très bien (1,2 fois plus). [Je laisse de côté les seconds prénoms qui ne sont jamais présents en première position.]

prénoms multiples, bac
cliquez pour agrandir

On ne voit pas de différence liée au type de second prénom quand la proportion de mentions TB est faible ou élevée. Mais on voit des différences entre 7 et 15% d’accès à la mention. Là, (pour dire bref, et en prenant un exemple fictif) «Camille Cindy», «Camille Chloé» et «Camille Adèle» vont avoir des proportions variées d’accès à la mention : si 10% des “Camille tout court” accèdent à la mention TB, c’est le cas de 9% des “Camille Cindy”, 11% des “Camille Chloé” et 12% des “Camille Adèle”.

Si l’on fait l’hypothèse que les parents, en choisissant un prénom pour leur enfant, cherchent à indiquer quelle place ils occupent dans l’espace social, alors ces mêmes parents se servent aussi du second prénom pour indiquer une position un peu plus précise. Ou alors on peut penser que le choix du prénom est avant tout le résultat d’une lutte entre parents pour imposer un choix individuel : le second prénom alors est le prénom “perdant” : « Il voulait Adèle, mais c’est moche, Adèle. Je préfére Lina. On a mis Adèle en deuxième. ». Mais sans information sur les deux parents, difficile d’aller plus loin.

Quels prénoms les immigrés (et leurs descendants) donnent-ils à leurs enfants ?

Vous arrivez peut-être ici après avoir lu le numéro de Population et Sociétés publié aujourd’hui, et vous souhaitez en savoir plus.
Le format de Population et Sociétés, 4 courtes pages, est parfait pour résumer des recherches, mais laisse parfois sur sa faim. Voici ce que je souhaite ajouter.
 
Le score de distance :
Tout d’abord, avec Patrick Simon, nous étudions les choix des prénoms de deux manières. Une première (centrale dans l’article) consiste à classer les prénoms en grandes zones nationales/culturelles/religieuses en fonction de leur structure syllabique. Une deuxième manière (moins utilisée dans l’article) consiste à calculer, pour chaque prénom, un score, variant entre zéro et 100, en fonction de la proportion relative des prénoms dans deux groupes : celui des enfants dont les deux parents sont nés en France, et celui des enfants dont un des parents au moins est né hors de France. Ce score, utilisé assez souvent depuis une quinzaine d’années, permet de repérer les prénoms que portent les enfants de natifs et les prénoms que portent les autres enfants. Un score de 75 indique que le prénom est trois fois plus fréquent dans le groupe des enfants de natifs que dans le deuxième groupe. Un score proche de zéro indique que ce prénom n’est presque jamais choisi par deux parents nés en France pour leur enfant.
Prenons les Sabrina. 0,2% des Sabrina sont enfant de couples nés en France, mais 1% des Sabrina sont enfant de couples dont un des membres est né à l’étranger. Le score du prénom Sabrina sera 100 * 0,2 / (1+0,2), soit 17.
Dans le cas des Océane, les chiffres sont 0,8% (couples nés en France), et 0,1% (couples dont un des membres est né à l’étranger). Son score est donc 100*0,8/(0,8+0,1), soit 89.

Voici le score moyen des prénoms portés par les immigrés, les descendants d’immigrés, les enfants de descendants d’immigrés et la “population majoritaire” (et ses descendants) :

Ce score est intéressant en lui-même, mais aussi en comparaison avec la classification “syllabique” des prénoms. Avec la classification des prénoms, on peut constater par exemple (c’est le graphique 1 dans le Population et Sociétés), que les Français sans origine migratoire directe (la “population majoritaire”) donne de moins en moins souvent des prénoms français à ses enfants : Erwan, Kilian, Clara, Enzo… ont remplacé les prénoms des Saints, ou les prénoms fréquents au XIXe siècle, ou les prénoms “qui sonnent français”. Quel que soit l’indice retenu, on constatera l’abandon, par les Français sans origine migratoire directe, du registre des prénoms français. Cela se fait au profit du registre “latin”, du registre “anglo”, “celtique”, etc…
Le score numérique nous apporte une autre information : comme vous pouvez le constater ci-dessous, il reste stable. Les Français sans origine migratoire directe piochent dans des registres non-français… sans que le score moyen des prénoms choisis ne se rapproche de celui des immigrés ou de leurs descendants ? Pour une raison simple : les Français (sans origine etc…) ne piochent pas dans le stock des prénoms porté par les immigrés. Ils continuent à maintenir une distance culturelle : Enzo devient possible quand les immigrés ne s’appellent plus Enzo.
 
La course à l’assimilation :
Imaginons l’assimilation (la disparition des différences saillantes entre deux populations) comme une course de 100 mètres, sur plusieurs générations. La vitesse de course peut se calculer, par exemple, à partir de l’abandon des prénoms du pays d’origine (le passage de 90% à 50% puis à 20%, par exemple). Ou se calculer à partir du score moyen des prénoms des immigrés, des descendants, et des enfants des descendants…
Ce que l’on verra, si l’on calcule la vitesse à laquelle courent les groupes d’immigrés et leurs descendants (par exemple les originaires d’Afrique du Nord par comparaison avec les originaires d’Europe du sud), c’est que, sur deux générations, des immigrés à leurs petits enfants, la vitesse est grosso-modo la même, la distance parcourue sur deux génération est comparable. L’assimilation est un processus social collectif auquel il est difficile d’échapper.
Mais si les immigrés courent tous au même rythme, ils ne participent pas à la même course. Les immigrés d’Europe du Sud (et leurs descendants) arrivent avec des prénoms plus proches des prénoms portés en France : il arrivent avec 10 à 20 mètres d’avance sur les immigrés d’Afrique du Nord. Et l’adoption, par les Français sans origine migratoire directe, de prénoms “latin” fait que, pour le dire vite, les immigrés d’Europe du Sud n’ont pas besoin de courir pour voir la distance se raccourcir.
J’ai essayé de montrer ceci avec un Gif Animé, mais je ne suis pas graphiste :

Le taux de suicide départemental en France, 1827 – 2012

Le taux de suicide s’exprime en nombre de décès par 100 000 individus. Pour calculer ce taux (brut) à l’échelle des départements de la France métropolitaine, il faut donc à la fois le nombre de suicides et la population du département.
En France, on dispose, grâce au Compte général de l’administration de la justice criminelle, du nombre de suicides par départements depuis 1827, jusque 1931. Il faut juste tout recopier, à la main, dans un tableau. Ce sont des statistiques judiciaires, qui contiennent aussi une partie des tentatives de suicide connues de la justice.
On dispose aussi, depuis 1906, de statistiques dites “sanitaires”, issues des certificats de décès. Depuis 1968, c’est l’INSERM qui s’en occupe.
Mais il y a des trous : en raison des guerres, en raison de problèmes administratifs, certaines années ne sont pas disponibles. Ainsi on ne connait pas le nombre de suicides à Paris en 1870. On ne sait pas ce qui se passe en Alsace entre 1919 et 1925…
La population départementale est connue précisément à partir des recensements : mais ces recensements, jusqu’au début des années 2000, étaient réalisés tous les 5 ou 10 ans.
Pour produire l’animation, j’ai donc du extrapoler, imputer et lisser les données. Quelle est donc la population de l’Ariège en 1863 ? Si on connaît la population de 1861 et celle de 1865, on peut se dire que c’est entre les deux. L’effet des guerres, qui font chuter le taux de suicide, n’est pas visible ici : les cartes, trop lissées, font comme si rien n’avait eu lieu. Parfois, dans des départements à la population réduite, une poignée de suicides en plus (ou en moins) fait brutalement augmenter (ou chuter) le taux à un moment, sans que cette hausse se poursuive les années suivantes : je lisse donc les pics de la courbe.
L’ensemble permet de rendre visible l’augmentation du taux de suicide au XIXe siècle, que ce taux soit le reflet d’une augmentation de la fréquence réelle des suicide ou celui d’une plus grande attention administrative portée à l’identification des suicides. On repère aussi bien l’augmentation qui a lieu à partir du milieu des années 1970 et le reflux à partir de la fin des années 1980.

Sociologue, quand-est-ce que tu soutiens?

En France, on repère une saisonnalité des soutenances. Après les récoltes, après le Beaujolais nouveau, vient le moment des soutenances de thèses, concentrées sur le mois de décembre. Ainsi, environ 10% des thèses de l’année seront soutenues cette semaine, comme le montre le graphique ci-dessous :

cliquez pour agrandir

L’une des raisons est la date limite fixée par le Ministère de l’enseignement supérieur pour pouvoir être candidat à la «qualification» aux postes universitaires. En général, la date limite était située fin décembre. Par exemple, cette année, il faut que les rapports de soutenance de thèse soient téléchargés dans l’application de candidature avant le 18 décembre.
Cette répartition dans l’année ne diffère pas beaucoup suivant les disciplines. Biologistes et sociologues, neuroscientifiques et psychologues préfèrent les soutenances en fin d’année. Les thèses de mathématiques / mathématiques appliquées sont mieux réparties dans l’année, avec trois pics d’égale intensité en mai, en septembre et en décembre.

cliquez pour agrandir

Mais si les répartitions saisonnières diffèrent peu, il en va différemment du jour de soutenance dans la semaine. Les soutenances le dimanche sont extrêmement rares (ce sont peut-être des erreurs de saisie). Le vendredi est le jour préféré d’un grand nombre de disciplines. Mais le choix du samedi différencie certaines disciplines :


cliquez pour agrandir

Près d’un quart des thèses en histoire , 20% des thèses des philosophes, 10% des thèses en droit public… sont soutenues un samedi, alors que c’est inconnu en biologie.
Les explications de cette spécialité sont incomplètes. Pour certains, ce serait lié au non-financement des thèses en sciences humaines (les doctorantes exerçant un travail salarié en dehors du monde académique doivent soutenir un jour chômé), mais cela n’explique pas les différences fortes entre Histoire et Sociologie, ou même entre Histoire et Géographie. D’autres font intervenir les cultures de soutenance : dans certaines disciplines, c’est une cérémonie collective où tout le laboratoire est invité, dans d’autres, l’absence de véritable vie de laboratoire fait que l’on ne cherche pas à organiser la soutenance pendant un jour de travail. D’autres mentionnent la taille des jurys: un jury de 7 ou 8 personnes génère des incompatibilités de calendrier qui occasionneraient un repli stratégique vers le samedi. D’autres encore insistent : c’est du au manque de salles dans certaines universités en semaine. [Mais sur ce point, j’ai contrôlé par l’université de soutenance et la période de soutenance, et les différences entre disciplines samediphobes et samediphiles se maintiennent.]
Voici donc un dernier graphique. Si vous êtes doctorant en histoire de l’art, il y a plus d’une chance sur quatre que vous souteniez un samedi.

cliquez pour agrandir

Le beau linge

Il y a le tissu social. Et il y a le beau linge social [*]. Mais parfois le beau linge est caché dans de vieilles armoires grinçantes. Ouvrons une de ces armoires : les noms à particules (et, parfois, à armoiries). Je vais m’appuyer sur les résultats nominatifs au bac général et technologique, entre 2012 et 2017, soit 2,2 millions d’individus.
Parmi eux, 25 000 ont un nom à particule (la particule ici étant “de”, “du”, “des” ou “d'” : d’Hauterives, de La Tour d’Aigues, des Restifs, Chabault du Fals, etc…), et parmi eux quelques De Souza. 68 000 ont un des 30 noms de famille les plus fréquents en France (Martin, Durand) mais aussi Da Silva. Les autres, qui sont donc 2,1 millions environ, représentent le tout-venant.
Si la particule ne disait rien (mais vraiment rien du tout) de la position sociale, alors les prénoms des bacheliers à particule devraient ressembler très fort aux prénoms des bacheliers sans particule. Si l’on pense que la particule est quand même un signe d’immigration potentiellement lointaine, alors on peut comparer avec les prénoms de celles et ceux qui ont un nom de famille très fréquent en France (un des trente noms de famille les plus fréquents). Les choix de monsieur et madame Dupont ne devraient pas trop différer des choix de Monsieur et Madame du Pont.

Le tableau des prénoms les plus fréquents ne révèle que peu de différences. Les prénoms des “Dupont” (c’est à dire des personnes ayant un des 30 noms de famille les plus fréquents en France) sont, grosso modo, rangés dans le même ordre que les prénoms de l’ensemble de la population des bacheliers. Les prénoms des “du Pont” (c’est à dire des personnes ayant un nom à particule) montrent de légères différences de rang : on y préfère Marie à Camille, on apprécie un peu moins Léa et Manon. On adoooore Louis et Paul.

rang DUPONT TOUS DU PONT
1 Camille Camille Marie
2 Thomas Thomas Antoine
3 Manon Marie Thomas
4 Lea Manon Alexandre
5 Marie Lea Camille
6 Pauline Alexandre Louis
7 Antoine Antoine Paul
8 Mathilde Maxime Guillaume
9 Maxime Nicolas Nicolas
10 Nicolas Pauline Pierre
11 Alexandre Mathilde Lea
12 Marine Chloe Charlotte
13 Julie Marine Marine
14 Chloe Laura Hugo
15 Quentin Julie Mathilde
16 Clement Quentin Manon
17 Julien Clement Maxime
18 Guillaume Pierre Quentin
19 Laura Marion Pauline
20 Valentin Julien Alexis

Sources : Résultats nominatifs au bac

Ainsi, pour ce qui est des choix les plus fréquents, les choix des Dupont et des du Pont se ressemblent. Les prénoms les plus fréquents n’ont qu’un faible pouvoir de distinction.

Le diable est dans les détails. Certains prénoms (des prénoms relativement fréquents, présents chez plus de 500 bacheliers et bachelières) ne sont pas répartis de la même manière entre Dupont et du Pont. Examinons la “sur-représentation” et la “sous-représentation” de ces prénoms fréquents. Pour ce faire, on divise la fréquence du prénom dans la population à particule par la fréquence du prénom dans la population complète. Quand ce rapport est supérieur à 1, cela signifie que les du Pont choisissent un peu plus souvent ce prénom que la population générale. Et l’on fait la même chose pour les Dupont.

Là, les différences apparaissent très visibles. Les parents à particules choisissent Sixtine, Maylis et Stanislas beaucoup plus souvent que le commun des mortels. Les Dupont, eux, ont des choix peu spécifiques : à la fois Teddy et Thibaud, Andy et Léonie : c’est que l’on trouve de tout dans les Dupont, qu’ils ont des choix très peu différents des choix du commun des mortels.

rang (de surreprésentation) DUPONT DU PONT
1 Solenne Sixtine
2 Alexane Maylis
3 Suzanne Stanislas
4 Andy Gaspard
5 Timothe Albane
6 Xavier Hugues
7 Segolene Hortense
8 Cassandra Henri
9 Joffrey Philippine
10 Gwenaelle Marin
11 Gabin Bertrand
12 Teddy Diane
13 Thibaud Victoire
14 Antony Alix
15 Charlene Astrid
16 Corentin Alban
17 Leonie Joseph
18 Coraline Malo
19 Etienne Amaury
20 Leopold Augustin

Sources : Résultats nominatifs au bac

Alors que nous serions bien en peine de distinguer les Dupont sur le tissu social (ce sont, collectivement, des omnivores culturels), les du Pont, eux, s’y distinguent bien, notamment par leurs choix spécifiques : ils sous-utilisent les prénoms les plus fréquents, et ils sur-utilisent un corpus de prénoms rares. Ainsi, alors que rien ne devrait distinguer les Dupont des du Pont, si la particule n’était vraiment rien, certaines de leurs pratiques culturelles les différencient encore, à la marge, du reste de la société. Quand donc arriveront-ils à s’intégrer ?

[*] La métaphore n’est pas seulement filée, elle est ici cousue de fil d’or.