Categories

Archives

Ma vie dans l’EDP (1)

Une demi-journée par semaine, voire un peu plus, je me plonge via Big_Stat à l’INED dans l’Echantillon démographique permanent (EDP). Le but : comprendre “l’inscription ailleurs”, le fait d’être inscrit ailleurs que sur son lieu de résidence. C’est quelque chose de fréquent : cela concerne près d’un.e inscrit.e sur cinq.

Première découverte : l’EDP est découpé en “bases études”. Chaque base-étude contient l’ensemble de l’EDP, pour un millésime donné (avec les informations rétrospectives, recensements, etc…). Mais attention : les identifiants individuels de l’EDP-2012 ne sont pas ceux de l’EDP-2014. Première demi-journée de perplexité, avant de comprendre, et de tout reprendre à zéro.

Deuxième découverte : le lieu d’inscription électorale, quand ce n’est pas le lieu de résidence, n’est pas un lieu abandonné. C’est un lieu investi. Si on n’a pas été radié, c’est qu’on a encore (parfois) des attachements dans ce lieu. Une des bases de l’EDP porte sur les mariages. Et on peut regarder où se marient (en 2014) les personnes qui, en 2014 par exemple, sont “inscrites ailleurs” que sur leur lieu de résidence. Ca fait peu de monde (il faut sélectionner les individus EDP recensés en 2014, français, majeurs, inscrits sur les listes électorales, mais “inscrits ailleurs” que sur leur lieu de résidence, et qui se sont mariés en 2014). Nous partîmes 4 millions, nous arrivâmes 600.

     Femmes Hommes Effectifs
2012 27,5   19,5   600
2014 26,5   19,4   620

J’ai aussi fait le calcul pour 2012 aussi. Un quart des femmes, un cinquième des hommes (inscrits ailleurs et qui se marient) choisissent comme lieu du mariage non pas le lieu de résidence, mais le lieu de l’inscription électorale.

Alors certes, les effectifs ne sont pas énormes. Il faut que je fasse la même opération de sélection avec, par exemple, les recensements de 2008 à 2014. Il faudrait aussi que je travaille sur le lieu de résidence antérieur, ou sur les lieux d’inscription postérieurs au mariage : car le mariage est peut-être le dernier moment d’inscription ailleurs (le moment où certains arrêtent d’être inscrits chez leurs parents et où, enfin, ils s’inscrivent là où ils résident).

Viens chez moi, j’habite chez une copine…

… chantait Renaud il y a quelques années.
Cette chanson relevait, avec humour, qu’un «chez soi», c’est parfois chez un.e autre. Il n’est pas simple de saisir cette forme de résidence, mais on peut l’approcher à partir des listes électorales parisiennes. En effet, un champ, sur ces listes, donne la possibilité d’indiquer que l’on habite « chez Madame Dupont » ou « chez Monsieur Durand », que son nom n’est pas sur la boîte aux lettres, n’est pas sur d’autres documents, mais qu’on est joignable au 45 rue des Fleurs, « chez Madame Durand ».
Ces «chez» sont sur ces fichiers, explorons-les.
Ils ne sont pas nombreux : seulement 1,3% des inscrits. Mais comme il y a beaucoup d’inscrits, ça fait quand même près de 17 000 individus.
On peut voir qu’être “chez quelqu’un d’autre” est le fait des plus jeunes : Entre 19 ans et 40 ans, plus de 1,5% des inscrits ont un chez-soi chez l’autre. Plutôt des femmes, à cet âge. Mais après 35 ans, ce sont les hommes qui sont plus souvent que les femmes dans cette situation.

La proportion diminue avec l’âge, après 24 ans, à mesure qu’on se construit un chez soi chez soi.

Les inscrites qui habitent chez quelqu’un d’autre, pour la moitié d’entre elles, habitent chez un homme. Les inscrits, eux, sont près de 6 sur 10 à habiter chez une femme :

Sexe de la personne inscrite, sexe de la personne hébergeant
Sexe Autre cas Hébergeuse Hébergeur
F 5.7 43.9 50.4
M 6.3 57.1 36.6
Source : Listes électorales

À croire que ces hommes, en effet, “habitent chez leur copine”.

Aux jeunes âges, ce sont surtout des femmes qui habitent chez une femme. Entre 30 ans et 40 ans, la situation la plus fréquente, c’est une femmes qui habite chez un homme. Et après 40 ans, c’est surtout un homme qui habite chez une femme.

Les épreuves classantes nationales : âge, sexe et prestige

Il y a, en France, un concours pour devenir interne en médecine, et les listes des reçus sont publiées au journal officiel chaque année, m’apprend nc233.com qui a étudié les prénom des reçus.
J’ai récupéré les listes pour les trois dernières années.
Comme dans toute épreuve scolaire, on remarque que les plus précoces réussissent mieux :

En 2016, 50 % les candidats nés en 1993 sont dans le “top 1000”, alors que moins de 5% de ceux qui sont nés en 1988 s’y trouvent.

Mais à la différence des épreuves scolaires, les filles réussissent moins bien les “Epreuves nationales classantes” que les hommes. La pénalité est d’environ une demi-année : les filles réussissent autant que les garçons qui ont six mois de plus qu’elles.

Et cette plus grande réussite masculine est visible si l’on s’intéresse à la proportion d’hommes en fonction du rang de classement. Plus on se rapproche du début du classement, plus les hommes sont représentés : quand il y a 45% d’hommes au total, ils sont 60% dans les tous premiers rangs :

Et cette prime masculine se reproduit année après année.
Il est intéresssant de voir que la proportion d’homme augmente aussi vers la fin du classement, mais pas aux toutes dernières places, où il n’y a plus que 40% de garçons. Les femmes, elles, sont plus fréquemment représentées au milieu du classement.

Est-ce lié au refus de féminiser les internats et les spécialités médicales les plus prestigieuses ? Ou est-ce un effet du rendement inégal du rang de classement entre hommes et femmes ? Ne sachant pas comment ces épreuves sont organisées, je ne peux pas répondre.

Les arrêtés d’affectation sont aussi publié, et l’on peut voir qui choisit quoi en fonction de son rang de classement. Les premiers classés obtiennent ce qu’ils souhaitent. Les dernières classées prennent ce qui reste.

Dans le tableau suivant, par exemple, on peut lire que la spécialité “pédiatrie” est féminisée. Alors que la chirurgie générale (que ce soit à Paris, à Lille ou à Lyon) l’est peu. La colonne “max” indique la position du dernier reçu (50 indique que le dernier reçu était dans les 50% les mieux classés). Cela indique l’attractivité de la Discipline*Région : ainsi pour espérer une place en cardiologie ou en anesthésie, il vaut mieux être bien classé. En revanche, pour avoir psychiatrie, pas de problème. Et si on est bien classé, en général, on ne demandera pas “medecine générale” à Caen : personne parmi les 20% les mieux classés, entre 2014 et 2016, n’a demandé cette spécialité (ce qu’indique la colonne “min”).

Attractivités des spécialités et des régions
Région Spécialité min max N % Hommes
1 Aix-Marseille. pédiatrie 1 51 50 8
2 Ile-de-France. dermatologie et vénérologie 0 76 52 15.4
3 Lyon. pédiatrie 0 73 51 15.7
4 Ile-de-France. pédiatrie 1 76 253 17.8
5 Ile-de-France. gynécologie obstétrique 1 42 94 18.1
6 Lille. pédiatrie 1 49 65 20
7 Nancy. psychiatrie 7 100 52 25
8 Rennes. médecine générale 0 95 322 30.7
9 Besançon. médecine générale 6 100 237 31.2
10 Aix-Marseille. psychiatrie 5 88 76 31.6
11 Grenoble. médecine générale 4 97 328 31.7
12 Lyon. médecine générale 3 98 555 32.4
13 Nantes. médecine générale 3 90 348 33.9
14 Ile-de-France. pneumologie 1 27 58 34.5
15 Montpellier. médecine générale 1 97 475 34.9
16 Angers. médecine générale 4 97 346 35
17 Bordeaux. psychiatrie 15 92 68 35.3
18 Tours. médecine générale 10 100 263 35.7
19 Ile-de-France. médecine générale 0 100 1730 36.1
20 Strasbourg. médecine générale 4 99 413 36.1
21 Bordeaux. médecine générale 0 98 577 36.4
22 Toulouse. médecine générale 1 98 472 38.3
23 Ile-de-France. psychiatrie 2 91 308 38.6
24 Nice. médecine générale 2 95 247 40.1
25 Saint-Etienne. médecine générale 4 97 234 40.2
26 Aix-Marseille. médecine générale 4 99 653 40.3
27 Clermont-Ferrand. médecine générale 2 100 258 40.7
28 Nancy. médecine générale 17 100 398 40.7
29 Toulouse. psychiatrie 2 96 73 41.1
30 Lyon. psychiatrie 4 75 72 41.7
31 Ile-de-France. médecine interne 0 27 93 41.9
32 Ile-de-France. médecine du travail 29 100 57 42.1
33 Brest. médecine générale 6 99 284 42.3
34 Ile-de-France. gastro-entérologie et hépatologie 0 27 66 42.4
35 Lille. psychiatrie 6 93 120 43.3
36 Rouen. psychiatrie 15 98 62 43.5
37 Ile-de-France. biologie médicale 4 99 55 43.6
38 Ile-de-France. oto-rhino-laryngologie et chirurgie cervico-faciale 2 28 55 43.6
39 Rouen. médecine générale 12 100 296 43.6
40 Ile-de-France. neurologie 0 29 64 43.8
41 Poitiers. médecine générale 5 96 368 43.8
42 Lille. médecine générale 1 99 715 43.9
43 Océan-Indien. médecine générale 13 97 169 45
44 Reims. médecine générale 17 100 236 46.6
45 Limoges. médecine générale 10 100 130 46.9
46 Caen. médecine générale 20 100 271 47.6
47 Antilles-Guyane. médecine générale 8 96 212 49.1
48 Dijon. médecine générale 8 100 244 50.4
49 Ile-de-France. oncologie 0 34 76 52.6
50 Poitiers. psychiatrie 6 99 57 54.4
51 Amiens. médecine générale 16 100 246 54.9
52 Ile-de-France. ophtalmologie 0 47 90 55.6
53 Ile-de-France. radiodiagnostic et imagerie médicale 0 22 155 56.1
54 Lyon. anesthésie-réanimation 0 23 50 58
55 Ile-de-France. cardiologie et maladies vasculaires 0 21 141 58.9
56 Montpellier. chirurgie générale 1 51 61 59
57 Lille. anesthésie-réanimation 1 38 60 60
58 Ile-de-France. anesthésie-réanimation 0 41 193 60.6
59 Ile-de-France. santé publique 3 97 51 62.7
60 Ile-de-France. anesthésie réanimation 0 39 92 66.3
61 Lille. radiodiagnostic et imagerie médicale 0 22 57 66.7
62 Lyon. chirurgie générale 2 44 64 67.2
63 Lille. chirurgie générale 1 50 96 67.7
64 Aix-Marseille. chirurgie générale 0 52 66 68.2
65 Ile-de-France. chirurgie générale 0 72 190 68.4
Source : Légifrance

Et un bonus pour celles et ceux qui sont arrivés jusqu’ici : la proportion de candidats “précoces” (qui ont au moins un an de moins que le gros du peloton) par spécialité. 17% des internes en “néphrologie” sont des précoces, et ce n’est que 2,7% des internes en médecine générale (les plus nombreux).

Proportion de candidats précoces
Spécialité % précoces Effectif
santé publique 1.4 222
médecine du travail 1.7 293
médecine générale 2.8 11027
biologie médicale 3.2 339
médecine physique et de réadaptation 3.2 311
endocrinologie, diabète, maladies métaboliques 3.3 246
psychiatrie 3.4 1546
gynécologie-obstétrique 4.7 214
anesthésie réanimation 6.1 460
chirurgie générale 6.4 1260
oncologie 6.6 392
cardiologie et maladies vasculaires 7.1 644
pneumologie 7.1 366
pédiatrie 7.3 995
gynécologie obstétrique 7.5 456
anesthésie-réanimation 8 922
rhumatologie 8.1 271
neurologie 8.6 373
radiodiagnostic et imagerie médicale 9 787
gastro-entérologie et hépatologie 9.1 397
dermatologie et vénérologie 9.4 299
oto-rhino-laryngologie et chirurgie cervico-faciale 9.5 262
ophtalmologie 12.6 461
médecine interne 14.7 409
néphrologie 17 265
Source : Légifrance

Prénoms d’entrepreneurs : Sébastien le boucher, Mohamed le taxi

La base SIRENE a été mise en ligne sur data.gouv.fr et elle contient notamment les prénoms de près de 4 millions d’entreprises ayant un entrepreneur à prénom.
Au cours des dernières années, le prénom “Marie” est devenu l’un des plus fréquent parmi les chefs et cheffes d’entreprises. En revanche, “André” et “Michel”, eux, ne sont plus répandus parmi les personnes ayant créé leur entreprise récemment.
prenomsirene
On remarque, avec un certain délai, les modes : “Nicolas”, prénom à la mode vers 1980 (c’est un des prénoms les plus donnés) se repère chez les entrepreneurs à partir des années 2000, quand des dizaines de milliers de “Nicolas” entrent sur le marché du travail.

Si l’on s’amuse à regarder quels sont les prénoms fréquents par secteur d’activité, pour les entreprises créées récemment, alors on retrouvera Jean, Marie et Nicolas un peu partout. Mais on repèrera aussi “Mohamed” à la tête des entreprises de “Transports terrestres et transport par conduites” et de “Poste et courrier” (avant ce que l’on a appelé “l’übérisation des banlieues”). On repèrera aussi les activités où les hommes sont majoritaires et ceux où les femmes le sont : activités administratives, activités liées à la santé, “autres services personnels”.

Prénoms les plus fréquents par secteur NAF
NAF 1 2 3
Culture et production animale, chasse et services annexes JEAN MARIE NICOLAS
Sylviculture et exploitation forestière JEAN MARIE MICHEL
Industries alimentaires SEBASTIEN DAVID CHRISTOPHE
Industrie de l’habillement MARIE ISABELLE NATHALIE
Autres industries manufacturières MARIE NATHALIE ISABELLE
Réparation et installation de machines et d’équipements JEAN CHRISTOPHE PHILIPPE
Production et distribution d’électricité, de gaz, de vapeur et d’air conditionné JEAN PHILIPPE MICHEL
Travaux de construction spécialisés JEAN DAVID SEBASTIEN
Commerce et réparation d’automobiles et de motocycles SEBASTIEN DAVID JEAN
Commerce de gros, à l’exception des automobiles et des motocycles JEAN NICOLAS PHILIPPE
Commerce de détail, à l’exception des automobiles et des motocycles MARIE NATHALIE JEAN
Transports terrestres et transport par conduites MOHAMED JEAN CHRISTOPHE
Activités de poste et de courrier MOHAMED THOMAS ALEXANDRE
Hébergement MARIE JEAN CATHERINE
Restauration JEAN CHRISTOPHE MARIE
Production de films cinématographiques, de vidéo et de programmes de télévision ; enregistrement sonore et édition musicale NICOLAS JULIEN GUILLAUME
Programmation, conseil et autres activités informatiques NICOLAS JULIEN SEBASTIEN
Activités auxiliaires de services financiers et d’assurance JEAN NICOLAS CHRISTOPHE
Activités immobilières JEAN PHILIPPE MARIE
Activités juridiques et comptables MARIE ANNE JEAN
Activités des sièges sociaux ; conseil de gestion JEAN PHILIPPE MARIE
Activités d’architecture et d’ingénierie ; activités de contrôle et analyses techniques JEAN NICOLAS PIERRE
Publicité et études de marché JEAN NICOLAS JULIEN
Autres activités spécialisées, scientifiques et techniques NICOLAS JEAN JULIEN
Services relatifs aux bâtiments et aménagement paysager JEAN DAVID SEBASTIEN
Activités administratives et autres activités de soutien aux entreprises MARIE NATHALIE ISABELLE
Enseignement NICOLAS MARIE JEAN
Activités pour la santé humaine MARIE ANNE SOPHIE
Activités créatives, artistiques et de spectacle MARIE JEAN NICOLAS
Activités sportives, récréatives et de loisirs NICOLAS SEBASTIEN JULIEN
Réparation d’ordinateurs et de biens personnels et domestiques JEAN DAVID SEBASTIEN
Autres services personnels MARIE NATHALIE STEPHANIE
Insee, Base Sirène. Création postérieures à 2007

Il y a beaucoup de doubles comptes (un même entrepreneur pouvant avoir, assez souvent, plusieurs entreprises, plusieurs établissements, plusieurs magasins… à son nom).

Le petit remplacement : note sur la fécondité des nobles (d’apparence)

À la fin du XIXe siècle, les bébés à particule ne représentaient que 0,4% des naissances. À la fin du XXe siècle, 100 ans après, ils représentent 0,9% des naissances. Comment expliquer cela ? Une hypothèse, c’est de dire que les “de Souza” ont remplacé les “de Rochechouart”, et qu’on n’est même plus chez nous en France, hein !
Mais il semble que d’autres hypothèses moins farfelues soient envisageables, ma bonne dame, si seulement vous étiez moins xénophobe.
Je commence par retenir les noms de famille n’apparaissant qu’une seule fois dans les naissances de la fin du XIXe siècle : entre 1890 et 1914, ces familles n’ont produit qu’un seul bébé. J’examine ensuite combien de bébés sont produits vers 1980, en comparant les noms à particule et les autres noms. La méthode est grossière, mais elle permet probablement de comparer la fécondité des descendants de noms très rares, présents en France à la fin du XIXe siècle, à celle des personnes portant un tel nom rare à la fin du XIXe siècle.

Pour être plus précis : Prenons les familles qui n’ont qu’un seul enfant à la fin du XIXe siècle, qui ont moins de 5 enfants 25 ans après, moins de 17 50 ans après et moins de 64 75 ans après. C’est une manière de retenir principalement les familles qui n’augmentent pas grâce à l’immigration mais surtout par la fécondité naturelle (en produisant au maximum 4 enfants tous les 25 ans).
7732 familles “nobles” correspondent à ce cas. Lors de la dernière période, elles ont produit 8238 enfants, soit une croissance de 1,06.
Les familles non-nobles sont plus nombreuses. Mais en fin de période, elles n’ont plus que 0,81 enfant pour chaque enfant produit à la fin du XIXe siècle. (Pour repérer cela, et avoir une idée du rapport plus élevé des nobles d’apparence, je prends 3000 échantillons de non-nobles de même taille que la population des familles à particule d’un même niveau de rareté).

rapport-patronymes
Cliquez pour agrandir

De la même manière, comparons les familles qui, à la fin du XXe siècle, ont 2 enfants (puis moins de 9, moins de 33 et enfin moins de 129). Les “nobles” se retrouvent avec 1,6 enfants pour chaque enfant de la fin du XIXe, les non nobles avec seulement 1,3 enfants.
Un dernier exemple : les familles qui démarrent avec 3 enfants : si elles ont une particule, elles produisent en fin de période 1,9 enfant pour chaque enfant; les familles sans particules n’en produisent que 1,4. Avec 4 enfants : 1,9 pour les nobles, 1,4 pour les manants.

Dans tous les cas, les familles à particule présentes en France à la fin du XIXe siècle et très rares semblent avoir une fécondité plus importante que les familles sans particule. Ou alors elles arrivaient mieux à transmettre leurs noms (mais comment le feraient-elles ?). Est-ce parce qu’elles se trouvent, plus souvent, au sommet de l’échelle sociale et qu’elles disposent d’un patrimoine plus fourni ? Qu’elles sont plus souvent que de coutume catholiques ? Qu’elles connaissent une mortalité infantile moindre ?

Les grandes familles sont des familles nombreuses (du moins un peu plus nombreuses).

Un autre indice des différences de fécondité peut être calculé à partir de la proportion de noms qui disparaissent, qui cessent de produire des bébés.

disparition-patronymes
cliquez pour agrandir

80% des noms sans particule très très rares à la fin du XIXe siècle ne produisent aucun bébé à la fin du XXe siècle. Ce n’est le cas que de 75% des noms à particule aussi rares. La différence est faible, mais elle signifie que les noms à particule très rares il y a 100 ans se maintiennent mieux sur la distance : et la comparaison entre nobles d’apparence et manants d’apparence est toujours au profit des gens à particule.

Note finale : n’étant pas démographe, il est fort possible que ma lecture et mon analyse du fichier des patronymes soit une hérésie.

Namyboo… et recommander des prénoms

Pour aider les futurs parents à choisir un prénom, maintenant qu’ils peuvent choisir n’importe lequel des prénoms qu’ils aiment, il existe des livres, les conseils des grands-parents, des forums… etc. Et un site (namyboo.com) qui aide dans le processus lui-même, en permettant aux parents de dresser une liste ordonnée de prénoms sur lesquels ils s’accordent.

Si j’aime ça, j’aimerai ça

http://namyboo.com est un nouveau site permettant aux parents angoissés de trouver un prénom qu’ils aiment. Plusieurs dizaines de milliers d’individus y ont déja cherché un prénom. Le principe est simple : après avoir sélectionné des listes thématiques de prénoms, il suffit de cliquer “j’aime / je n’aime pas”, puis de classer les prénoms entre eux. Le créateur du site m’a donné accès à un extrait, entièrement anonymisé, des choix réalisés par quelques dizaines de milliers d’internautes.

On peut considérer que deux prénoms sont liés entre eux quand plusieurs personnes les ont appréciés tous les deux. C’est ainsi que “Margaux” et “Margot”, logiquement, se trouvent reliés. Mais quels autres prénoms sont appréciés des Margophiles ? et des Marceauphiles ?

reseau_prenoms-1
cliquez pour agrandir

Le graphique précédent – qui ne représente qu’une petite partie du réseau de relations entre prénoms – colorie de la même couleur des prénoms qui sont proches, souvent appréciés ensemble ou appréciés par des personnes qui apprécient un prénom proche (j’ai comparé avec la matrice d’indépendance pour faire ressortir les liens forts). Mathis, Dorian et Julian se trouvent dans le même groupe. Augustin, Octave et Charles dans un autre. C’est Quentin qui les relie. On voit aussi ici que Margot est plus proche de Jeanne que de Margaux.

La structure principale reste l’opposition entre prénoms de garçons et prénoms de filles : la recherche d’un prénom est avant tout la recherche d’un prénom “pour un garçon” ou d’un prénom “pour une fille”.

Un amour conditionnel

Un autre calcul est possible : regarder, pour chaque prénom, les prénoms appréciés par au moins un tiers des individus qui apprécient ce prénom. Dans le tableau suivant, on voit que plus d’un tiers de ceux qui apprécient Augustin apprécient Arthur, Jules et Louis. Mais que les fans d’Arthur préfèrent Louis et Jules à Augustin. Les appréciations ne sont pas symétriques : on peut “prédire” qu’un Augustinophile moyen aura Arthur en second choix, et aussi prédire qu’un Arthurophile n’aura pas Augustin en second choix.

prénom apprécié autres prénoms aussi appréciés
Arthur Louis; Jules; Gabriel
Adam Gabriel
Augustine Joséphine; Léonie; Célestine
Alan Liam; Maël; Léo
Milan Eden
Augustin Arthur; Jules; Louis
Guillemette Aliénor; Blanche; Suzanne
Milane Eden; Lila; Mila
Quitterie Éléonore; Alix; Domitille
Doriane Oriane; Romane; Roxane
Addison Emery; Camélia; Jamie
Adama Kobe; Ada; Enu

On peut alors dessiner le réseau des voisins de tel ou tel prénom (ici, je retiens jusqu’aux voisins d’ordre deux, les voisins des voisins). Les flèches vont du prénom initial vers le prénom aussi apprécié. Les futurs parents qui apprécient Loana n’apprécient pas tout à fait les mêmes prénoms que les parents qui sont fans de Quitterie, Amicie ou Guillemette.

voisins_conditionnels_loana-1
cliquez pour agrandir

voisins_conditionnels_guillemette-1
cliquez pour agrandir

Mais comme on peut le constater, un groupe de prénoms, Louise, Alice, Rose… sont des prénoms souvent “appréciés aussi”, quel que soit le prénom de départ. Ils constituent des attracteurs de choix qu’un bon système de recommandation ne devrait pas proposer – ils sont déjà dans la tête des parents.

Chez les garçons, Gabriel, mais aussi Arthur et Adam forment un tel attracteur.

voisins_conditionnels_rayane-1
cliquez pour agrandir

voisins_conditionnels_arsene-1
cliquez pour agrandir

http://namyboo.com présente les prénoms dans des “silos” : par genre et par thème. Le site ne proposera pas des prénoms turcs, par exemple, si l’internaute n’a pas présélectionné ce groupe de prénoms, sauf si, par hasard, quelques prénoms “turcs” se trouvent dans un autre groupe (par exemple le groupe des prénoms donnés à Paris). Il est évident que cela structure l’expression des préférences des internautes-futurs-parents (et donc les réseaux ici présentés, qui reflètent en partie ces silos).

Habit vert et sang bleu

academie-rechercheSur le site de l’Académie française, vous pouvez faire une “recherche avancée” pour retrouver un “Immortel”. Vous pouvez chercher par “numéro de fauteuil”, par nom ou par lieu de décès… ou par titre de noblesse. Pas par sexe, parce que les Immortels n’ont pas de sexe. Ont-ils une particule ?
J’ai récupéré, et ce ne fut pas sans mal (pour l’Académie des sciences, qui a une liste bizarre et très mal formatée), les membres des cinq Académies de l’Institut de France. Voici le résultat.
Sous l’Ancien Régime, la proportion de noms à particule augmente entre le XVIIe siècle et la fin du XVIIIe siècle. Plusieurs éléments sont à préciser : d’abord les nobles se mettent à “particuler” leurs noms, à y ajouter des particules, et les manants aussi. Précisons aussi que cet anoblissement des Académies est peut-être un signe de reconversions internes au Second Ordre avant la Révolution.
La Révolution introduit des ruptures de séries, et des difficultés de fonctionnement pour les Académies. Au XIXe siècle, période de fondation de trois des cinq Académies, la tendance globale est à la diminution de la proportion d’Académiciens à particule.
academies
Cliquez pour agrandir le graphique

Mais depuis le début du XXe siècle, et surtout depuis 1950, les différentes Académies ont stabilisé la proportion de membres à particule. Seule l’Académie des sciences voit sa proportion de nobles d’apparence continuer à diminuer (mais cette Académie est beaucoup plus populeuse que les autres). Gardons bien à l’esprit que, étant donné qu’il y a moins de 1% de noms à particule dans la population française, ces noms restent fortement sur-représentés Quai de Conti.
À l’Académie française, il reste tant bien que mal, depuis 1900, environ 6 Académiciens à particule sur les 40 en poste à un moment donné. De manière intéressante, à l’Académie des sciences morales et politiques et à l’Académie des beaux-arts, la proportion de membres à particule augmente depuis une bonne cinquantaine d’années. Les mauvaises langues diraient que, sous la Coupole, les vieilles croûtes et les vieux croûtons apprécient les noms à rallonge.

Le retournement de tendance se perçoit bien si l’on étudie la population totale des Académies (en enlevant l’Académie des sciences, pour laquelle la liste complète et précise des membres est complexe à établir) :

academies-agrege

J’ai utilisé ici une échelle logarithmique, pour mettre en évidence les évolutions « récentes » (c’est à dire depuis 1900).

Depuis une vingtaine d’année, après 50 ans de stabilisation et 150 ans de baisse continue, la proportion de noms à particule augmente. L’échantillon est petit, car les 4 Académies réunies ont 200 membres, mais l’évolution est bien perceptible.

Si vous voulez comprendre pourquoi, vous pouvez assister à l’un des prochains « Lundi de l’INED », où j’espère montrer que «Dupont n’est pas du Pont».

Notes :
(1) Merci à François Briatte pour sa collaboration… même si j’ai fini par faire du copier-coller à la main.
(2) L’Académie des inscriptions et belles-lettres, oui, ça existe vraiment.

Aristocrates de tous pays, corrélez-vous

Quelle est la présence des nobles dans les livres français ? Google Ngram permet d’estimer la fréquence de tel ou tel mot parmi l’ensemble des mots publiés la même année.
J’ai récupéré la fréquence des titres de noblesse depuis 1760 : roi (roy, reine), prince (princes, princesse(s)), etc… La corrélation est très importante : la fréquence des différents titres augmente et diminue en même temps, depuis plus de deux siècles. Et c’est aussi corrélé aux usages de “noble” (nobles, noblesse).
noble-ngram
Ces titres n’apparaissent pas avec la même intensité : “roi” est beaucoup plus fréquent que “vicomte” (que j’ai regroupé avec comte et comtesse). Passons donc à une échelle logarithmique pour rendre plus visible la corrélation :

noble-ngram-log

Une des raisons possible de cette corrélation est que ce sont les mêmes livres qui parlent de “princes” et de “comtes”, et que les livres qui ne parlent pas de “princes” ne parlent pas non plus de “barons” ou de “rois”.

Dans le détail, l’on voit bien la période révolutionnaire, qui donne lieu d’abord à une hausse importante de la fréquence des titres, puis, effet des guillotines, à une chute rapide des mêmes titres. La reprise est rapide sous Napoléon, et culmine sous la Restauration. 1830, 1848 et 1870 n’apparaissent pas aussi visiblement.

La stabilité depuis 1950 est intéressante : les titres de noblesse cessent de disparaître des ouvrages publiés en français. On peut même déceler une augmentation depuis 1980 : comment expliquer les usages plus fréquents de titres périmés, dans une société républicaine ?

Line ? un prénom de coiffeuse !

J’avais apprécié la lexicologie commerciale de Mathieu Garnier (@matamix). J’ai donc téléchargé les données disponibles sur infogreffe (greffes des tribunaux de commerce). Et j’ai exploré la fréquences des prénoms dans les intitulés des entreprises (dans les données de 2013). Pour des raisons d’efficacité (il y a plus d’un million d’entreprises et plus de 25 000 prénoms en usage en France) j’ai restreint la recherche aux prénoms donnés à plus de 1000 bébés en France depuis 1930. Y a-t-il beaucoup de « Maxime Coiffure » et de « Les Pâtisseries de Marie » ? Beaucoup de « Alain Bernard Consultant » ?

Le premier tableau montre que la fréquence d’apparition des prénoms dans les intitulés varie beaucoup. Les entreprises de “Conseil en systèmes et logiciels informatiques” n’utilisent pas les prénoms (à peine 3%). Alors que les salons de coiffure, oui, beaucoup. Et ce n’est pas juste à cause des franchises “Jean-Louis David”. L’opposition est visible entre d’un côté les sociétés de consulting, de gestion, d’informatique. Et de l’autre les sociétés de maçonnerie et du soin (habillement, coiffure).

Secteur d’activité Pourcentage de prénoms Nombre d’entreprises
Conseil en systèmes et logiciels informatiques 3 12181
Ingénierie études techniques 4 19260
Conseil pour les affaires et autres conseils de gestion 6 39605
Activités des sociétés holding 6 41272
Activités des marchands de biens immobiliers 7 12729
Agences immobilières 8 21148
Location de terrains et d autres biens immobiliers 9 17901
Restauration de type rapide 9 16462
Hôtels et hébergement similaire 9 15151
Commerce de voitures et de véhicules automobiles légers 9 12167
Restauration traditionnelle 10 45400
Activités comptables 10 10221
Entretien et réparation de véhicules automobiles légers 11 19570
Travaux d installation électrique dans tous locaux 12 18526
Boulangerie et boulangerie-pâtisserie 15 10775
Commerce de détail d habillement en magasin spécialisé 15 15023
Travaux de maçonnerie générale et gros oeuvre de bâtiment 16 24676
Travaux de peinture et vitrerie 16 11826
Travaux de menuiserie bois et pvc 16 14647
Coiffure 20 17434
Travaux d installation d eau et de gaz en tous locaux 21 12159
Données Infogreffes 2013, Réalisation B. Coulmont

Si l’on se penche sur les prénoms eux-même alors on trouvera Jean, Pierre, Michel, Philippe et Bernard dans les intitulés de plus de 1500 entreprises chacun. Les premiers prénoms féminins sont Marie (15e position) et Marine (20e position)… Mais Marine n’est pas toujours un prénom, c’est aussi un adjectif… Ces 40 prénoms les plus fréquents dans les intitulés commerciaux sont donc très, très, très masculins.

Prénom Nombre d’entreprises Prénom Nombre d’entreprises
1 JEAN 4534 DANIEL 917
2 PIERRE 2914 PAUL 913
3 MICHEL 2326 LOUIS 908
4 PHILIPPE 1761 MARC 886
5 BERNARD 1491 ANDRE 885
6 ALAIN 1379 CHRISTIAN 879
7 LAURENT 1344 NICOLAS 854
8 MARTIN 1193 BRUNO 820
9 PASCAL 1119 DIDIER 795
10 PATRICK 1067 VINCENT 779
11 ERIC 1067 DENIS 723
12 OLIVIER 1065 ROBERT 708
13 CHRISTOPHE 1054 GERARD 703
14 FRANCOIS 1053 STEPHANE 688
15 MARIE 1035 FRANCK 650
16 DAVID 1026 DOMINIQUE 630
17 JACQUES 1024 RICHARD 628
18 CLAUDE 978 FREDERIC 619
19 THIERRY 963 GILLES 602
20 MARINE 957 GEORGES 590
Données Infogreffe

On peut aussi mettre en rapport le nombre de bébés nés avec tel prénom et le nombre d’entreprises qui portent un tel prénom dans leur intitulé. Il devrait y avoir un rapport : plus la population d’Enzo augmente, plus le nombre de « Enzo Coiffure » ou « Enzo Consulting » devrait augmenter. C’est en effet le cas : il y a beaucoup de Michel en France, et beaucoup de « Michel Michel Maçonnerie ».

Mais certains prénoms sont sous-représentés : Il y a en France très peu de « Mohamed et Associés », de « Biscuiterie Rolande » et de « Les beaux dessous de chez Ginette ». En revanche, les prénoms Lambert, Loup, Alma, Alizé, Ben, Gaia, Neo… sont moins des prénoms que des intitulés d’entreprise. L’exemple parfait est probablement “Fleur” : qui n’est pas « Fleur Dupont, Fleuriste », mais « A Fleur de Peau, épilation ». Idem avec Franco et Urbain…

Prénoms peu utilisés pour les intitulés d’entreprise   Prénoms très utilisés pour les intitulés d’entreprise
Prénom Nombre de naissances
depuis 1930
Nombre d’entreprises Rapport   Prénom Nombre de naissances
depuis 1930
Nombre d’entreprises Rapport
1 MOHAMED 69464 2 34732   LAMBERT 1542 275 6
2 JEANNINE 144328 6 24055   LOUP 1260 171 7
3 ROLANDE 20660 1 20660   ALMA 1167 150 8
4 MAURICETTE 37708 2 18854   ALIZE 1787 191 9
5 LILIANE 99379 6 16563   BEN 1759 175 10
6 JANINE 49451 3 16484   GAIA 1196 120 10
7 TITOUAN 16050 1 16050   NEO 1664 174 10
8 CHRISTIANE 219952 16 13747   HARMONIE 2058 212 10
9 JOSIANE 118708 10 11871   FRANC 1014 94 11
10 RAYMONDE 57134 5 11427   FRANCO 2160 174 12
11 JOCELYNE 102799 9 11422   ROCH 1643 139 12
12 MICHELINE 77311 7 11044   URBAIN 1288 106 12
13 GINETTE 87742 8 10968   FLEUR 4195 314 13
14 CLAUDETTE 43114 4 10778   CRYSTAL 1033 75 14
15 JOSETTE 128881 12 10740   OLLIVIER 1053 71 15
Données Infogreffes, Réalisation B. Coulmont

Il resterait à repérer dans quel secteur d’activité les prénoms “sous-représentés” (Mohamed, Rolande…) sont fréquents. Ce que je n’ai pas encore fait.

Terminons avec les prénoms les plus fréquents par secteur d’activité. C’est souvent “Jean”. Et “Pierre” dans les métiers de l’immobilier ou ceux de la pierre (eh oui). Les Line coiffeuses ne sont pas les “Info-Line” des sociétés d’informatique. La restauration rapide fait preuve de l’exubérance la plus grande : Lou, Sam, Rose & Ben… « Lou Kebab » ? Et les coiffeuses, en effet, s’appellent Line.

Prénoms les plus fréquents dans les intitulés d’entreprise par secteur d’activité
Secteur 1 2 3 4 5
1 Boulangerie et boulangerie-pâtisserie JEAN MARIE PIERRE OLIVIER PHILIPPE
2 Commerce de détail d habillement en magasin spécialisé JEAN MARIE ROSE MARINE PIERRE
3 Entretien et réparation de véhicules automobiles légers JEAN MICHEL ALAIN BERNARD CHRISTOPHE
4 Travaux d installation électrique dans tous locaux JEAN MICHEL PHILIPPE PIERRE PASCAL
5 Travaux de menuiserie bois et pvc JEAN MICHEL PHILIPPE PASCAL PIERRE
6 Commerce de voitures et de véhicules automobiles légers JEAN MICHEL PIERRE CHRISTOPHE LAURENT
7 Ingénierie études techniques JEAN MICHEL PIERRE ALAIN BERNARD
8 Activités comptables JEAN PHILIPPE MICHEL PIERRE BERNARD
9 Travaux d installation d eau et de gaz en tous locaux JEAN PHILIPPE MICHEL DAVID ALAIN
10 Hôtels et hébergement similaire JEAN PIERRE MARIE JACQUES MARINE
11 Conseil pour les affaires et autres conseils de gestion JEAN PIERRE MICHEL PHILIPPE ALAIN
12 Travaux de maçonnerie générale et gros oeuvre de bâtiment JEAN PIERRE MICHEL PHILIPPE BERNARD
13 Travaux de peinture et vitrerie JEAN PIERRE PHILIPPE MICHEL LAURENT
14 Conseil en systèmes et logiciels informatiques LINE JEAN OLIVIER MICHEL ERIC
15 Restauration de type rapide LOU SAM ROSE JEAN BEN
16 Coiffure MARIE JEAN LINE NATHALIE SOPHIE
17 Activités des marchands de biens immobiliers PIERRE JEAN LAURENT ANDRE MARCEAU
18 Restauration traditionnelle PIERRE JEAN LOU MARIE LOUIS
19 Activités des sociétés holding PIERRE JEAN MICHEL PHILIPPE BERNARD
20 Agences immobilières PIERRE JEAN MICHEL LOUIS MARTIN
21 Location de terrains et d autres biens immobiliers PIERRE JEAN MICHEL MARTIN FRANCOIS
Données Infogreffe. Réalisation B. Coulmont

La réussite scolaire des jumeaux

Les résultats nominatifs au bac sont passionnants. On peut y lire la traduction scolaire d’inégalités sociales. Les candidats qui ont 3 ou 4 prénoms, par exemple, ont 2 points de pourcentage en plus de mention Très Bien. Les candidats ayant un nom à particule ont 6 points de pourcentage de mention Très Bien en plus. Les candidats ayant un an d’avance ou plus ont 22 points de pourcentage de mention Très Bien en plus (32% contre 10%).

Et je me suis aperçu aussi que certains candidats qui ont le même nom de famille et le même nombre de prénoms étaient de plus né le même jour et passaient le bac dans la même académie. Des jumeaux ? C’est assez probable (surtout quand ces noms de famille sont rares). Considérons-les, pour l’instant, comme des jumeaux.

La proportion de naissances gémellaires est, à la fin des années 1990, d’environ 15 naissances pour 1000 (cf un article sur les naissances gémellaires en France). La proportions de jumeaux passant le bac (général et technologique) en 2016 est de 15 pour 1000 candidats. A priori, c’est assez proche, ce qui semble confirmer que les “jumeaux” repérés à partir du trio nom-naissance-académie-(nombre-de-prenoms) sont bien d’anciennes naissances gémellaires arrivées jusqu’au bac.

Regardons comment se répartissent ces jumeaux en fonction des séries au bac (pourcentages en colonnes). J’ai du grouper les séries où les candidats sont peu nombreux, car le nombre de jumeaux est, quand même, relativement faible. L’analyse ci-dessous ne porte que sur les personnes ayant un nom de famille assez rare (j’ai enlevé les 150 noms de famille les plus fréquents pour éviter le paradoxe des anniversaires).

jumeaux non-jumeaux
BacES 26 23
BacL 8 11
BacS 50 39
TechnoAutre 7 14
BacSTMG 8 13

On repère deux choses. Les jumeaux se trouvent plus fréquemment que les autres candidats (non jumeaux) dans les séries du bac général, et donc moins souvent dans les séries du bac technologique. Et cette différence se perçoit aussi dans le détail : La moitié des jumeaux passent un bac S, ce n’est le cas que de 4 “autres candidats” sur 10.

Comment se répartissent les mentions des jumeaux et des autres candidats ? Là aussi les résultats sont intéressants. C’est à croire que les jumeaux décrochent beaucoup plus de mentions Très Bien que les non-jumeaux.

jumeaux non jumeaux
2e Session 9 14
Admis 24 30
Admis AB 29 28
Admis B 21 17
Admis TB 17 11

Alors que 11% des candidats ont une mention Très Bien, c’est le cas de 17% des jumeaux, qui ont aussi plus souvent des mentions Bien.

Les deux choses sont liées : c’est au bac S que les mentions Très Bien sont les plus fréquentes. Il faut donc examiner si, pour chaque série, cette différence se repère.

Séries et mentions
2e Session Admis Admis AB Admis B Admis TB
Bac ES
  jumeaux 10 24 31 21 14
  non-jumeaux 15 29 28 18 10
Bac L
  jumeaux 10 24 30 21 14
  non-jumeaux 15 31 28 17 10
Bac S
  jumeaux 7 19 26 23 24
  non-jumeaux 12 24 25 21 17
Techno Autre
  jumeaux 11 40 30 14 4
  non-jumeaux 15 36 32 14 4
Bac STMG
  jumeaux 15 36 35 12 1
  non-jumeaux 17 40 32 10 1
Résultats nominatifs, Bac 2016

C’est le cas. Quelque soient les séries, les jumeaux ont de meilleurs résultats au bac (un peu plus de mentions Très Bien, un peu moins de passages à l’oral).

Comment expliquer cette différence ?

  • les jumeaux ont de bons gènes de la réussite scolaire ? Bien sûr, c’est génétique tout ça.
  • les jumeaux peuvent s’épauler l’un l’autre et bénéficier d’un soutien fraternel : si Eden ne comprend pas, Loïs pourra l’aider
  • les jumeaux bénéficient d’un encadrement parental meilleur à la suite du choc lié à la naissance conjointe de deux personnes
  • les jumeaux sont plutôt issus de couples plus âgés et leur plus grande réussite est la conséquence de la plus grande intégration sociale des parents (relativement plus aisés que les parents les plus jeunes)
  • les « jumeaux » ici repérés ne sont pas de véritables jumeaux : je n’ai sélectionné que les “jumeaux” qui passaient le bac ensemble… Si, dans un couple de jumeaux, l’un a redoublé, alors aucun des deux n’est pris en compte (ce qui conduit, mécaniquement, à sélectionner parmis ceux qui réussissent). Si, dans un couple de jumeaux, l’un passe un bac général ou technologique et l’autre un bac professionnel, aucun des deux n’est pris en compte. Et l’on peut imaginer d’autres effets de sélection conduisant à ne retenir que celles et ceux qui réussissent déjà plus.

C’est à mon avis la dernière interprétation qu’il faut privilégier, dans un premier temps. Ces jumeaux à la réussite exceptionnelle sont des mirages de la sélection.