Categories

Archives

Une deuxième vague

En novembre 2020, la « Deuxième vague » de décès covid apparaît très visible dans les données publiées, presque en temps réel, par l’INSEE.

cliquez pour agrandir

La courbe rouge, les décès toutes causes confondues, dépasse largement le nombre de décès attendus, et est très proche de la courbe verte qui additionne le nombre moyen décennal de décès et le nombre de décès du covid.
L’INSEE fait un travail formidable de publication, semaine après semaine, des décès comptabilisés en France. Les chiffres les plus récents concernent les décès datant de 11 jours à peine.
Mais tous les décès ne sont pas parvenus à l’INSEE 11 jours après la date du décès. Parfois la remontée des informations met plus de temps.
Ce qui fait que, quand on représente sur un même graphique les différents fichiers publiés par l’INSEE depuis avril, on voit que les chiffres des décès les plus récents sont toujours révisés à la hausse.
Dans le graphique suivant, j’indique par une flèche rouge la différence entre le nombre initial de décès et le nombre final quand le fichier est publié environ onze jours après la date des décès. On le voit, la sous-estimation est toujours là.

Si on représente les choses autrement, en indiquant le ratio “nombre final de décès / nombre initial” en fonction de la distance temporelle entre la date de publication et la date du décès, on voit que, quand les décès sont très récents (environ 11 jours), le nombre final sera environ 10% plus élevé que le nombre initial. Cette sous-estimation est régulière et stable, et décroît rapidement.

On peut donc affecter les chiffres publiés d’un coefficient multiplicateur, pour avoir une idée plus précise du nombre réel de décès “à 11 jours”. C’est la courbe rouge, dans le graphique suivant :

Et c’est cette courbe redressée que j’utilise pour le graphique initial.

2020 : une mortalité spécifique

Dans le cadre de l’épidémie de covid19, l’INSEE a décidé de publier, chaque semaine, le nombre de décès quotidien des semaines précédentes, avec une partie des informations que l’on trouve dans le Fichier des personnes décédées, récemment déposé sur data.gouv.
Ces informations, publiées quasiment en « temps réel », permettent de visualiser la hausse de la mortalité en mars-avril 2020 par rapport aux années précédentes.
Le graphique suivant représente le nombre de décès quotidiens de 2001 à 2019 (en grisé) et le nombre de décès en 2020 (en rouge). En règle générale, le nombre de décès est élevé l’hiver, diminue régulièrement jusque vers juillet-août, pour ré-augmenter à l’automne. Les décès causés par la vague de chaleur de 2003 sont particulièrement visibles : pendant trois semaines, les décès avaient été bien plus nombreux que la moyenne, et pendant une dizaine de jours supérieurs au maximum des années 2001-2019.
Comme on peut le constater aussi, l’année 2020 avait commencé comme une année on ne peut plus normale : les décès quotidiens se trouvaient très proches de la moyenne.


cliquez pour agrandir

Ce graphique permet déjà de se faire une idée de l’importance de la pandémie : à partir de début mars 2020 et pendant un mois, la courbe de l’année (en rouge) s’écarte de la moyenne. À partir de début avril, un peu plus de deux semaines après le début du Confinement, le nombre de décès commence à diminuer. On constate la rapidité et la brutalité de l’augmentation au regard des autres épisodes épidémiques. Car on peut aussi mettre en lumière des épisodes de grippe particulièrement meurtriers au cours des années récentes, comme en 2015, 2017 et 2018, quand la courbe des décès quotidiens s’écarte, pendant plusieurs semaines, de la courbe moyenne. [Même s’il faudrait tenir compte de l’augmentation de la population française : il y a bien plus de résidents en 2018 (65 millions) qu’en 2001 (60 millions).] Tous ces décès “en plus” n’ont pas pour origine des grippes, mais, comme l’illustre Arthur Charpentier, ces données permettent d’estimer la surmortalité.


cliquez pour agrandir

On peut aller un peu plus loin, au risque de rendre le graphique moins clair. Tout d’abord on peut prendre en considération la sous-estimation du nombre de décès, dans les chiffres publiés par l’INSEE en « temps réel » : les chiffre publiés en “semaine 1” sont révisés à la hausse en “semaine 2”, et encore en “semaine 3”. Dans le graphique, il est donc très probable que le nombre de décès entre les 7 et 14 avril 2020, publié aujourd’hui, soit revu à la hausse la semaine prochaine : je vais m’appuyer sur les révisions passées pour estimer un nombre définitif. Dans le graphique suivant donc, le nombre de décès estimé — toutes causes de décès confondues — est en rouge pointillé.
On dispose aussi des décès suite à la covid19 recensés par les hôpitaux et les établissements d’hébergement pour personnes âgées dépendantes (Ehpad) : le nombre de ces décès est publié chaque jour, et on peut les récupérer sur le site de l’European Centre for Disease Prevention and Control, ce qui peut nous indiquer la tendance entre le 15 et le 24 avril 2020. Ces données (lissées par une moyenne mobile hebdomadaire) sont représentées en vert sur le graphique suivant. On constate un décalage : les chiffres hospitaliers sont publiés rapidement, ceux des Ehpad plus lentement, avec plusieurs jours de décalage.


cliquez pour agrandir

Au final, il y a eu, en mars et jusqu’au 24 avril 2020, plus de 29 300 décès en plus de la moyenne (mais comme c’est une moyenne bi-décennale, elle prend en compte des populations moins nombreuses).

Mourir, une activité comme une autre ?

Mourir, ça semble être une activité sociale comme une autre. Avec les petits problèmes posés par les difficultés à interroger les personnes ayant accompli cette activité.
On ne meurt donc pas tout à fait au même moment suivant l’âge et la période :


cliquez pour agrandir

Alors certes, sur le graphique précédent, les demi-savants vont me dire “l’axe des ordonnées ne commence pas à zéro”, et cette visualisation laisse croire à des écarts plus importants qu’en réalité. Mais certaines tendances sont intéressantes : mis à part entre 10 et 39 ans, on meurt moins le week-end qu’en semaine, parce qu’on meurt aujourd’hui “à l’heure de l’hôpital”. On meurt le week-end quand on meurt d’un accident de voiture, mais les politiques visant à réduire l’alcoolisme au volant semblent, depuis les années 1970, avoir une certaine efficacité… au sens où la distribution s’égalise dans la semaine.

Si, au lieu de s’intéresser à la base des décès, on s’intéresse à la base des accidents de la circulation (qui recense les personnes décédées mais aussi les personnes blessées ou non), on peut aussi distinguer des variations suivant l’heure de l’accident.


cliquez pour agrandir

L’âge moyen des personnes accidentées varie de 30 ans vers 3 heures du matin (les vieux dorment, à cette heure là) à 46 ans vers 10 heures du matin (les jeunes sont occupés, à l’école ou au travail). Et si l’on distinguait par jour de la semaine, on verrait que l’âge moyen passe nettement sous les 30 ans dans la nuit du vendredi au samedi, et du samedi au dimanche.

Sources : Fichier des personnes décédées (sur data.gouv.fr) et Base de données accidents corporels de la circulation (aussi sur data.gouv.fr). Code R sur Github

Qui épouse qui ?

L’homogamie, ou le fait d’épouser (ou d’être en couple) avec quelqu’un de socialement proche, est fréquente. Un bon nombre d’enseignant.e.s sont en couple avec des enseignant.e.s. Idem avec les ingénieur.e.s, ou les avocat.e.s. Mais parfois, les couples sont formés de personnes occupant des professions proches, mais différentes.
Le graphique suivant considère qu’il y a un lien entre deux professions (dans des couples composés de personnes de sexes différents) quand le couple est bien plus fréquent que ce que l’on observerait si les couples se composaient de personnes sélectionnées au hasard dans l’espace social. Et j’ai différencié les couples non mariés des couples mariés.


cliquez pour agrandir

Explorons quelques coins de l’espace ainsi dessiné :


On a ici un monde d’employés de la restauration et de mécanicien.

Et un autre morceau de l’espace, juste en dessous : le monde de l’alimentation, de l’hotellerie et des magasins.

On terminera par un monde de la fonction publique : agents des impots, magistrature… allié au monde médical.

Celles et ceux qui souhaitent explorer peuvent chercher les professions “pivot”, celles qui font le lien entre un monde et un autre.

Le taux de suicide départemental en France, 1827 – 2012

[jwplayer mediaid=”8839″]

Le taux de suicide s’exprime en nombre de décès par 100 000 individus. Pour calculer ce taux (brut) à l’échelle des départements de la France métropolitaine, il faut donc à la fois le nombre de suicides et la population du département.
En France, on dispose, grâce au Compte général de l’administration de la justice criminelle, du nombre de suicides par départements depuis 1827, jusque 1931. Il faut juste tout recopier, à la main, dans un tableau. Ce sont des statistiques judiciaires, qui contiennent aussi une partie des tentatives de suicide connues de la justice.
On dispose aussi, depuis 1906, de statistiques dites “sanitaires”, issues des certificats de décès. Depuis 1968, c’est l’INSERM qui s’en occupe.
Mais il y a des trous : en raison des guerres, en raison de problèmes administratifs, certaines années ne sont pas disponibles. Ainsi on ne connait pas le nombre de suicides à Paris en 1870. On ne sait pas ce qui se passe en Alsace entre 1919 et 1925…
La population départementale est connue précisément à partir des recensements : mais ces recensements, jusqu’au début des années 2000, étaient réalisés tous les 5 ou 10 ans.
Pour produire l’animation, j’ai donc du extrapoler, imputer et lisser les données. Quelle est donc la population de l’Ariège en 1863 ? Si on connaît la population de 1861 et celle de 1865, on peut se dire que c’est entre les deux. L’effet des guerres, qui font chuter le taux de suicide, n’est pas visible ici : les cartes, trop lissées, font comme si rien n’avait eu lieu. Parfois, dans des départements à la population réduite, une poignée de suicides en plus (ou en moins) fait brutalement augmenter (ou chuter) le taux à un moment, sans que cette hausse se poursuive les années suivantes : je lisse donc les pics de la courbe.
L’ensemble permet de rendre visible l’augmentation du taux de suicide au XIXe siècle, que ce taux soit le reflet d’une augmentation de la fréquence réelle des suicide ou celui d’une plus grande attention administrative portée à l’identification des suicides. On repère aussi bien l’augmentation qui a lieu à partir du milieu des années 1970 et le reflux à partir de la fin des années 1980.

Évêques à particule

En 1789, la quasi totalité des évêques de l’Église catholique romaine étaient, en France, issus de la noblesse. Ce qui fait que la quasi totalité portait un nom à particule. À Agen c’était Jean-Louis d’Usson de Bonac, à Aix c’était Jean-de-Dieu-Raymond de Boisgelin de Cucè…
Certes la particule du nom de famille n’est pas un indicateur parfait de l’appartenance à la noblesse : si tous les nobles ou presque ont désormais un nom à particule, la très très grande majorité de celles et ceux qui on un “de”, un “du” ou un “des” dans leur nom de famille ne sont pas descendant d’un ancêtre noble du même nom. Il n’empêche : en France, encore aujourd’hui, Madame du Pont n’est pas Madame Dupont. Ne serait-ce que sur un seul point : Madame du Pont est très rare : moins d’1% des personnes résidantes en France ont un nom à particule.

Le graphique suivant s’intéresse à la proportion d’évêques à particule en France, entre 1500 et 2017. [J’ai fait ça un peu rapidement : j’ai considéré, par exemple, que les frontières actuelles de la France étaient les frontières en 1700, etc… Et j’ai traité les données de manière automatique : des erreurs de traitement sont toujours possibles.]
Mais ce graphique est bien illustratif. Il montre notamment que, sous l’Ancien Régime, petit à petit, la particule devient à la mode dans la noblesse. En 1500, tous les nobles ne portaient pas de particule (d’autres éléments de l’identité permettaient de signaler l’appartenance au Second ordre). À la toute fin de l’Ancien Régime, les nobles ont attaché une particule à leur nom.

Périodisons un peu ce graphique :
L’effet de l’Empire (et du Concordat) est visible : sous Napoléon, la proportion d’évêques à particule chute. Elle rebondit dès les débuts de la Restauration. Mais le pli est pris et chaque nouveau coup d’État, au XIXe siècle, va faire chuter la proportion d’évêques particuliers.

Cliquez pour agrandir

Il faudrait que je propose, pour le XXe siècle, une périodisation par pontificats : après la Séparation, la nomination des évêques est affaire de l’Église seule. Et il se pourrait bien que quand l’Église entre dans une phase réactionnaire, les évêques à particule augmentent en nombre et en proportion, alors que dans les phases libérales, la proportion diminue.

L’écart d’âge entre conjoints

En France, l’écart d’âge entre conjoints (de sexes différents) est de 2 ans et demi. En moyenne, dans un couple, l’homme est 2,5 ans plus âgé que la femme.
Mais il y a une géographie de cet écart d’âge. En France métropolitaine, voici ce que cela donne, à partir du “Fichier détail individu” du Recensement 2014. L’intérêt du Fichier détail du recensement, c’est de pouvoir travailler sur près de 4,5 millions de couples (effectif non pondéré). Les zones sous la moyenne sont en bleu, les zones au dessus de la moyenne sont en rouge.

Du bassin minier au nord à la Charente, l’écart d’âge est faible. Dans le centre et en Corse, il a tendance à être plus élevé. Même chose en région parisienne et particulièrement en Seine Saint-Denis. On pourrait certainement trouver une explication culturaliste ou matérialiste : France du partage égalitaire et des petites fortunes à l’Ouest, formes d’héritages autrement constituées au Centre. Clanisme corse ? Mais il y a, pour un sociologue, d’autres explications.
On sait, par exemple, que l’écart d’âge est plus important pour les couples âgés que pour les jeunes couples. Il se pourrait donc que les variations de l’écart d’âge soient dûes au fait qu’à certains endroits de France habitent surtout des couples jeunes, et qu’à d’autres endroits, des couples plus âgés résident.
Dans la carte suivante, je “contrôle” par l’âge moyen du couple (c’est à dire la moyenne de l’âge de chaque conjoint), au niveau individuel. Puis je trace la carte des écarts par rapport à cette moyenne. Par exemple, dans les couples dont l’âge moyen est 35 ans, l’écart d’âge moyen est de 2,5 ans. Si l’écart constaté pour le couple n° 2 542 447 est de 3 ans, alors je considère qu’il est 0,5 an plus âgé (c’est le “résidu”). La carte suivante représente donc la moyenne des résidus par zone.

Ce contrôle par l’âge n’a pas tendance à atténuer les différences entre zones. Il semble avoir peu d’effet.
On va alors contrôler par la catégorie socio-professionnelle : car les femmes cadres ont des goûts en matière d’hommes que n’ont pas les femmes ouvrières ou agricultrices. De fait, les couples “cadres-cadres” ont un écart d’âge plus faible que les couples “ouvriers-ouvrières”. Et il se pourrait donc que les écarts d’âge moyens par zone soient dûs à la composition socioprofessionnelle de ces zones.
La carte suivante montre, par l’éclaircissement des coloris, que, en effet, le contrôle par la CS réduit les écarts. Une bonne partie des zones “très rouges” ou “très bleues” étaient de cette couleur en raison de la composition sociale.

Mais on sait aussi que les personnes qui ont un diplôme du supérieur n’ont pas les mêmes choix que les personnes qui n’ont pas de diplôme. On contrôle alors par ce niveau de diplôme. Là encore, on voit un effet :

Enfin il semble y avoir toujours une zone rouge en Seine Saint-Denis. L’on sait que c’est le département où la proportion d’immigrés est la plus importante, en France. Or les immigrés (c’est à dire les personnes nées étrangères à l’étranger) ont pu se marier avant d’arriver en France. De fait l’écart d’âge dans les couples immigrés est plus élevé (peut-être en raison d’un effet de sélection lors de la migration, peut-être en raison de la composition socioprofessionnelle de ce groupe). On va donc contrôler par l’âge moyen du couple, la CS des conjoints, le diplôme des conjoints et le fait d’être immigré ou non-immigré.
La carte s’éclaircit et “jaunit”, car de nombreuses zones bleues deviennent jaunes clair : il n’y a presque plus de différences entre régions françaises si la structure de la population est prise en compte. Quelques mois d’écart tout au plus.

Reste le cas de la Corse. Il y a visiblement, là, un goût pour l’écart d’âge qui ne s’explique pas par les variables utilisées ici.

Ma vie dans l’EDP (1)

Une demi-journée par semaine, voire un peu plus, je me plonge via Big_Stat à l’INED dans l’Echantillon démographique permanent (EDP). Le but : comprendre “l’inscription ailleurs”, le fait d’être inscrit ailleurs que sur son lieu de résidence. C’est quelque chose de fréquent : cela concerne près d’un.e inscrit.e sur cinq.

Première découverte : l’EDP est découpé en “bases études”. Chaque base-étude contient l’ensemble de l’EDP, pour un millésime donné (avec les informations rétrospectives, recensements, etc…). Mais attention : les identifiants individuels de l’EDP-2012 ne sont pas ceux de l’EDP-2014. Première demi-journée de perplexité, avant de comprendre, et de tout reprendre à zéro.

Deuxième découverte : le lieu d’inscription électorale, quand ce n’est pas le lieu de résidence, n’est pas un lieu abandonné. C’est un lieu investi. Si on n’a pas été radié, c’est qu’on a encore (parfois) des attachements dans ce lieu. Une des bases de l’EDP porte sur les mariages. Et on peut regarder où se marient (en 2014) les personnes qui, en 2014 par exemple, sont “inscrites ailleurs” que sur leur lieu de résidence. Ca fait peu de monde (il faut sélectionner les individus EDP recensés en 2014, français, majeurs, inscrits sur les listes électorales, mais “inscrits ailleurs” que sur leur lieu de résidence, et qui se sont mariés en 2014). Nous partîmes 4 millions, nous arrivâmes 600.

     Femmes Hommes Effectifs
2012 27,5   19,5   600
2014 26,5   19,4   620

J’ai aussi fait le calcul pour 2012 aussi. Un quart des femmes, un cinquième des hommes (inscrits ailleurs et qui se marient) choisissent comme lieu du mariage non pas le lieu de résidence, mais le lieu de l’inscription électorale.

Alors certes, les effectifs ne sont pas énormes. Il faut que je fasse la même opération de sélection avec, par exemple, les recensements de 2008 à 2014. Il faudrait aussi que je travaille sur le lieu de résidence antérieur, ou sur les lieux d’inscription postérieurs au mariage : car le mariage est peut-être le dernier moment d’inscription ailleurs (le moment où certains arrêtent d’être inscrits chez leurs parents et où, enfin, ils s’inscrivent là où ils résident).

Le petit remplacement : note sur la fécondité des nobles (d’apparence)

À la fin du XIXe siècle, les bébés à particule ne représentaient que 0,4% des naissances. À la fin du XXe siècle, 100 ans après, ils représentent 0,9% des naissances. Comment expliquer cela ? Une hypothèse, c’est de dire que les “de Souza” ont remplacé les “de Rochechouart”, et qu’on n’est même plus chez nous en France, hein !
Mais il semble que d’autres hypothèses moins farfelues soient envisageables, ma bonne dame, si seulement vous étiez moins xénophobe.
Je commence par retenir les noms de famille n’apparaissant qu’une seule fois dans les naissances de la fin du XIXe siècle : entre 1890 et 1914, ces familles n’ont produit qu’un seul bébé. J’examine ensuite combien de bébés sont produits vers 1980, en comparant les noms à particule et les autres noms. La méthode est grossière, mais elle permet probablement de comparer la fécondité des descendants de noms très rares, présents en France à la fin du XIXe siècle, à celle des personnes portant un tel nom rare à la fin du XIXe siècle.

Pour être plus précis : Prenons les familles qui n’ont qu’un seul enfant à la fin du XIXe siècle, qui ont moins de 5 enfants 25 ans après, moins de 17 50 ans après et moins de 64 75 ans après. C’est une manière de retenir principalement les familles qui n’augmentent pas grâce à l’immigration mais surtout par la fécondité naturelle (en produisant au maximum 4 enfants tous les 25 ans).
7732 familles “nobles” correspondent à ce cas. Lors de la dernière période, elles ont produit 8238 enfants, soit une croissance de 1,06.
Les familles non-nobles sont plus nombreuses. Mais en fin de période, elles n’ont plus que 0,81 enfant pour chaque enfant produit à la fin du XIXe siècle. (Pour repérer cela, et avoir une idée du rapport plus élevé des nobles d’apparence, je prends 3000 échantillons de non-nobles de même taille que la population des familles à particule d’un même niveau de rareté).

rapport-patronymes
Cliquez pour agrandir

De la même manière, comparons les familles qui, à la fin du XXe siècle, ont 2 enfants (puis moins de 9, moins de 33 et enfin moins de 129). Les “nobles” se retrouvent avec 1,6 enfants pour chaque enfant de la fin du XIXe, les non nobles avec seulement 1,3 enfants.
Un dernier exemple : les familles qui démarrent avec 3 enfants : si elles ont une particule, elles produisent en fin de période 1,9 enfant pour chaque enfant; les familles sans particules n’en produisent que 1,4. Avec 4 enfants : 1,9 pour les nobles, 1,4 pour les manants.

Dans tous les cas, les familles à particule présentes en France à la fin du XIXe siècle et très rares semblent avoir une fécondité plus importante que les familles sans particule. Ou alors elles arrivaient mieux à transmettre leurs noms (mais comment le feraient-elles ?). Est-ce parce qu’elles se trouvent, plus souvent, au sommet de l’échelle sociale et qu’elles disposent d’un patrimoine plus fourni ? Qu’elles sont plus souvent que de coutume catholiques ? Qu’elles connaissent une mortalité infantile moindre ?

Les grandes familles sont des familles nombreuses (du moins un peu plus nombreuses).

Un autre indice des différences de fécondité peut être calculé à partir de la proportion de noms qui disparaissent, qui cessent de produire des bébés.

disparition-patronymes
cliquez pour agrandir

80% des noms sans particule très très rares à la fin du XIXe siècle ne produisent aucun bébé à la fin du XXe siècle. Ce n’est le cas que de 75% des noms à particule aussi rares. La différence est faible, mais elle signifie que les noms à particule très rares il y a 100 ans se maintiennent mieux sur la distance : et la comparaison entre nobles d’apparence et manants d’apparence est toujours au profit des gens à particule.

Note finale : n’étant pas démographe, il est fort possible que ma lecture et mon analyse du fichier des patronymes soit une hérésie.

Ectoplasme ! Moule à gaufre ! Ambassadeur à particule !

La diplomatie fut longtemps une occupation acceptable pour un aristocrate. Encore aujourd’hui, environ 4% des ambassadeurs français portent une particule (alors que la proportion dans la population française est inférieure à 1%). Une petite base comportant des informations sur 3000 nominations d’ambassadeurs (sur data.gouv.fr) depuis 1944 nous permet de repérer une tendance à la baisse.
ambassadeurs-nobles-1944-2012

[Merci à @Gilda_f pour le titre]