Categories

Archives

Archives de la catégorie : 'General'

Réseaux de disciplines

Mise à jour d’un graphique déjà présenté ici, concernant l’espace partagé des disciplines.

Je m’appuie ici sur les postes universitaires (professeur·e·s et maître·sse·s de conférences) rattachés à plusieurs sections du Conseil national des universités. Ça donne à voir un espace de l’interdisciplinarité, et notamment un grand espace de disciplines proches, en sciences humaines et sociales.

Professions et couples de même sexe

Depuis que le Recensement ne recode plus le sexe du conjoint (ou de la conjointe) quand le couple est de même sexe, il est possible d’étudier ces couples de même sexe. Du moins une partie de ces couples. Dans le graphique suivant, on trouvera les professions où la proportion de couples de même sexe est élevée. Je différencie les professions par sexe, et ainsi les « Stewards » sont les hommes de la profession « 546d » (Hôtesses de l’air et stewards). Les « Ambulancières salariées » sont les femmes de la profession « 526e : Ambulanciers salariés ». Et attention, je ne calcule ces proportions que sur les personnes en couple (il n’y a pas 9% d’ambulancières en couple avec une personne de même sexe, il y a 9% des ambulancières-en-couple qui sont en couple avec une personne de même sexe).

Ce graphique a été créé à partir des données du « Recensement 2021, fichier détail, individus localisés à la région » de l’Insee.

La spirale de Du Bois

Dans un cours de visualisation des données (une introduction à {ggplot}), j’ai rapidement présenté quelques graphiques réalisés par le sociologue W.E.B Du Bois pour l’exposition universelle de Paris en 1900. Si vous ne connaissez pas ces graphiques et le contexte de leur création, regardez cette série d’articles : W. E. B. Du Bois’ staggering Data Visualizations are as powerful today as they were in 1900.
Une étudiante m’a demandé s’il était facile de reproduire ces graphiques avec R. On trouve des réplications de ces graphiques réalisées avec R :

Mais je n’ai pas trouvé de réplication de ce graphique :


Daniel Murray collection (Library of Congress).

Alors je me suis mis au travail, et voici le résultat :

(J’ai déposé le code sur github)

C’est pas du Pont

Je suis heureux de voir la publication de « Dupont n’est pas du Pont. Sociographie de la noblesse d’apparence », un article sur les noms à particule, dans la revue Histoire & Mesure. Les lectrices de ce blog connaissent mon intérêt pour l’onomastique, et notamment pour les noms à particule, que portent Vicomtes, Duchesses, Princes… mais aussi des personnes qui n’ont rien de la noblesse d’Ancien régime.

L’article est disponible sur cairn.info et des documents annexes sont accessibles ici.

C’est que, la particule, ça vous change un homme. Sur ces affiches, Dany Vicomte Daniel de Boon joue sur deux clichés, à gauche celui du ch’ti sympa mais pas futé, à droite celui du nobliau hautain et méprisant, “de Boon des Hauts de France” (qui semble imiter le duc de Wellington). Voilà qui demandait une investigation sociologique…

Trève de blague… L’article est essentiellement composé de deux parties. L’une qui explore la diminution de la part des gens à particule dans divers secteurs des élites françaises (écoles supérieures, magistrature, assemblées élues, hiérarchie cléricale catholique…), une diminution qui commence en 1789 mais qui n’est pas achevée aujourd’hui. S’il y a régression vers la moyenne, le rythme de la régression est lent.
La seconde partie explore la place contemporaine des hommes et femmes à particule à partir de sources nominatives diverses, ce qui permet de mettre en lumière des différences résidentielles (qui s’expliquent par l’inertie immobilière), des différences professionnelles et des différences politiques.

Mourir, une activité comme une autre ?

Mourir, ça semble être une activité sociale comme une autre. Avec les petits problèmes posés par les difficultés à interroger les personnes ayant accompli cette activité.
On ne meurt donc pas tout à fait au même moment suivant l’âge et la période :


cliquez pour agrandir

Alors certes, sur le graphique précédent, les demi-savants vont me dire “l’axe des ordonnées ne commence pas à zéro”, et cette visualisation laisse croire à des écarts plus importants qu’en réalité. Mais certaines tendances sont intéressantes : mis à part entre 10 et 39 ans, on meurt moins le week-end qu’en semaine, parce qu’on meurt aujourd’hui “à l’heure de l’hôpital”. On meurt le week-end quand on meurt d’un accident de voiture, mais les politiques visant à réduire l’alcoolisme au volant semblent, depuis les années 1970, avoir une certaine efficacité… au sens où la distribution s’égalise dans la semaine.

Si, au lieu de s’intéresser à la base des décès, on s’intéresse à la base des accidents de la circulation (qui recense les personnes décédées mais aussi les personnes blessées ou non), on peut aussi distinguer des variations suivant l’heure de l’accident.


cliquez pour agrandir

L’âge moyen des personnes accidentées varie de 30 ans vers 3 heures du matin (les vieux dorment, à cette heure là) à 46 ans vers 10 heures du matin (les jeunes sont occupés, à l’école ou au travail). Et si l’on distinguait par jour de la semaine, on verrait que l’âge moyen passe nettement sous les 30 ans dans la nuit du vendredi au samedi, et du samedi au dimanche.

Sources : Fichier des personnes décédées (sur data.gouv.fr) et Base de données accidents corporels de la circulation (aussi sur data.gouv.fr). Code R sur Github

Les dessous d’une carte

Qu’ai-je du faire pour tracer cette carte, que l’on trouve dans le billet écrit avec Lucie Bargel et intitulé « À la campagne, la victoire est en ville », sur le blog Terrains de campagne

D’abord, que représente-t-elle ? Les zones où il y a plus d’inscrit.e.s sur les listes électorales que de résident.e.s français.es majeur.e.s.

Il faut d’abord récupérer les résultats électoraux à l’échelle des communes. Par exemple, les résultats de la présidentielle de 2012. Ces listes indiquent, pour chaque commune, combien il y a d’inscrits sur les listes, ce qui est essentiel pour pouvoir calculer, par exemple, un taux d’abstention.
Il faut ensuite récupérer les Fichiers détails du recensement 2012 (fichier « individus localisés au canton-ou-ville »), car ces fichiers permettent de sélectionner les Français majeurs (les individus recensés, de nationalité française, et âgés de 18 ans ou plus en 2012). Les résultats du recensement agrégés à l’échelle des communes, que l’on trouve facilement sans avoir de calcul à faire n’indiquent pas si les personnes majeures sont de nationalité française.
Et on rapproche les deux bases : Inscrits et Résidents.
Mais : la géographie du recensement de l’année N est celle de l’année N+2. Par exemple, si la commune de Triffoulli a été fusionnée avec la commune des Oies en 2012 ou 2013, les résultats du recensement sont diffusés pour la nouvelle commune de Triffoulli – Les Oies.
Il faut donc faire passer la base Inscrits de la géographie 2012 à la géographie 2014.
De plus, les résultats du recensement sont diffusés non pas toujours à l’échelle des communes, mais à celle du “Canton-ou-Ville” (à la géographie N+2). Il faut donc associer à chaque commune du fichier des Inscrits le Canton-ou-Ville dans lequel elle se trouve.
Et là, on peut faire la jointure des deux bases et calculer un ratio Inscrits/Résidents-français-majeurs.

Et ça ne suffit pas : il faut aussi transformer le fonds de carte “Geofla communes” (2014) en fusionnant les polygones des communes qui appartiennent aux mêmes “cantons-ou-villes”. Maintenant, on peut associer le ratio calculé précédemment à la carte.

La carte que l’on ferait pour l’année 2012 révèlerait une géographie intéressante. La sur-inscription est fréquente dans les petites villes de plateau et de montagne, et dans une série de villages du littoral. Mais… les enquêtes annuelles de recensement ont lieu tous les cinq ans, avec une méthode particulière pour les petites villes. Est-ce que la carte ne serait pas une illusion ?
C’est pour cela que j’ai souhaité m’assurer de la stabilité de cette géographie sur plusieurs années, plusieurs recensements, des élections différentes. La distribution géographique est stable. Il reste à l’analyser.

Pour aller plus loin : « À la campagne, la victoire est en ville », sur le blog Terrains de campagne

Gauche parisienne

Dans le graphique suivant, j’ai calculé la proportion des suffrages exprimés qui se sont portés sur des listes ou des candidats de gauche (extrême-gauche exclue), à Paris, entre 2001 et 2017, lors des premiers tours des élections.


cliquez pour agrandir

On repère, dans tous les arrondissements, des effets de période : en 2007, le vote de gauche est particulièrement faible au premier tour de la présidentielle. Et quelque chose d’identique arrive en 2017 (où, quand même, il n’était pas possible de classer le candidat Emmanuel Macron parmi les candidats de gauche).
On repère aussi assez bien les grandes différences entre arrondissements. À peine 20% des voix (les bonnes années) se portent sur des candidats ou des listes de gauche dans le 16e arrondissement. C’est souvent plus de 60% des voix dans le 20e arrondissement.
Et la tendance, globalement, est à la baisse : Paris vote, année après année, un peu plus à droite. Mais il n’est probablement pas judicieux de faire commencer la série en 2001, l’année de la victoire de Bertrand Delanoë à la mairie de Paris.

Il est possible, assez simplement, de “neutraliser” les effets de période en regardant, pour chaque arrondissement, l’écart à la moyenne parisienne. Dans certains arrondissements, l’on vote deux fois moins pour la gauche que la moyenne parisienne (par exemple 20% quand la moyenne est à 40%). Dans d’autres, on vote autant ou plus. Cette comparaison à la moyenne donne le graphique suivant :


cliquez pour agrandir

La comparaison avec la moyenne linéarise presque totalement les scores : le 12e arrondissement vote tout le temps comme la moyenne parisienne.[jwplayer mediaid=”8814″]

On voit alors émerger une tendance intéressante. Un accroissement des écarts : dans les 6e, 7e, 8e, 16e, la tendance à la diminution des votes de gauche est plus forte que la tendance parisienne moyenne. Et au contraire, les 18e, 19e, 20e, tout en voyant faiblement diminuer ou se maintenir la part des votes de gauche, voient une chute plus faible que la moyenne. Ils apparaissent d’autant plus à gauche que le reste des Parisiens y apportent moins leurs suffrages.

Sociologue, quand-est-ce que tu soutiens?

En France, on repère une saisonnalité des soutenances. Après les récoltes, après le Beaujolais nouveau, vient le moment des soutenances de thèses, concentrées sur le mois de décembre. Ainsi, environ 10% des thèses de l’année seront soutenues cette semaine, comme le montre le graphique ci-dessous :

cliquez pour agrandir

L’une des raisons est la date limite fixée par le Ministère de l’enseignement supérieur pour pouvoir être candidat à la «qualification» aux postes universitaires. En général, la date limite était située fin décembre. Par exemple, cette année, il faut que les rapports de soutenance de thèse soient téléchargés dans l’application de candidature avant le 18 décembre.
Cette répartition dans l’année ne diffère pas beaucoup suivant les disciplines. Biologistes et sociologues, neuroscientifiques et psychologues préfèrent les soutenances en fin d’année. Les thèses de mathématiques / mathématiques appliquées sont mieux réparties dans l’année, avec trois pics d’égale intensité en mai, en septembre et en décembre.

cliquez pour agrandir

Mais si les répartitions saisonnières diffèrent peu, il en va différemment du jour de soutenance dans la semaine. Les soutenances le dimanche sont extrêmement rares (ce sont peut-être des erreurs de saisie). Le vendredi est le jour préféré d’un grand nombre de disciplines. Mais le choix du samedi différencie certaines disciplines :


cliquez pour agrandir

Près d’un quart des thèses en histoire , 20% des thèses des philosophes, 10% des thèses en droit public… sont soutenues un samedi, alors que c’est inconnu en biologie.
Les explications de cette spécialité sont incomplètes. Pour certains, ce serait lié au non-financement des thèses en sciences humaines (les doctorantes exerçant un travail salarié en dehors du monde académique doivent soutenir un jour chômé), mais cela n’explique pas les différences fortes entre Histoire et Sociologie, ou même entre Histoire et Géographie. D’autres font intervenir les cultures de soutenance : dans certaines disciplines, c’est une cérémonie collective où tout le laboratoire est invité, dans d’autres, l’absence de véritable vie de laboratoire fait que l’on ne cherche pas à organiser la soutenance pendant un jour de travail. D’autres mentionnent la taille des jurys: un jury de 7 ou 8 personnes génère des incompatibilités de calendrier qui occasionneraient un repli stratégique vers le samedi. D’autres encore insistent : c’est du au manque de salles dans certaines universités en semaine. [Mais sur ce point, j’ai contrôlé par l’université de soutenance et la période de soutenance, et les différences entre disciplines samediphobes et samediphiles se maintiennent.]
Voici donc un dernier graphique. Si vous êtes doctorant en histoire de l’art, il y a plus d’une chance sur quatre que vous souteniez un samedi.

cliquez pour agrandir

Sociologue, qu’est-ce que tu fabriques ?

Vous parcourez peut-être ces lignes parce que vous venez de lire ma chronique publiée dans Le Monde, dans le cahier « Science & Médecine » du mercredi 5 décembre 2018, et que vous avez voulu en savoir un peu plus ?

Le point de départ de la chronique est l’étrange impression de voir les rayons des librairies et des bibliothèques se couvrir d’ouvrages dont le titre est, en gros, « La fabrique de… ». [Cela m’avait d’ailleurs déjà amusé il y a quelques années]

Ce billet a pour but de donner quelques éléments de comparaisons quantitatives. Et la conclusion (si les données ne sont pas toutes biaisées) est la suivante : après 2005, les chercheurs en sciences sociales se sont mis à « la fabrique » : dans leurs livres, dans leurs articles, dans leurs thèses. Que ce soient des sociologues de l’espace (les “géographes”), les sociologues du politique (les “politistes”), les sociologues du temps passé (les “historiennes”), ou les sociologues, la pression de la mise en fabrique devient visible.

Regardons d’abord dans le catalogue de la Bibliothèque nationale de France. «La fabrique de» est présent dans de nombreux titres, et de plus en plus : on est passé de 0 titres par an avant 1990, à 5 titres par an jusque vers 2000… et il y a eu 45 titres comprenant “la fabrique de” en 2017. Certes le nombre d’ouvrages publiés augmente, mais pas à ce rythme.
 

Et dans le détail, on pourrait voir que “fabrique” était plutôt un verbe en 1970, c’est le nom commun maintenant [graphique non reproduit].

Regardons ensuite dans Google Scholar en cherchant les références ayant, en titre, le mot “fabrique”. La qualité de cette base laisse à désirer, mais la tendance est la même. Avec, cependant, une petite diminution au cours des dernières années.
 

Le problème avec Google Scholar, outre l’augmentation importante du nombre d’articles universitaires produits (qui a pour conséquence de rendre plus probable un article avec “fabrique” en titre), c’est l’absence d’informations précises sur le champ des publications considérées comme suffisamment savantes pour y être indexées.
[Note : j’ai comparé le nombre d’articles portant “fabrique” en titre au nombre d’article portant “maisons” en titre ou “confiance” en titre : la croissance de “fabrique” est bien plus importante après 2005. Mais j’ai conscience qu’il faudrait aller plus loin.]

Il faut alors aller plus loin.
J’ai récupéré des informations sur environ 400 000 thèses (à partir du site theses.fr) pour vérifier que « la fabrique » se diffusait. Ce qui est intéressant dans cette base, c’est qu’il est possible d’établir des proportions de l’usage de “fabrique”.
C’est un terme plus fréquent en Science politique, en géographie, en Sociologie, en Histoire, en InfoCom, en Histoire de l’art, en Littérature française, en science de l’éducation… qu’en “science des matériaux”, qu’en “mécanique”, qu’en Chimie, qu’en Génie des procédés ou Génie électrique… des disciplines où l’on doit pourtant vraiment fabriquer des choses. Signe, peut-être, qu’il ne s’agit pas vraiment de “fabriquer” quelque chose.
Et c’est un terme qui, en effet, est de plus en plus présent dans les titres des thèses des disciplines fabricophiles, comme le montre le graphique suivant :
 

Il ne faut pas vraiment tenir compte du panel “Année d’inscription”, qui est mal renseigné dans la base theses.fr. Je l’ai inclus parce que la variable était disponible…
Les thèses en cours de rédaction semblent avoir une proportion encore plus importante de titres-à-fabrique. Si ces titres ne changent pas d’ici à la soutenance de ces thèses, il faut donc s’attendre à la hausse de la courbe au cours des prochaines années. Pour l’instant, dans les disciplines concernées par le graphique, 14,5 futures thèses sur 1000 ont, en titre, une fabrique.

J’ai aussi regardé sur la base Crossref, qui contient des informations intéressantes (et un package pour le logiciel R, très utile).
 

Vous ne serez pas surpris de voir que, là aussi, de nombreux articles comportent le mot «fabrique» en titre. Près de 70 pour les articles parus en 2017. Il y a probablement des double-comptes, et des articles qui ne sont que des compte-rendus (d’ouvrages qui ont “fabrique” en titre)…

Entrepreneurs à particule

Le Fichier “SIRENE” contient des informations sur des millions d’entreprises françaises. Et, pour près de 4 millions d’entre elles, on dispose du nom de famille de l’entrepreneur, ou de l’entrepreneure. Il est alors possible de calculer, par secteur d’activité (à partir du code NAF), la proportion d’entrepreneurs dont le nom comporte une particule.

C’est dans la gestion de sites et de monuments historiques que la proportion d’individus à particule est la plus forte (un cinquième des entrepreneurs de ce secteur ont un nom à particule). On les trouve ensuite dans la sylviculture, l’exploitation forestière et la gestion de fonds. Dans les Musées, la reliure, l’édition, l’administration d’immeubles et les relations publiques.


cliquez pour agrandir

Et où sont-ils absents, les entrepreneurs à particule ? La sécurité, la récupération de déchet, l’élevage porcin, la dératisation…

cliquez pour agrandir [attention : l’échelle de ce second graphique n’est pas la même que celle du premier graphique]

Intitulés de la NAF Particules %
Gestion des sites et monuments historiques et des attractions touristiques similaires 20.0
Sylviculture et autres activités forestières 6.0
Exploitation forestière 4.5
Gestion de fonds 3.6
Reliure et activités connexes 3.1
Activités des agences de placement de main-d’œuvre 2.9
Autres services d’information n.c.a. 2.9
Location et location-bail de matériels de transport par eau 2.7
Administration d’immeubles et autres biens immobiliers 2.7
Activités combinées de soutien lié aux bâtiments 2.7
Autre mise à disposition de ressources humaines 2.6
Location et location-bail de camions 2.6
Activités des organisations religieuses 2.6
Organisation de jeux de hasard et d’argent 2.5
Gestion des musées 2.5
Transports maritimes et côtiers de passagers 2.4
Édition de livres 2.4
Action sociale sans hébergement n.c.a. 2.4
Travaux de maçonnerie générale et gros œuvre de bâtiment 2.3
Conseil en relations publiques et communication 2.2

 
Et les secteurs où la proportion d’entrepreneurs à particule est la plus faible :
 

Intitulés de la NAF Particules %
Activités de conditionnement 0.2
Récupération de déchets triés 0.3
Commerce de gros (commerce interentreprises) de déchets et débris 0.3
Sciage et rabotage du bois, hors imprégnation 0.3
Commerce de gros (commerce interentreprises) de composants et d’équipements électroniques et de télécommunication 0.4
Activités liées aux systèmes de sécurité 0.4
Entreposage et stockage non frigorifique 0.4
Fabrication d’articles de papeterie 0.4
Fabrication d’autres ouvrages en béton, en ciment ou en plâtre 0.4
Fabrication de cacao, chocolat et de produits de confiserie 0.4
Autres intermédiations monétaires 0.4
Élevage de porcins 0.4
Commerce de détail d’équipements automobiles 0.4
Installation de structures métalliques, chaudronnées et de tuyauterie 0.4
Fabrication de biscuits, biscottes et pâtisseries de conservation 0.4
Fabrication de bière 0.4
Élevage d’autres bovins et de buffles 0.4
Production de boissons alcooliques distillées 0.4
Élevage de vaches laitières 0.4
Désinfection, désinsectisation, dératisation 0.4