Billets récents

Quelques relations

J’ai participé, pour voir, au Open-Data-Camp Elections organisé lundi dernier. De nombreux projets émergeaient en relation avec la libération des données des élections.
Mais comme un représentant de l’INA (Gautier Poupeau, @lespetitescases) proposait de travailler sur des données “semi-ouvertes”, sur les méta-données politiques des journaux télévisés, j’ai regardé s’il était possible de repérer des proximités entre individus à partir des co-participations aux reportages, interviews, etc…
J’ai retenu comme lien significatif les liens qui apparaissent au moins trois fois plus fréquemment que ce qui serait attendu si les individus étaient répartis au hasard dans l’espace médiatique :
reseau-ina-1
cliquez pour agrandir

Les couleurs sont liées à des “communautés” repérées à l’aide de l’algorithme WalktrapCommunity.
Rien de surprenant, mais c’est assez illustratif, et assez simple à faire.

Le Suicide en 1890

Le Compte général de l’administration de la justice criminelle donne, pour le XIXe siècle, le nombre annuel de suicides par département. En combinant ces chiffres avec ceux des recensements, il est possible de cartographier les zones suicidogènes et les zones protégées.
Ainsi, en 1890, le taux des suicides variait, dans les départements de France métropolitaine, entre 46 suicide par millions d’habitant et 556 suicides par million.
suicide-1890
Les recensements sont disponibles sur le site de l’INSEE à partir de 1851 et jusqu’en 1921.
Il me semble que le Compte général de la justice n’a malheureusement pas été transformé en fichier utilisable directement. On les trouve sur gallica.bnf.fr mais sous la forme de copies numériques. Il faut donc faire un petit travail de copie.
Le “Compte général de la justice” a de nombreuses informations sur les suicides : nombre annuel par département, différencié selon les hommes et les femmes, par tranche d’âge, par état civil (marié, veuf, avec ou sans enfants…) On a aussi des informations sur le lieu du suicide, sur le mode de suicide :
suicide-1890-mode
Nous disposons aussi de la répartition mensuelle et des professions des suicidés, croisées avec le “motif présumé” (la “grossesse hors mariage” est le motif principal des suicides des “domestiques”).
La transposition de ces informations en base de données utilisables sera probablement un des exercices que je donnerai dans le cadre du cours que je vais donner sur Le Suicide de Durkheim… si, véritablement, on ne trouve pas de fichier déjà disponible.

Le Grand Remplacement

Au cours du XXe siècle, les parents des bébés nés en France ont remplacé Simone par Léa, Robert par Théo. Ce grand remplacement orthographique est bien visible :
total
Cliquez pour élargir le graphique

En 1900, le E était la lettre la plus utilisée dans les prénoms des bébés nés en France (21% des lettres des prénoms étaient des E). En 2011, les A représentent 17% de l’ensemble des lettres utilisées dans les prénoms, et les E dans 13%.
Les Y ont cru jusqu’à constituer 2,5% des lettres utilisées. Les R passent de 10% à environ 3%.

Méthode : Si 3 bébés qui naissent en France en 1910, que 2 d’appellent BOB et que l’autre s’appelle BILL, alors le total des lettres est de 10 (BOB, BOB,BILL), soit, classé par fréquence d’apparition B,B,B,B,B,O,O,L,L,I. Les B représentent alors 50% des lettres utilisées dans les prénoms, les I 10%.

Cols blancs et cols bleus se marient-ils vraiment ?

Vous parcourez peut-être ces lignes parce que vous venez de lire le billet publié dans Le Monde, à la une du cahier « Science & Médecine » du mercredi 4 février 2015, et que vous avez voulu en savoir un peu plus ?

J’ai choisi de parler cette semaine du livre de Jessi Streib (Duke University), The Power of the Past : Understanding Cross-Class Marriages (lien amazon, kindle). La thèse dont est issue le livre est en accès libre : The Power of the Past : Class, Marriage and Intimate Experiences with Inequality (pdf) (University of Michigan, 2013).
Je cite aussi en passant un article récent de Milan Bouchet-Valat, qui n’est pas en accès libre mais un travail plus ancien l’est.
Le livre de Streib s’intéresse à l’envers de l’homogamie, aux couples mariés composés d’une personne issue des classes supérieures et d’une personne issue des classes populaires, aux Etats-Unis. Elle parle donc de “blue collars” et de “white collars”. Elle montre avec finesse ce qu’elle nomme les différences de “sensibilités” face au monde :

Those from different classes shared their lives but not their ideas of how to live them, their resources but not their ideas of how to use them, and their children but not their ideas of how to raise them. This book locates these and other differences in sensibilities — default ways of thinking about everyday events, such as how to use resources, divide labor, and raise children. This focus moves away from the more common connection that sociologists make between class and culture—that of a focus on tastes.
(Streib, Power…, kindle-190)

Elle justifie l’étude des “sensibilités” en soulignant plusieurs aspects : les sensibilités sont moins circonscrites (“containable”) à un seul domaine que les goûts, et elles sont liées à l’acquisition de ressources :

Sensibilities may be linked to resource acquisition as institutions implicitly reward different types of sensibilities. Generally, institutions such as workplaces and schools reward sensibilities that are most associated with the middle class.
(kindle-207)

Géographie des prénoms en Turquie, suite

Suite de l’étude des prénoms en Turquie commencée hier.
On dispose, pour chaque province, des 3 prénoms les plus donnés aux garçons et des trois prénoms les plus donnés aux filles. On peut considérer que plus deux provinces partagent des prénoms, plus elles sont similaires : si elles en partagent six, elles sont “semblables”.
Nous sommes limités dans l’analyse par le nombre réduit de prénoms et par l’absence d’informations sur la fréquence. Etre “numéro 1″ quand on est donné à 20% des garçons et “numéro 1″ quand on est donné qu’à 5% des garçons… ce n’est pas vraiment pareil.
J’ai réalisé une analyse en composantes principales (ACP) à partir des informations recueillies. Le premier axe n’est pas représenté : il est du à la seule province de Tunceli, petite et avec moins de 1000 naissances en 2013. Je ne représente ici que les axes 2 et 3.
pca-resume
L’axe 2 oppose des prénoms comme Hiranur, Nisanur, Muhammed et Yusuf à des prénoms comme Emir, Cinar, Kerem et Elif. L’axe 3 Mehmet et Mustafa à Irmak, Arda ou Emir.
Les individus, ici, sont les provinces : TR213 est Kiklareli province à la frontière de la Bulgarie (et que les Bulgares appellent Lozengrad).TRB24, c’ets Hakkari, à l’extrême Est de la Turquie (à la frontière avec l’Iran et l’Irak). D’un côté, à l’Ouest, les parents choisissent plutôt Emir et Elif, et à l’Est plutôt Nisanur et Muhammed.
Dans la carte suivante, les provinces sont coloriées en fonction de leur coordonnée sur l’axe 2 de l’ACP. Les rouges/orangées ont des coordonnées positives (les provinces à la droite du graphique, à l’Ouest géographiquement), les bleues foncées ont des coordonnées négatives (les provinces à l’Est, à gauche du graphique).

acp2

A partir d’une analyse des six prénoms les plus donnés aux enfants par province, en 2013, on voit apparaître des différences entre l’Est et l’Ouest de la Turquie.

Géographie des prénoms en Turquie

Le Turkish Statistical Institute publie des données intéressantes sur les prénoms les plus donnés en Turquie : j’avais commencé à les analyser avec Elifsu Sabuncu. Et je viens de m’apercevoir (suite à un article de Julie Desbiolles dans le Le Petit Journal . com) que les données sont ventilées par “province” dans certaines publications [comme : Istatistiklerle Çocuk 2013 (ISBN.978-975-19-5976-8)].

Commençons par les prénoms des garcons :
turquie-2013-garcons
Que retenir de ce patchwork ? Que les prénoms de la cote et des frontières occidentales (Emir et Cinar) ne se retrouvent pas (en première position) à l’Est.

Poursuivons avec les prénoms des filles :
turquie-2013-filles1
Plus d’unanimisme là : les parents turcs apprécient le prénom Zeynep, qui est presque partout le prénom le plus donné aux bébés filles en 2013.
Pour saisir des différences régionales, il faut regarder les rangs suivants. Le 2e prénom le plus donné nous donne la carte suivante : Elif est souvent le 2e prénom le plus donné. Et dans les régions où Elif est le prénom le plus donné, alors Zeynep est le 2e prénom le plus donné.

turquie-2013-filles2

En 2013, le prénom Ecrin — un prénom relativement neuf en Turquie — est le prénom le plus donné, ou le 2e prénom le plus donné dans les provinces de l’Est. Il apparaît au 3e rang dans de nombreuses provinces. Il manque des données sur la fréquence de ces prénoms, et sur leur évolution temporelle pour pouvoir en dire plus.

Compte rendu

Je signale, au passage, le compte rendu par Frédéric Roux de la deuxième édition de Sociologie des prénoms sur lectures.revues.org :

Cet ouvrage est la deuxième édition revue et corrigée, dans la célèbre collection « Repères », d’une synthèse, qui se propose de réunir un grand ensemble d’études sociologiques, historiques, anthropologiques mais aussi économiques dont le point commun est d’avoir le prénom pour objet central ou périphérique. L’auteur revendique d’emblée un point de vue à la fois « pluraliste » sur le plan méthodologique mais aussi « impérialiste », en mettant en avant le regard sociologique. Car il s’agit bien d’approfondir une intuition ancienne et déjà formulée par des écrivains selon laquelle le prénom est une fenêtre sur le monde social.
Lire la suite…

Charlie marqueur événementiel

La fréquence des prénoms est-elle sensible aux événements ?
En 1915, le général Joffre, perçu comme un héros militaire suite aux premières victoires françaises, inspira des parents. Il naquit quelques Joffrette, que la presse — patriotique en ces temps de guerre — célébra. Des réchauds à gaz et des biscuits furent aussi baptisés Joffrette et Joffrinette : l’imagination des publicitaires est sans limite.

joffrette-prenoms-presse

Balzac, qui tend parfois à expliquer l’origine des prénoms de ses personnages, indique ainsi [Beatrix, C.H., Tome 2, p.651] qu’un certain Calyste, né “le jour même de l’entrée de Louis XVIII à Calais”, reçu alors aussi le prénom de Louis.

Bref : les prénoms sont parfois choisis en hommage. Rien de nouveau. Rien d’étrange alors à que qu’un prénom comme Mazarine ou Barack, [quasi-]inconnus respectivement en France avant 1995 et aux Etats-Unis avant 2007, ne connaissent un petit succès, qui en 1996, qui en 2008-2009.
Et inversement, d’autres événements vont faire chuter certains prénoms. Les parents étatsuniens cessent de donner Hillary en 1992-1993, quand William J. “Bill” Clinton devient président et sa femme, Hillary Rodham, “First Lady”. De même Katrina connaît une chute brutale après le passage de l’ouragan du même nom en 2005-2006.

prenom-evenements

Que va-t-il se passer avec le prénom “Charlie” ? Il était, depuis une dizaine d’années, en forte croissance, à la fois comme prénom de garçon et comme prénom de fille. Les parents vont-ils continuer à le donner de plus en plus, ou vont-il cesser de le faire en raison de l’association avec les attentats du 7 janvier : on trouve déjà des “Charly” qui disposent maintenant d’une nouvelle connotation : leur prénom “dit quelque chose” (mais quoi?). Si quelques témoignages ou les premiers éléments permettent de repérer en une dizaine de jours une vingtaine de bébés Charlie dans les “Carnets” de la presse quotidienne, ce n’est peut-être qu’un feu de paille.

Mais dès 1915, les stratégies parentales d’hommages s’accommodent de la multiplicité des prénoms. Un entrefilet dans La Croix le remarque :

joffrette-lacroix-1915-web

De très nombreux bébés naissent en France avec plusieurs prénoms, des seconds prénoms invisibles dont on a beaucoup de mal à se souvenir (que celles et ceux qui connaissent les seconds prénoms de leurs cousins et cousines lèvent la main). Ces seconds prénoms servent aux hommages familiaux — et ce d’autant plus que l’arrière-grand mère avait un “joli” prénom. Ils servent de réceptacles aux prénoms démodés des parrains — parfois, quand l’enfant est baptisé. Ils servent de tiroir aux prénoms sur lesquels le consensus ne s’est pas fait. Ils servent aussi, dans le cas présent, d’hommage indélébile mais invisible :

Prénom Charlie : pic d’attribution en 2e et 3e choix à Paris [Elodie Moreau] (…)
Si, pour l’heure, on ne note pas d’ « effet Charlie » sur l’ensemble du territoire, la capitale fait exception en la matière. Davantage de jeunes parents parisiens ont en effet choisi Charlie en 2e ou 3e prénom pour leur enfant. « C’est une nouveauté », nous confirme la mairie de Paris. Depuis mercredi dernier, ce prénom a été attribué 11 fois en 2ème ou 3ème position sur près de 670 naissances.

ou encore :

«Charlie» se glisse dans les berceaux des maternités [Aline Gérard]
« On s’en est aperçu lors de la déclaration de naissance d’un petit garçon né le 10 janvier. Ses parents lui avaient donné comme troisième prénom Charlie. D’habitude, les couples choisissent comme deuxième ou troisième prénom celui d’un ascendant ou d’un parrain. Mais là, il n’y avait aucun Charlie ni dans la généalogie, ni dans l’entourage », raconte un agent des services de l’état civil de la mairie du XIIIe arrondissement de Paris.
« Ces parents placent Charlie généralement en troisième ou quatrième position », précise-t-on à la mairie du XVe où, là aussi, on a repéré le phénomène. « En quelques jours, on a vu passer une petite dizaine de déclarations de ce type, qu’il s’agisse de garçons ou de filles », constate, de son côté, la mairie du XIIe arrondissement.

L’hommage onomastique passera donc peut-être, en janvier-février 2015, par la multiplication des “Charlie” en deuxième position : un marquage conjugal / familial du moment de la naissance, marquage invisible aux yeux de presque tous, mais marquage permanent. Le prénom inscrit aujourd’hui les personnes dans des générations, des classes d’âge. Il peut aussi marquer le moment, l’événement (la conjonction de l’événement parental et de l’événement politique).

Elles sont Charlie

Ou alors ils sont Charlie. Leur naissance a eu lieu après le 7 janvier. On trouve leur trace dans les “Carnets du jour” publiés par la presse quotidienne.

*

charlie-02

*

charlie-03

*

charlie-01

*

charlie-06

*

charlie-05

*

charlie-04

*

charlie-07

*

charlie-08

*

charlie-09

*

charlie-bracelet

Rappelons, à tout hasard, qu’avant même les attentats, Charlie était un prénom mixte en forte croissance :
charlie-insee

Mises à jour :
charlie-10

*

charlie-11

*

charlie-12

*

charlie-13

*

charlie-14

*

charlie-15-cliniquebourgoin

*

charlie-16

*

charlie-17

De “simples statistiques” ?

Depuis quelques années, j’utilise les résultats nominatifs au bac pour donner à voir une des dimensions de l’espace social. Des prénoms différents sont en effet associés à des proportions différentes d’accès à la mention “Très bien”. Cela n’a rien à voir avec les prénoms eux-mêmes : des groupes sociaux différents utilisent des prénoms différents, et l’on sait que les résultats scolaires des enfants dépendent fortement des diplômes des parents.
Sociologie d’une évidence, mais encore fallait-il le montrer. J’ai mis en place un “mini-site”, le “projet mention” qui permet de savoir quelle est la proportion de mentions obtenue par les porteurs de tel ou tel prénom (plus de 1100 prénoms sont renseignés).
Temporellement, l’intérêt des non-sociologues pour ce travail est lié à la publication résultats du bac : un peu avant le 14 juillet.
Mais la semaine dernière, une avalanche de liens, partis d’un article sur un site, demotivateur.fr, a reproduit un petit (tout petit) “buzz”. Voici une partie des articles, par ordre chronologique : 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21
Ces articles, recopiés, copiés, plagiés les uns sur les autres, proposent une lecture prospective de statistiques “constatatives”. Si n% des Adèle ont eu mention TB au cours des trois années précédentes, il est fort probable que n% (± m%) l’obtiendront cette année. En effet, la structure des goûts, qui reflète partiellement la structure sociale, évolue plus lentement que les saisons. Je pourrais, moi-même, faire cette lecture. Mais le démotivateur.fr et ses suiveurs vont plus loin, en escamotant la structure sociale, ils me font dire l’opposé de ce que j’écris. En proposant un “Top 10 des prénoms de filles qui ont eu les meilleurs résultats au bac…” et un “Top 10 des prénoms de filles qui se sont un peu laissé aller…” ils créent un palmarès, qui, malheureusement, est un faux palmarès (les “Philomène” ont encore plus de mentions TB que les “Adèle”). Un graphique a même été produit, par @FrancoisKeck sur twitter pour expliquer le raisonnement :

B5DTh09IQAEYyYy.png-large

Enfin, ces articles concluent par une formule très bizarre, très très bizarre :
demotivateur201412
On trouve ainsi des formules comme : “rassurez-vous, ce ne sont que des statistiques”, ou “il s’agit de simples statistiques”. J’avoue avoir du mal à comprendre. Ce sont certes de “simples statistiques”, au sens où il y a création d’une proportion [1000 Adèle ont eu 8 ou plus au bac entre 2012 et 2014, et 200 ont obtenu une mention TB, ce qui fait 20% des Adèle]. Mais leur simplicité, ici, c’est leur force. Elles reflêtent des résultats réels. Que 2% des Cynthia ont obtenu une mention TB — et qu’il existe donc des élèves excellentes prénommées Cynthia — ne devrait pas “rassurer”. Cela reste 10 fois moins fréquent que pour les Adèle. Que veut donc dire l’expression : “ce ne sont que des statistiques” ? Si c’est pour souligner que si 20% des Adèle ont eu mention TB, cela signifie que 80% ne l’ont pas obtenu… cela reste un raisonnement statistique. C’est sans doute pour dire autre chose que cette expression est utilisée : pour entretenir la croyance à l’autonomie absolue de l’individu, car, après tout, “je ne suis pas une statistique”. Ces articles, en cherchant à rassurer (“il existe des Grégoire qui passe à l’oral”), passent sous silence ce qui constitue l’évidence sociologique, le poids de l’origine sociale dans le destin collectif.
Continuons avec des critiques de détail : le démotivateur.fr et les articles derivés ont réutilisé un graphique modifié par une personne qui ne connaissait pas les échelles logarithmiques et ne savait pas les lire, et qui a ajouté des couleurs et des chiffres qui n’ont aucun lien — mais vraiment aucun lien — avec les données.

Avec l’étude des résultats nominatifs au bac, j’avais essayé de faire de la sociologie simple, pédagogique. D’explorer un espace limité. Je m’aperçois qu’il faut, mille fois, se remettre à l’ouvrage [par exemple, à la radio], rendre mon propos plus clair, plus précis. Même s’il ne s’agit que du calcul d’une proportion et de la relecture d’un résultat établi par plus de 60 ans de sociologie de l’éducation.