De “simples statistiques” ?
Depuis quelques années, j’utilise les résultats nominatifs au bac pour donner à voir une des dimensions de l’espace social. Des prénoms différents sont en effet associés à des proportions différentes d’accès à la mention “Très bien”. Cela n’a rien à voir avec les prénoms eux-mêmes : des groupes sociaux différents utilisent des prénoms différents, et l’on sait que les résultats scolaires des enfants dépendent fortement des diplômes des parents.
Sociologie d’une évidence, mais encore fallait-il le montrer. J’ai mis en place un “mini-site”, le “projet mention” qui permet de savoir quelle est la proportion de mentions obtenue par les porteurs de tel ou tel prénom (plus de 1100 prénoms sont renseignés).
Temporellement, l’intérêt des non-sociologues pour ce travail est lié à la publication résultats du bac : un peu avant le 14 juillet.
Mais la semaine dernière, une avalanche de liens, partis d’un article sur un site, demotivateur.fr, a reproduit un petit (tout petit) “buzz”. Voici une partie des articles, par ordre chronologique : 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21
Ces articles, recopiés, copiés, plagiés les uns sur les autres, proposent une lecture prospective de statistiques “constatatives”. Si n% des Adèle ont eu mention TB au cours des trois années précédentes, il est fort probable que n% (± m%) l’obtiendront cette année. En effet, la structure des goûts, qui reflète partiellement la structure sociale, évolue plus lentement que les saisons. Je pourrais, moi-même, faire cette lecture. Mais le démotivateur.fr et ses suiveurs vont plus loin, en escamotant la structure sociale, ils me font dire l’opposé de ce que j’écris. En proposant un “Top 10 des prénoms de filles qui ont eu les meilleurs résultats au bac…” et un “Top 10 des prénoms de filles qui se sont un peu laissé aller…” ils créent un palmarès, qui, malheureusement, est un faux palmarès (les “Philomène” ont encore plus de mentions TB que les “Adèle”). Un graphique a même été produit, par @FrancoisKeck sur twitter pour expliquer le raisonnement :
Enfin, ces articles concluent par une formule très bizarre, très très bizarre :
On trouve ainsi des formules comme : “rassurez-vous, ce ne sont que des statistiques”, ou “il s’agit de simples statistiques”. J’avoue avoir du mal à comprendre. Ce sont certes de “simples statistiques”, au sens où il y a création d’une proportion [1000 Adèle ont eu 8 ou plus au bac entre 2012 et 2014, et 200 ont obtenu une mention TB, ce qui fait 20% des Adèle]. Mais leur simplicité, ici, c’est leur force. Elles reflêtent des résultats réels. Que 2% des Cynthia ont obtenu une mention TB — et qu’il existe donc des élèves excellentes prénommées Cynthia — ne devrait pas “rassurer”. Cela reste 10 fois moins fréquent que pour les Adèle. Que veut donc dire l’expression : “ce ne sont que des statistiques” ? Si c’est pour souligner que si 20% des Adèle ont eu mention TB, cela signifie que 80% ne l’ont pas obtenu… cela reste un raisonnement statistique. C’est sans doute pour dire autre chose que cette expression est utilisée : pour entretenir la croyance à l’autonomie absolue de l’individu, car, après tout, “je ne suis pas une statistique”. Ces articles, en cherchant à rassurer (“il existe des Grégoire qui passe à l’oral”), passent sous silence ce qui constitue l’évidence sociologique, le poids de l’origine sociale dans le destin collectif.
Continuons avec des critiques de détail : le démotivateur.fr et les articles derivés ont réutilisé un graphique modifié par une personne qui ne connaissait pas les échelles logarithmiques et ne savait pas les lire, et qui a ajouté des couleurs et des chiffres qui n’ont aucun lien — mais vraiment aucun lien — avec les données.
Avec l’étude des résultats nominatifs au bac, j’avais essayé de faire de la sociologie simple, pédagogique. D’explorer un espace limité. Je m’aperçois qu’il faut, mille fois, se remettre à l’ouvrage [par exemple, à la radio], rendre mon propos plus clair, plus précis. Même s’il ne s’agit que du calcul d’une proportion et de la relecture d’un résultat établi par plus de 60 ans de sociologie de l’éducation.
[yarpp]
2 commentaires
Un commentaire par JCG (01/01/2015 à 15:13)
Bonjour,
Tout à fait d’accord avec votre analyse et merci pour cette illustration de corrélations, avec la notion de fréquence des prénoms.
Intuitivement, il serait intéressant de regrouper les prénoms par “provenance”, en particulier la fréquence, pour certains (notamment à gauche du graphique), de leur apparition dans des films ou séries télévisées / dessins animés des années 80-90, soit en fait dans les 3-5 ans précédant la naissance des bacheliers en question.
Les autres provenances évidentes sont la “tradition française” ou la littérature ou encore la simple reproduction des prénoms des aïeux.
Cela permettrait d’avoir des “clusters” ou sans doute apparaîtraient des corrélations intéressantes, même si ce choix intuitif a priori peut sembler discutable.
Il manque un élément dans le rendu de vos résultats: la proportion de données éliminées (par refus d’utilisation).
Cordialement
Un commentaire par Espoir (01/01/2015 à 18:00)
Je crois comprendre votre propos global. Je n’en suis pas tout à fait sûre car après trois opérations du cerveau, j’ai du mal avec les maths, en particulier avec les statistiques. Il me semble que vous défendez la validité de votre analyse. Ainsi, les statistiques ne seraient pas “que des” statistiques, mais seraient signifiantes et pertinentes au-delà de tout individualité, car -en l’occurrence du point de vue de la réussite scolaire si j’ai bien compris- nous serions “déterminés” par notre groupe social d’origine.
Je suis moi aussi déterminée, favorablement et défavorablement, par mon origine sociale, mais sur le plan de la santé aussi bien physique que psychologique. Je suis encore en vie alors que, “statistiquement” je devrais être morte depuis un an et demi. Je ne sais pas combien de temps je serai plus forte que les statistiques, mais je peux vous dire une chose : j’ai un grand besoin, un immense besoin, un besoin désespéré, de pouvoir me dire que “ce ne sont que des statistiques”, et que “je ne suis pas une statistique”. Sinon j’abandonne et je me laisse mourir.
Dire “ce ne sont que des statistiques” cela revient à garder l’espoir, et cela peut être vital. N’est-ce pas plus important que d’avoir théoriquement raison ?
Cordialement.