Billets récents

Une exploration des requêtes

Depuis un peu plus d’un an, les visiteurs de http://coulmont.com/bac/ ont fait 265000 requêtes. Le prénom Kevin a été entré 4600 fois, suivi par Marie (2500), Mathilde et Mohamed (2200). 15 000 prénoms différents ont été recherchés, dont Yseulys, Yssam, ou encore Yun (à une reprise).
Parce que seul le prénom et l’heure de la requête sont gardés en mémoire et que ni l’adresse IP, ni la configuration informatique, ni rien d’autre n’est enregistré, je ne peux savoir qui cherche 15 prénoms, qui n’en cherche qu’un seul.
Je me demandais si les prénoms recherchés étaient surtout les prénoms des bacheliers (les personnes cherchant à valider statistiquement leur classement) ou des prénoms d’enfants à naître (les futurs parents essayant de s’assurer statistiquement de leur choix).
Examinons d’abord les 50 prénoms les plus recherchés (ils ont été à l’origine de 65000 requêtes) : Kevin Marie Mathilde Mohamed Pierre Louis Charles Camille Antoine Adele Paul Nicolas Alexandre Thomas Louise Guillaume Claire Jean Francois Charlotte Baptiste Pauline Lea Julien Maxime Alice Juliette Sophie Chloe Arthur Julie Clement Mohammed Vincent Sarah Victor Manon Jeanne Agathe Anne Hugo Edouard Adrien Dylan Lucie Clemence Marion Romain Emma et enfin Olivier
Ce sont des prénoms qui, à eux tous, suffisent à nommer 35% des naissances de 1900. Et surtout, ils forment un groupe de prénoms qui nomme 26,5% des naissances de 1996. Les 50 prénoms les plus fréquemment recherchés sont les prénoms des bacheliers de 2012-2014.
bac-1-50
Les prénoms un peu moins recherchés (disons ceux qui sont entre le 51 et le 200e rang) sont surtout des prénoms des années 60-80 : on y trouve Axel, Damien, Delphine, Elsa, Loïc…
En dessous, entre le 201e rang et le 800e rang se trouvent les prénoms des parents des bacheliers : Claudine, Evelyne, Francis, Jean-Claude (recherché à 90 reprises)… Ce groupe de prénom nomme 55% des naissances de 1955
Et les prénoms très peu recherchés, ceux qui se trouvent sous le 800e rang ? On y trouve les prénoms des grands-parents mais aussi des prénoms en voie de croissance, des prénoms de plus en plus donnés depuis le début des années 2000. Ils ne peuvent couvrir que 10% des bacheliers de 2013, mais ils représentent 30% des naissances de 2012. Malheureusement pour les internautes, ces prénoms ne se trouvent pas dans la base : ils sont trop rares.
bac-1-15000
Il semble donc y avoir, grosso modo, une relation entre la popularité des requêtes et les générations.

Les notes du bac

Comment ont évolué, au cours des dernières années, les notes au bac ? Dans le cadre des discussions politiques autour des “bourses au mérite”, un examen de la dispersion de ces notes peut être révélateur.
La MENESR-DEPP dispose d’une série, “Distribution des candidats présents au baccalauréat professionnel, technologique ou général selon la moyenne finale obtenue”, entre 2006 et 2013, que l’on va étudier ici. Notons tout de suite que l’on ne prend en compte que les candidats présents, pas les candidats inscrits au bac mais ne le passant pas ou passant seulement une partie des épreuves, pour une raison ou une autre.

Commençons par les bacs professionnels : le graphique ci-dessous indique qu’environ 40% des élèves obtiennent le bac pro avec entre 10 et 12 de moyenne. Au cours des 9 dernières années, la proportion d’élèves obtenant entre 8 et 10 a eu tendance à baisser. Notons que, sur la même période, il y a eu une réforme du bac pro et une forte augmentation des effectifs.
bacpro20062013

Poursuivons par les bacs techno : les notes semblent un peu plus concentrées autour de la moyenne.
bactechno20062013

Terminons par les bacs généraux : les notes sont moins concentrées autour de la moyenne, et on remarque une tendance à la diminution de la proportion des notes inférieures à 10.
bacgeneral20062013

Si l’on anime ce dernier graphique, en faisant défiler les différentes années les unes après les autres, voici ce que cela donne :
bacgeneralanimation
On remarque mieux les mouvements d’une année sur l’autre.

L’intérêt de la série de la DEPP est sa finesse : les moyennes sont disponibles au dixième de point près.

On voit, sur ce graphique, l’attraction pour les notes rondes. Il est entièrement faux de dire que “on donne le bac à tout le monde”. Seul un tiers d’une cohorte d’élève obtient le bac dans les temps écrivent T. de Saint-Pol et J. Cayouette : “seul un tiers des élèves entrant en 6e parvient effectivement à ce diplôme dans le temps initialement prévu”. Et à quoi servirait de recaler un élève pour 0,1 0,2 ou 0,3 points ? La barrière est-elle plus importante que le niveau ? Les jurys évaluent donc, pour les notes rondes, l’ensemble des éléments dont ils disposent. Ainsi, environ 5% des candidats obtiennent une moyenne comprise entre 10 et 10,0999.
repartition-dixieme
Entre 5/20 et 9,9/20, la répartition des notes forme deux “vagues”, résultat, sans doute, de la barrière à 8/20 pour passer à l’oral, et de l’attirance pour le 10 qui crée la bachelière. Et ensuite, l’on repère l’attraction qu’exerce les 12, 14 et 16, barrières des mentions. Le 18, qui ne donne aucune mention (les “félicitations du jury” n’existant absolument pas, sauf dans l’esprit de quelques parents), ne donne pas lieu à un pic.

Mais un phénomène intéressant est repérable vers les très hautes notes. La proportion de candidats obtenant in fine une moyenne supérieure à 18/20 est passée, entre 2006 et 2013 de 0,4% à 1,8%. Les candidats ayant une note supérieure à 19 sont passés de 160 à près de 1600. Le 20/20 était obtenu par 6 candidats en 2006, et par un peu plus de 60 candidats en 2013.
bignotes-evolution
Les très hautes notes sont toujours un signal. La mention “TB” remplissait “de mon temps”, ce signal, quand les IEP quasiment d’office admettaient les candidats l’ayant reçue, ce qui a maintenant pris fin. Ce sont les “20/20″ qui, maintenant, sont interviewées par la presse régionale.

Ton prénom n’est pas unique

Chaque personne est unique, mais son prénom beaucoup moins. Coca-Cola l’a bien compris (faisons ici comme si Coca était une personne).
Depuis quelques années, Coca édite des canettes “personnalisées” : une centaine de prénoms d’abord, puis plus de 250 (été 2013), et enfin, cette année, 1000 prénoms.
Ainsi, une bonne partie de la population née en France est couverte par cette personnalisation. Avec 1000 prénoms, c’est presque 80% des personnes nées vers 2000 qui peuvent trouver bouteille à leur nom, et plus de 60% des jeunes enfants nés vers 2010.
coca-proportions
Mais 1000 prénoms ne couvrent pas toute la population. Plusieurs prénoms sont absents de la liste, dont la transcription francophone de celui du prophète de l’Islam. Mais aussi Georgette, Mauricette, Marcelle, Renée, Simone, qui ne se trouvent pas dans le cœur de cible de la marque (en revanche, les Mathis, Léna, Hugo, Maelys, nés vers 2010, peuvent se trouver sur des canettes).
Voici les 50 plus “gros” prénoms ne se trouvant pas dans la liste 2014 des prénoms-Coca.
coca-non-non
De fait, une bonne proportion des personnes nées avant 1930 sont décédées… Il reste peu de Simone en vie par comparaison aux Simone nées.
Une autre manière de représenter l’intérêt pour certaines générations est de se concentrer sur la proportion du “top 100″ ou du “top 1000″ couvert par la liste des 1000 prénoms Coca. Tous les prénoms du “Top 100″ après 1950 sont dans la liste. Coca s’intéresse bien aux prénoms les plus répandus. Mais Coca est plus sélectif quand on compare avec le “Top 1000″ des prénoms les plus répandus une année données. Ainsi, au maximum, seuls 80% des prénoms du “Top 1000″ de 1990 (les 1000 prénoms les plus donnés aux bébés cette année-là) se trouvent dans la liste Coca.
coca-top
Il y a donc une liste d’environ 200 prénoms qui se trouvent dans cette liste et qui ne devraient pas s’y trouver si Coca suivait uniquement la liste des fréquences.

Jeunes électeurs, vieux électeurs, à Paris

Toujours en partant des listes électorales, voici une estimation rapide de la densité de jeunes électeurs et électrices (de moins de 20 ans) et de la densité des séniors parmi les seniors, les électrices de plus de 91 ans (il y a moins d’électeurs, à cet âge). Des courbes de niveaux indiquent les zones de densité moyenne équivalente.
jeunes-vieux
Cliquer pour agrandir

L’image est parlante : la densité de jeunes électeurs est importante dans les quartiers populaires, et celle des super-seniors dans des quartiers plus bourgeois. Mais l’indicateur est imparfait. Les zones peu peuplées (8e arrondissement, par exemple) contiennent par définition peu d’électeurs, mais ne contiennent-elles pas plus de vieux électeurs que de jeunes électeurs ?
Ainsi une carte qui s’intéresserait à la proportion de jeunes électeurs (ou de vieux électeurs) parmi l’ensemble des électeurs donnerait une image un peu différente de Paris.

Paris, ville monde

Les listes électorales parisiennes (1,2 millions d’individus) renseignent sur le pays de naissance des électeurs parisiens. Une partie d’entre eux est née à l’étranger. Plus de 6000 au Viet Nam, un peu plus de 5000 au Liban, etc… On compte même un (ou une) électeur(e) né(e) au Vatican, ou plutôt ayant déclaré être né(e) au Vatican.
Ces électeurs sont peut-être “nés étrangers à l’étranger”, mais ils sont peut-être “nés français à l’étranger”. Mais l’étranger n’est pas toujours l’étranger : l’Algérie fut un moment des départements français, et les Algériens furent eux-aussi un moment des électeurs français. Et les pays changent de nom : où donc ont bien pu naître les électeurs français nés en “U R S S” ? Plus de 200 pays apparaissent dans ces listes : Paris est bien une ville-monde.
Mais il y a des mondes différents dans cette ville-monde.
Prenons donc les électeurs nés dans quelques pays choisis et examinons la dispersion spatiale de ces électeurs. J’ai superposé aux cartes des courbes de niveau qui donnent une idée imparfaite de la densité.
mondes-paris
L’on distingue bien des zones préférentielles : le Nord-Est parisien populaire, le Sud-Est du 14e arrondissement. Les électeurs et électrices nés au Liban ont ici une répartition bien spécifique : ils ont choisi le Paris du Sud-Ouest, 16e et 15e arrondissement. Reste à comprendre pourquoi…
Les électeurs nés aux États-Unis d’Amérique, eux, sont d’abord peu nombreux, mais aussi peu concentrés. Ils évitent visiblement le Paris populaire pour préférer le Paris touristique ou bourgeois.
La localisation a été réalisée grâce aux données du “projet BANO“, mais les coordonnées des points ont été légèrement modifiées. Note sur la lecture enfin : ce n’est pas parce qu’une zone est toute orange ou toute rose que les électeurs y résidant seraient majoritairement nés à l’étranger.

Nouvelle édition

Sortie en librairie le 9 octobre.
nouvelleeditionlivre

La vie associative à Nantes (1)

Le site open-data de Nantes, data.nantes.fr, est riche. On y trouve : un fond de carte des “quartiers”, un fond de carte des “bureaux de vote”, la liste (avec les adresses) des associations, et enfin un fichier avec la géolocalisation de chaque adresse postale. En combinant ces fichiers, il est possible de repérer dans quels “microquartiers” la vie associative est plus développée, ou, au moins là où les associations sont implantées.

nantes-associations

Les Nantais ou les spécialistes de la Sociologie de Nantes comprendront sans doute mieux que moi la logique des implantations.

La réalisation a consister à assigner à chaque adresse de Nantes le nombre d’associations qui y avaient élu domicile (pas leur siège, mais leur lieu d’activité), et ensuite à associer à chaque adresse un “bureau de vote” correspondant, et enfin à associer à chaque bureau de vote le nombre d’associations qui se trouvaient dans son ressort.

Voici le code R :

library(maptools)
library(sp)
library(RColorBrewer)
library(classInt)
 
# shapefile des quartiers de Nantes
# Charger le fichier des adresses
adresses<-readShapeSpatial("~/Desktop/nantes/ADRESSES_NM_shp_l93/ADRESSES_NM.shp")
adresses<-subset(adresses,adresses$NOMCOM=="NANTES")
adresses$ADRESSE<-iconv(adresses$ADRESSE,from="latin1",to="ASCII//TRANSLIT")
adresses$ADRESSE<-toupper(adresses$ADRESSE)
# Charger le fichier associations
associations <- read.csv("~/Desktop/nantes/nantes-associations.csv",header=T)
# charger le shapefile des bureaux de vote de Nantes
nantesbv<-readShapeSpatial("~/Desktop/nantes/DECOUPAGE_BUREAUX_VOTE_NANTES_shp_l93/DECOUPAGE_BUREAUX_VOTE_NANTES.shp")
 
assoces<-associations[,c("SIEGE_NUM","SIEGE_VOIE","LIEU_ACT_NUM","LIEU_ACT_VOIE","LIB_THEME")]
assoces$SIEGE<-paste(assoces$SIEGE_NUM,assoces$SIEGE_VOIE)
assoces$LIEU<-paste(assoces$LIEU_ACT_NUM,assoces$LIEU_ACT_VOIE)
assoces$SIEGE<-iconv(assoces$SIEGE,from="UTF-8",to="ASCII//TRANSLIT")
assoces$LIEU<-iconv(assoces$LIEU,from="UTF-8",to="ASCII//TRANSLIT")
assoces$SIEGE<-toupper(assoces$SIEGE)
assoces$LIEU<-toupper(assoces$LIEU)
assoces$NB<-1
 
#assoces_adresses<-aggregate(NB~SIEGE,data=assoces,sum)
assoces_adresses<-aggregate(NB~LIEU,data=assoces,sum)
 
# associer les adresses des associations avec leurs coordonnées
#m<-match(adresses$ADRESSE,assoces_adresses$SIEGE)
m<-match(adresses$ADRESSE,assoces_adresses$LIEU)
adresses$NB<-assoces_adresses$NB[m]
 
# nantesbv : bureaux de votes de nantes
# associer chaque adresse à un bureau de vote
# code non optimal : boucle "for" très lente
BV<-NULL
test2<-NULL
for (i in 1:nrow(adresses)){
for (j in 1:nrow(nantesbv))	{
ifelse(point.in.polygon(adresses@coords[[i,1]],adresses@coords[[i,2]],nantesbv@polygons[[j]]@Polygons[[1]]@coords[,1],nantesbv@polygons[[j]]@Polygons[[1]]@coords[,2])==1,BV[i]<-j,test2<-j)
}
}
 
adresses$BV<-nantesbv$IDBURO[BV]
assoc_bv<-aggregate(NB~BV,data=adresses,sum)
m<-match(nantesbv$IDBURO,assoc_bv$BV)
nantesbv$NB<-assoc_bv$NB[m]
nclr <- 7
plotclr <- brewer.pal(nclr,"RdYlBu")[nclr:1] 
class <- classIntervals(nantesbv$NB, nclr, style="fisher",dataPrecision=0)
colcode <- findColours(class, plotclr)
par(mar=c(1,1,1,1))
plot(nantesbv,col=colcode,border="black",lwd=.1)
legend(348479,6698193,legend=names(attr(colcode,"table")), fill=attr(colcode, "palette"), cex=2, bty="n",title="Nombre d'associations")
plot(quartiers,add=T)
title(sub="Réalisation Baptiste Coulmont, http://coulmont.com | Données : data.nantes.fr",cex.sub=1,adj=0,line=-3)
title(main="La vie associative à Nantes",line=-1.7,cex.main=3,adj=0)

Created by Pretty R at inside-R.org

Des flèches, des carrés

Le recrutement des universitaires est une affaire sérieuse. C’est pour ça qu’à Paris 8, un (une?) anonyme a produit une série de flèches et de carrés colorés pour qu’on ne s’y perde pas. C’est probablement un chargé de mission de la sous-direction opérationnelle du service de l’Organigramme, très compétent par ailleurs. L’essentiel, de toute façon, est de savoir que tout est à rendre pour avant-hier. Et il faut aussi, pour s’y débrouiller, connaître les vrais raccourcis, qui ne sont pas mentionnés ici (vous remarquerez quand même qu’une flêche-en-tiret signifie un “lien hors circuit formel”).

arbitrage-paris8

Heureusement, Paris 8 a prévu (a pré-prévu) des “instances de pré-arbitrage”, ouf !

zigouigouis-paris8

Le choc de simplification, à Paris 8, s’accompagne donc d’une tentative de dé-linéarisation de l’administration. Et, c’est amusant, cela conduit déjà à des discussions longues sur les prérogatives de telle ou telle instance, car textes, schémas et habitudes ne coïncident pas toujours.

Docimologie

L’échec à l’université est une question importante. Le gouvernement actuel s’en préoccupe en mots principalement : sur le terrain, on voit surtout la diminution des recrutements d’enseignants chercheurs, l’absence d’aides pérennes, la maigreur des budgets, les injonctions à l’excellence (qui ne prennent jamais en compte l’engagement pédagogique).
Pour objectiver un peu l’échec, j’ai demandé la liste des notes obtenues par les étudiantes en majeure de sociologie, et j’ai retenu un échantillon de 156 étudiantes de première année de licence, qui s’étaient inscrits pour la première fois à Paris 8 en 2013. Ce sont des étudiantes ayant obtenu au moins une note.
Ce qui m’intéresse ici, c’est la relation entre moyenne générale (non pondérée) et nombre de notes obtenues. Car nos étudiants sont adultes : rien ne les oblige à venir en cours (sinon l’obligation d’assiduité inscrite dans le règlement intérieur), et rien ne les oblige à être étudiants “à plein temps”.
notes-et-notes
19 étudiantes n’ont obtenu qu’une seule note l’année dernière, la moyenne de ces individus est de 5/20.
Les étudiantes ayant plus de 8 notes, qui ont passé plus de 8 examens, forment un groupe qui réussit aux examens. La moyenne de ce groupe est nettement supérieure à 10/20. Les étudiantes qui passent peu d’examens, elles, ont des notes en général bien basses : elles n’obtiendront pas leur licence, à la fois parce que leurs notes sont trop faibles, mais aussi parce qu’elles ne passent pas les examens.

À son nom

Les prénoms nous entourent. Et parce qu’ils servent de terme d’adresse (“Salut Eddy !”), de terme de référence (“Tu connais Edouard ?”) individuels ou de classificateur collectifs (les Louis sont des garçons), ils se prêtent à des usages troubles. Revenons donc, après ceci et cela, sur les prénoms dans la réclame.

Récemment, @brooklynbridge m’envoyait la photo suivante, une publicité Coca sur laquelle quelques protestations se faisaient entendre. « Et Mohamed ? »
coca-mohamed
Difficile à lire, mais d’autres commentaires s’ajoutaient : Et Sofiane ? Et Kelly ? Et Minh ? Kim ?
Voici quelques années maintenant que les publicitaires de la boisson gazeuse utilisent les prénoms. Mais pas n’importe lequel : “votre” prénom. Fini les bols à son nom, voici la canette.
coca-retrouvez
Mais à la différence de variables simples, comme le sexe (le plus souvent dichotomisé), la profession (ramenée à une nomenclature à six modalités) ou l’âge (ramené à quelques grands groupes, 18-25, 25-40, 40-60…), il existe plusieurs dizaines de milliers de prénoms différent en circulation, voire quelques centaines de milliers, rien qu’en France. Et n’allez pas dire à Priscillia qu’elle est une Precylia : l’orthographe fait la personne.
Coca va laisser insatisfait un grand nombre de personnes : il faudrait quelques milliers de prénoms différents pour couvrir 80% de la population.
karim-coca
Sauf à imaginer la fabrication sur mesure de canettes à son nom.

La publicité n’a fait, ici, que suivre les usages. « Monsieur le Premier Ministre, mon cher Manuel » écrivait, hier, l’ancienne ministre de la culture sur sa lettre de dé-motivation. Même les sociologues utilisent, pour nommer leurs personnages, très souvent, des prénoms. Mais dans la pub, Coca est un cas à part: il n’y a pas toujours personnalisation/individualisation du consommateur, le prénom est le plus souvent utilisé comme indicateur d’un groupe de classe/ethnicité/genre/âge.
Voici une récolte de publicité, réalisée au cours des derniers mois, principalement dans le métro parisien.

aider-karine

Deux hommes, deux femmes (dont une “issue de l’immigration”), mais l’on parle toujours de l’Homme :
amel-edf

Une jeune femme (probablement née vers 1995) :
camille-haut

Clémence (mais cela aurait pu être Victoire ou Coline … mais pas Cynthia)
clemence-livre

Les associations et les commerces trans-nationaux signalent à demi-mots le public visé.
yezekiel

emma-aider
Parfois le corps redouble le prénom :

idriss-banque

khalid-banque

La ratp, entreprise citoyenne, favorise la diversité :

lounes-ratp

Mais si on laisse faire la ratp, on se retrouve vite avec des prénoms “bien de chez nous” :
serge-josephine
Des prénoms de hipster, comme Marcel :
marcel

Lauriane est “Responsable”, Sophie est “Assistante” :
lauriane-responsable
sophie-assistante

Lola est moustachue :
lola-asterix

Certains en perdent même leur titre :
pierre

Dispositif narratif, le prénom vise à assurer, en l’absence de corps, l’identité d’un personnage tout au long d’un texte. Il n’y a que dans les romans expérimentaux de Claire Chazal ou d’un collègue historien démographe de l’EHESS que l’on observe une variabilité importante. Il en va de même dans les publicités, concentré narratif :

muriel-orpi

romain-livre

thomas-livre

Déformation professionnelle : certains mots ressemblent à des prénoms.

virginie-jambon

Eux aussi font partie de notre monde. Ils ont aussi un prénom, une race, un genre :
malix-chien

oscar-chien

Les prénoms nous entourent.