Categories

Archives

Archive for 2014

Ton prénom n’est pas unique

Chaque personne est unique, mais son prénom beaucoup moins. Coca-Cola l’a bien compris (faisons ici comme si Coca était une personne).
Depuis quelques années, Coca édite des canettes “personnalisées” : une centaine de prénoms d’abord, puis plus de 250 (été 2013), et enfin, cette année, 1000 prénoms.
Ainsi, une bonne partie de la population née en France est couverte par cette personnalisation. Avec 1000 prénoms, c’est presque 80% des personnes nées vers 2000 qui peuvent trouver bouteille à leur nom, et plus de 60% des jeunes enfants nés vers 2010.
coca-proportions
Mais 1000 prénoms ne couvrent pas toute la population. Plusieurs prénoms sont absents de la liste, dont la transcription francophone de celui du prophète de l’Islam. Mais aussi Georgette, Mauricette, Marcelle, Renée, Simone, qui ne se trouvent pas dans le cœur de cible de la marque (en revanche, les Mathis, Léna, Hugo, Maelys, nés vers 2010, peuvent se trouver sur des canettes).
Voici les 50 plus “gros” prénoms ne se trouvant pas dans la liste 2014 des prénoms-Coca.
coca-non-non
De fait, une bonne proportion des personnes nées avant 1930 sont décédées… Il reste peu de Simone en vie par comparaison aux Simone nées.
Une autre manière de représenter l’intérêt pour certaines générations est de se concentrer sur la proportion du “top 100” ou du “top 1000” couvert par la liste des 1000 prénoms Coca. Tous les prénoms du “Top 100” après 1950 sont dans la liste. Coca s’intéresse bien aux prénoms les plus répandus. Mais Coca est plus sélectif quand on compare avec le “Top 1000” des prénoms les plus répandus une année données. Ainsi, au maximum, seuls 80% des prénoms du “Top 1000” de 1990 (les 1000 prénoms les plus donnés aux bébés cette année-là) se trouvent dans la liste Coca.
coca-top
Il y a donc une liste d’environ 200 prénoms qui se trouvent dans cette liste et qui ne devraient pas s’y trouver si Coca suivait uniquement la liste des fréquences.

Jeunes électeurs, vieux électeurs, à Paris

Toujours en partant des listes électorales, voici une estimation rapide de la densité de jeunes électeurs et électrices (de moins de 20 ans) et de la densité des séniors parmi les seniors, les électrices de plus de 91 ans (il y a moins d’électeurs, à cet âge). Des courbes de niveaux indiquent les zones de densité moyenne équivalente.
jeunes-vieux
Cliquer pour agrandir

L’image est parlante : la densité de jeunes électeurs est importante dans les quartiers populaires, et celle des super-seniors dans des quartiers plus bourgeois. Mais l’indicateur est imparfait. Les zones peu peuplées (8e arrondissement, par exemple) contiennent par définition peu d’électeurs, mais ne contiennent-elles pas plus de vieux électeurs que de jeunes électeurs ?
Ainsi une carte qui s’intéresserait à la proportion de jeunes électeurs (ou de vieux électeurs) parmi l’ensemble des électeurs donnerait une image un peu différente de Paris.

Paris, ville monde

Les listes électorales parisiennes (1,2 millions d’individus) renseignent sur le pays de naissance des électeurs parisiens. Une partie d’entre eux est née à l’étranger. Plus de 6000 au Viet Nam, un peu plus de 5000 au Liban, etc… On compte même un (ou une) électeur(e) né(e) au Vatican, ou plutôt ayant déclaré être né(e) au Vatican.
Ces électeurs sont peut-être “nés étrangers à l’étranger”, mais ils sont peut-être “nés français à l’étranger”. Mais l’étranger n’est pas toujours l’étranger : l’Algérie fut un moment des départements français, et les Algériens furent eux-aussi un moment des électeurs français. Et les pays changent de nom : où donc ont bien pu naître les électeurs français nés en “U R S S” ? Plus de 200 pays apparaissent dans ces listes : Paris est bien une ville-monde.
Mais il y a des mondes différents dans cette ville-monde.
Prenons donc les électeurs nés dans quelques pays choisis et examinons la dispersion spatiale de ces électeurs. J’ai superposé aux cartes des courbes de niveau qui donnent une idée imparfaite de la densité.
mondes-paris
L’on distingue bien des zones préférentielles : le Nord-Est parisien populaire, le Sud-Est du 14e arrondissement. Les électeurs et électrices nés au Liban ont ici une répartition bien spécifique : ils ont choisi le Paris du Sud-Ouest, 16e et 15e arrondissement. Reste à comprendre pourquoi…
Les électeurs nés aux États-Unis d’Amérique, eux, sont d’abord peu nombreux, mais aussi peu concentrés. Ils évitent visiblement le Paris populaire pour préférer le Paris touristique ou bourgeois.
La localisation a été réalisée grâce aux données du “projet BANO“, mais les coordonnées des points ont été légèrement modifiées. Note sur la lecture enfin : ce n’est pas parce qu’une zone est toute orange ou toute rose que les électeurs y résidant seraient majoritairement nés à l’étranger.

Nouvelle édition

Sortie en librairie le 9 octobre.
nouvelleeditionlivre

La vie associative à Nantes (1)

Le site open-data de Nantes, data.nantes.fr, est riche. On y trouve : un fond de carte des “quartiers”, un fond de carte des “bureaux de vote”, la liste (avec les adresses) des associations, et enfin un fichier avec la géolocalisation de chaque adresse postale. En combinant ces fichiers, il est possible de repérer dans quels “microquartiers” la vie associative est plus développée, ou, au moins là où les associations sont implantées.

nantes-associations

Les Nantais ou les spécialistes de la Sociologie de Nantes comprendront sans doute mieux que moi la logique des implantations.

La réalisation a consister à assigner à chaque adresse de Nantes le nombre d’associations qui y avaient élu domicile (pas leur siège, mais leur lieu d’activité), et ensuite à associer à chaque adresse un “bureau de vote” correspondant, et enfin à associer à chaque bureau de vote le nombre d’associations qui se trouvaient dans son ressort.

Voici le code R :

library(maptools)
library(sp)
library(RColorBrewer)
library(classInt)
 
# shapefile des quartiers de Nantes
# Charger le fichier des adresses
adresses<-readShapeSpatial("~/Desktop/nantes/ADRESSES_NM_shp_l93/ADRESSES_NM.shp")
adresses<-subset(adresses,adresses$NOMCOM=="NANTES")
adresses$ADRESSE<-iconv(adresses$ADRESSE,from="latin1",to="ASCII//TRANSLIT")
adresses$ADRESSE<-toupper(adresses$ADRESSE)
# Charger le fichier associations
associations <- read.csv("~/Desktop/nantes/nantes-associations.csv",header=T)
# charger le shapefile des bureaux de vote de Nantes
nantesbv<-readShapeSpatial("~/Desktop/nantes/DECOUPAGE_BUREAUX_VOTE_NANTES_shp_l93/DECOUPAGE_BUREAUX_VOTE_NANTES.shp")
 
assoces<-associations[,c("SIEGE_NUM","SIEGE_VOIE","LIEU_ACT_NUM","LIEU_ACT_VOIE","LIB_THEME")]
assoces$SIEGE<-paste(assoces$SIEGE_NUM,assoces$SIEGE_VOIE)
assoces$LIEU<-paste(assoces$LIEU_ACT_NUM,assoces$LIEU_ACT_VOIE)
assoces$SIEGE<-iconv(assoces$SIEGE,from="UTF-8",to="ASCII//TRANSLIT")
assoces$LIEU<-iconv(assoces$LIEU,from="UTF-8",to="ASCII//TRANSLIT")
assoces$SIEGE<-toupper(assoces$SIEGE)
assoces$LIEU<-toupper(assoces$LIEU)
assoces$NB<-1
 
#assoces_adresses<-aggregate(NB~SIEGE,data=assoces,sum)
assoces_adresses<-aggregate(NB~LIEU,data=assoces,sum)
 
# associer les adresses des associations avec leurs coordonnées
#m<-match(adresses$ADRESSE,assoces_adresses$SIEGE)
m<-match(adresses$ADRESSE,assoces_adresses$LIEU)
adresses$NB<-assoces_adresses$NB[m]
 
# nantesbv : bureaux de votes de nantes
# associer chaque adresse à un bureau de vote
# code non optimal : boucle "for" très lente
BV<-NULL
test2<-NULL
for (i in 1:nrow(adresses)){
for (j in 1:nrow(nantesbv))	{
ifelse(point.in.polygon(adresses@coords[[i,1]],adresses@coords[[i,2]],nantesbv@polygons[[j]]@Polygons[[1]]@coords[,1],nantesbv@polygons[[j]]@Polygons[[1]]@coords[,2])==1,BV[i]<-j,test2<-j)
}
}
 
adresses$BV<-nantesbv$IDBURO[BV]
assoc_bv<-aggregate(NB~BV,data=adresses,sum)
m<-match(nantesbv$IDBURO,assoc_bv$BV)
nantesbv$NB<-assoc_bv$NB[m]
nclr <- 7
plotclr <- brewer.pal(nclr,"RdYlBu")[nclr:1] 
class <- classIntervals(nantesbv$NB, nclr, style="fisher",dataPrecision=0)
colcode <- findColours(class, plotclr)
par(mar=c(1,1,1,1))
plot(nantesbv,col=colcode,border="black",lwd=.1)
legend(348479,6698193,legend=names(attr(colcode,"table")), fill=attr(colcode, "palette"), cex=2, bty="n",title="Nombre d'associations")
plot(quartiers,add=T)
title(sub="Réalisation Baptiste Coulmont, https://coulmont.com | Données : data.nantes.fr",cex.sub=1,adj=0,line=-3)
title(main="La vie associative à Nantes",line=-1.7,cex.main=3,adj=0)

Created by Pretty R at inside-R.org

Des flèches, des carrés

Le recrutement des universitaires est une affaire sérieuse. C’est pour ça qu’à Paris 8, un (une?) anonyme a produit une série de flèches et de carrés colorés pour qu’on ne s’y perde pas. C’est probablement un chargé de mission de la sous-direction opérationnelle du service de l’Organigramme, très compétent par ailleurs. L’essentiel, de toute façon, est de savoir que tout est à rendre pour avant-hier. Et il faut aussi, pour s’y débrouiller, connaître les vrais raccourcis, qui ne sont pas mentionnés ici (vous remarquerez quand même qu’une flêche-en-tiret signifie un “lien hors circuit formel”).

arbitrage-paris8

Heureusement, Paris 8 a prévu (a pré-prévu) des “instances de pré-arbitrage”, ouf !

zigouigouis-paris8

Le choc de simplification, à Paris 8, s’accompagne donc d’une tentative de dé-linéarisation de l’administration. Et, c’est amusant, cela conduit déjà à des discussions longues sur les prérogatives de telle ou telle instance, car textes, schémas et habitudes ne coïncident pas toujours.

Docimologie

L’échec à l’université est une question importante. Le gouvernement actuel s’en préoccupe en mots principalement : sur le terrain, on voit surtout la diminution des recrutements d’enseignants chercheurs, l’absence d’aides pérennes, la maigreur des budgets, les injonctions à l’excellence (qui ne prennent jamais en compte l’engagement pédagogique).
Pour objectiver un peu l’échec, j’ai demandé la liste des notes obtenues par les étudiantes en majeure de sociologie, et j’ai retenu un échantillon de 156 étudiantes de première année de licence, qui s’étaient inscrits pour la première fois à Paris 8 en 2013. Ce sont des étudiantes ayant obtenu au moins une note.
Ce qui m’intéresse ici, c’est la relation entre moyenne générale (non pondérée) et nombre de notes obtenues. Car nos étudiants sont adultes : rien ne les oblige à venir en cours (sinon l’obligation d’assiduité inscrite dans le règlement intérieur), et rien ne les oblige à être étudiants “à plein temps”.
notes-et-notes
19 étudiantes n’ont obtenu qu’une seule note l’année dernière, la moyenne de ces individus est de 5/20.
Les étudiantes ayant plus de 8 notes, qui ont passé plus de 8 examens, forment un groupe qui réussit aux examens. La moyenne de ce groupe est nettement supérieure à 10/20. Les étudiantes qui passent peu d’examens, elles, ont des notes en général bien basses : elles n’obtiendront pas leur licence, à la fois parce que leurs notes sont trop faibles, mais aussi parce qu’elles ne passent pas les examens.

À son nom

Les prénoms nous entourent. Et parce qu’ils servent de terme d’adresse (“Salut Eddy !”), de terme de référence (“Tu connais Edouard ?”) individuels ou de classificateur collectifs (les Louis sont des garçons), ils se prêtent à des usages troubles. Revenons donc, après ceci et cela, sur les prénoms dans la réclame.

Récemment, @brooklynbridge m’envoyait la photo suivante, une publicité Coca sur laquelle quelques protestations se faisaient entendre. « Et Mohamed ? »
coca-mohamed
Difficile à lire, mais d’autres commentaires s’ajoutaient : Et Sofiane ? Et Kelly ? Et Minh ? Kim ?
Voici quelques années maintenant que les publicitaires de la boisson gazeuse utilisent les prénoms. Mais pas n’importe lequel : “votre” prénom. Fini les bols à son nom, voici la canette.
coca-retrouvez
Mais à la différence de variables simples, comme le sexe (le plus souvent dichotomisé), la profession (ramenée à une nomenclature à six modalités) ou l’âge (ramené à quelques grands groupes, 18-25, 25-40, 40-60…), il existe plusieurs dizaines de milliers de prénoms différent en circulation, voire quelques centaines de milliers, rien qu’en France. Et n’allez pas dire à Priscillia qu’elle est une Precylia : l’orthographe fait la personne.
Coca va laisser insatisfait un grand nombre de personnes : il faudrait quelques milliers de prénoms différents pour couvrir 80% de la population.
karim-coca
Sauf à imaginer la fabrication sur mesure de canettes à son nom.

La publicité n’a fait, ici, que suivre les usages. « Monsieur le Premier Ministre, mon cher Manuel » écrivait, hier, l’ancienne ministre de la culture sur sa lettre de dé-motivation. Même les sociologues utilisent, pour nommer leurs personnages, très souvent, des prénoms. Mais dans la pub, Coca est un cas à part: il n’y a pas toujours personnalisation/individualisation du consommateur, le prénom est le plus souvent utilisé comme indicateur d’un groupe de classe/ethnicité/genre/âge.
Voici une récolte de publicité, réalisée au cours des derniers mois, principalement dans le métro parisien.

aider-karine

Deux hommes, deux femmes (dont une “issue de l’immigration”), mais l’on parle toujours de l’Homme :
amel-edf

Une jeune femme (probablement née vers 1995) :
camille-haut

Clémence (mais cela aurait pu être Victoire ou Coline … mais pas Cynthia)
clemence-livre

Les associations et les commerces trans-nationaux signalent à demi-mots le public visé.
yezekiel

emma-aider
Parfois le corps redouble le prénom :

idriss-banque

khalid-banque

La ratp, entreprise citoyenne, favorise la diversité :

lounes-ratp

Mais si on laisse faire la ratp, on se retrouve vite avec des prénoms “bien de chez nous” :
serge-josephine
Des prénoms de hipster, comme Marcel :
marcel

Lauriane est “Responsable”, Sophie est “Assistante” :
lauriane-responsable
sophie-assistante

Lola est moustachue :
lola-asterix

Certains en perdent même leur titre :
pierre

Dispositif narratif, le prénom vise à assurer, en l’absence de corps, l’identité d’un personnage tout au long d’un texte. Il n’y a que dans les romans expérimentaux de Claire Chazal ou d’un collègue historien démographe de l’EHESS que l’on observe une variabilité importante. Il en va de même dans les publicités, concentré narratif :

muriel-orpi

romain-livre

thomas-livre

Déformation professionnelle : certains mots ressemblent à des prénoms.

virginie-jambon

Eux aussi font partie de notre monde. Ils ont aussi un prénom, une race, un genre :
malix-chien

oscar-chien

Les prénoms nous entourent.

Androgynous names in the USA

Very often, boys have boys’ names and girls, girls’ names. But sometimes, the same name (Leslie, Dana, Sammie, Alva, Lou…) is given to boys and to girls. Those “androgynous” or epicene names are interesting : most of the time, they are unstable, they begin as male names and end as female names. [See Lieberson, Stanley, Susan Dumais, and Shyon Baumann, ‘The Instability of Androgynous Names: The Symbolic Maintenance of Gender Boundaries’, The American Journal of Sociology, 105 (2000), 1249–87 jstor]

Let’s take Leslie :
epicene-usa-1
At the end of the 19th century, it is given to baby boys more than 9 times out of 10. Around 1950, it is given at the same frequency among boys and girls. But now, male Leslies are much less frequent than female Leslies.
It is difficult to find the opposite evolution, where a female name is masculinized.

Let’s consider that a name is epicene if the babies born year N and receiving this name are girls more than 10% of the times and less than 90%. This definition is restrictive, I consider that some names — such as Leslie now — aren’t really epicene anymore even if they were epicene before (because in 2013, there were fewer than 1 boys for 10 Leslie). This definition focuses on the current use of epicene names.
10/90 are arbitrary boundaries, one could use 1/99 or 30/70 (and it is easy to do, see the R code below).

epicene-usa-2

In 1880, 2% of the babies had an epicene name (and there were very few such names). During most of the 20th century, around 3.5% of babies received an epicene. Since 1960 (or 1980) this proportion is increasing : 8% of the babies born in 2010 received an epicene. And today (dotted line) more than 1500 names are epicene. The consequence of these number : epicene names are “small” names, given to a small number of babies each year.

epicene-usa-3

The real proportion of epicene babies is higher : names given to less than 5 male or female babies are not included in the database, and we lack information about 10% of the babies. And very rare names are more likely to be epicene than common names.

Let’s focus now on the population of babies receiving an epicene. From 1900 until 1950 (black line), more than 50% of epicene babies are male (which means that parents are more often than not giving “male” names to their daughters when they give them an epicene). From 1950 until 1990, the epicene babies are mostly female.
As you can see (dotted red line) there are always more “male” names than “female” names in epicene names [a “male” name is a name given to a higher proportion of male babies than female babies].

epicene-usa-4

There seems to be an interesting evolution of the Gini coefficient. The Gini coefficient is a measure of inequality (most often used to describe inequality of income in a country). Here, it is used to describe the distribution of name frequency.

Notes : I relied on Social Security Administration’s applicants numbers and first name. They are closely related to birth for the current period, but not before the 1930s : I very crudely corrected the skewed sex ratio. I used the ‘babynames’ package for R.
You can download the R code (it is not pretty) : epicene-usa-web.R

Nouvelle édition

La première édition était sortie en juin 2011, une réimpression (avec correction de quelques coquilles) en mai 2012. La deuxième édition, remaniée, mise à jour, sortira à l’automne :
socioprenomcouv2x