Billets récents

Nouvelle édition

Sortie en librairie le 9 octobre.
nouvelleeditionlivre

La vie associative à Nantes (1)

Le site open-data de Nantes, data.nantes.fr, est riche. On y trouve : un fond de carte des “quartiers”, un fond de carte des “bureaux de vote”, la liste (avec les adresses) des associations, et enfin un fichier avec la géolocalisation de chaque adresse postale. En combinant ces fichiers, il est possible de repérer dans quels “microquartiers” la vie associative est plus développée, ou, au moins là où les associations sont implantées.

nantes-associations

Les Nantais ou les spécialistes de la Sociologie de Nantes comprendront sans doute mieux que moi la logique des implantations.

La réalisation a consister à assigner à chaque adresse de Nantes le nombre d’associations qui y avaient élu domicile (pas leur siège, mais leur lieu d’activité), et ensuite à associer à chaque adresse un “bureau de vote” correspondant, et enfin à associer à chaque bureau de vote le nombre d’associations qui se trouvaient dans son ressort.

Voici le code R :

library(maptools)
library(sp)
library(RColorBrewer)
library(classInt)
 
# shapefile des quartiers de Nantes
# Charger le fichier des adresses
adresses<-readShapeSpatial("~/Desktop/nantes/ADRESSES_NM_shp_l93/ADRESSES_NM.shp")
adresses<-subset(adresses,adresses$NOMCOM=="NANTES")
adresses$ADRESSE<-iconv(adresses$ADRESSE,from="latin1",to="ASCII//TRANSLIT")
adresses$ADRESSE<-toupper(adresses$ADRESSE)
# Charger le fichier associations
associations <- read.csv("~/Desktop/nantes/nantes-associations.csv",header=T)
# charger le shapefile des bureaux de vote de Nantes
nantesbv<-readShapeSpatial("~/Desktop/nantes/DECOUPAGE_BUREAUX_VOTE_NANTES_shp_l93/DECOUPAGE_BUREAUX_VOTE_NANTES.shp")
 
assoces<-associations[,c("SIEGE_NUM","SIEGE_VOIE","LIEU_ACT_NUM","LIEU_ACT_VOIE","LIB_THEME")]
assoces$SIEGE<-paste(assoces$SIEGE_NUM,assoces$SIEGE_VOIE)
assoces$LIEU<-paste(assoces$LIEU_ACT_NUM,assoces$LIEU_ACT_VOIE)
assoces$SIEGE<-iconv(assoces$SIEGE,from="UTF-8",to="ASCII//TRANSLIT")
assoces$LIEU<-iconv(assoces$LIEU,from="UTF-8",to="ASCII//TRANSLIT")
assoces$SIEGE<-toupper(assoces$SIEGE)
assoces$LIEU<-toupper(assoces$LIEU)
assoces$NB<-1
 
#assoces_adresses<-aggregate(NB~SIEGE,data=assoces,sum)
assoces_adresses<-aggregate(NB~LIEU,data=assoces,sum)
 
# associer les adresses des associations avec leurs coordonnées
#m<-match(adresses$ADRESSE,assoces_adresses$SIEGE)
m<-match(adresses$ADRESSE,assoces_adresses$LIEU)
adresses$NB<-assoces_adresses$NB[m]
 
# nantesbv : bureaux de votes de nantes
# associer chaque adresse à un bureau de vote
# code non optimal : boucle "for" très lente
BV<-NULL
test2<-NULL
for (i in 1:nrow(adresses)){
for (j in 1:nrow(nantesbv))	{
ifelse(point.in.polygon(adresses@coords[[i,1]],adresses@coords[[i,2]],nantesbv@polygons[[j]]@Polygons[[1]]@coords[,1],nantesbv@polygons[[j]]@Polygons[[1]]@coords[,2])==1,BV[i]<-j,test2<-j)
}
}
 
adresses$BV<-nantesbv$IDBURO[BV]
assoc_bv<-aggregate(NB~BV,data=adresses,sum)
m<-match(nantesbv$IDBURO,assoc_bv$BV)
nantesbv$NB<-assoc_bv$NB[m]
nclr <- 7
plotclr <- brewer.pal(nclr,"RdYlBu")[nclr:1] 
class <- classIntervals(nantesbv$NB, nclr, style="fisher",dataPrecision=0)
colcode <- findColours(class, plotclr)
par(mar=c(1,1,1,1))
plot(nantesbv,col=colcode,border="black",lwd=.1)
legend(348479,6698193,legend=names(attr(colcode,"table")), fill=attr(colcode, "palette"), cex=2, bty="n",title="Nombre d'associations")
plot(quartiers,add=T)
title(sub="Réalisation Baptiste Coulmont, http://coulmont.com | Données : data.nantes.fr",cex.sub=1,adj=0,line=-3)
title(main="La vie associative à Nantes",line=-1.7,cex.main=3,adj=0)

Created by Pretty R at inside-R.org

Des flèches, des carrés

Le recrutement des universitaires est une affaire sérieuse. C’est pour ça qu’à Paris 8, un (une?) anonyme a produit une série de flèches et de carrés colorés pour qu’on ne s’y perde pas. C’est probablement un chargé de mission de la sous-direction opérationnelle du service de l’Organigramme, très compétent par ailleurs. L’essentiel, de toute façon, est de savoir que tout est à rendre pour avant-hier. Et il faut aussi, pour s’y débrouiller, connaître les vrais raccourcis, qui ne sont pas mentionnés ici (vous remarquerez quand même qu’une flêche-en-tiret signifie un “lien hors circuit formel”).

arbitrage-paris8

Heureusement, Paris 8 a prévu (a pré-prévu) des “instances de pré-arbitrage”, ouf !

zigouigouis-paris8

Le choc de simplification, à Paris 8, s’accompagne donc d’une tentative de dé-linéarisation de l’administration. Et, c’est amusant, cela conduit déjà à des discussions longues sur les prérogatives de telle ou telle instance, car textes, schémas et habitudes ne coïncident pas toujours.

Docimologie

L’échec à l’université est une question importante. Le gouvernement actuel s’en préoccupe en mots principalement : sur le terrain, on voit surtout la diminution des recrutements d’enseignants chercheurs, l’absence d’aides pérennes, la maigreur des budgets, les injonctions à l’excellence (qui ne prennent jamais en compte l’engagement pédagogique).
Pour objectiver un peu l’échec, j’ai demandé la liste des notes obtenues par les étudiantes en majeure de sociologie, et j’ai retenu un échantillon de 156 étudiantes de première année de licence, qui s’étaient inscrits pour la première fois à Paris 8 en 2013. Ce sont des étudiantes ayant obtenu au moins une note.
Ce qui m’intéresse ici, c’est la relation entre moyenne générale (non pondérée) et nombre de notes obtenues. Car nos étudiants sont adultes : rien ne les oblige à venir en cours (sinon l’obligation d’assiduité inscrite dans le règlement intérieur), et rien ne les oblige à être étudiants “à plein temps”.
notes-et-notes
19 étudiantes n’ont obtenu qu’une seule note l’année dernière, la moyenne de ces individus est de 5/20.
Les étudiantes ayant plus de 8 notes, qui ont passé plus de 8 examens, forment un groupe qui réussit aux examens. La moyenne de ce groupe est nettement supérieure à 10/20. Les étudiantes qui passent peu d’examens, elles, ont des notes en général bien basses : elles n’obtiendront pas leur licence, à la fois parce que leurs notes sont trop faibles, mais aussi parce qu’elles ne passent pas les examens.

À son nom

Les prénoms nous entourent. Et parce qu’ils servent de terme d’adresse (“Salut Eddy !”), de terme de référence (“Tu connais Edouard ?”) individuels ou de classificateur collectifs (les Louis sont des garçons), ils se prêtent à des usages troubles. Revenons donc, après ceci et cela, sur les prénoms dans la réclame.

Récemment, @brooklynbridge m’envoyait la photo suivante, une publicité Coca sur laquelle quelques protestations se faisaient entendre. « Et Mohamed ? »
coca-mohamed
Difficile à lire, mais d’autres commentaires s’ajoutaient : Et Sofiane ? Et Kelly ? Et Minh ? Kim ?
Voici quelques années maintenant que les publicitaires de la boisson gazeuse utilisent les prénoms. Mais pas n’importe lequel : “votre” prénom. Fini les bols à son nom, voici la canette.
coca-retrouvez
Mais à la différence de variables simples, comme le sexe (le plus souvent dichotomisé), la profession (ramenée à une nomenclature à six modalités) ou l’âge (ramené à quelques grands groupes, 18-25, 25-40, 40-60…), il existe plusieurs dizaines de milliers de prénoms différent en circulation, voire quelques centaines de milliers, rien qu’en France. Et n’allez pas dire à Priscillia qu’elle est une Precylia : l’orthographe fait la personne.
Coca va laisser insatisfait un grand nombre de personnes : il faudrait quelques milliers de prénoms différents pour couvrir 80% de la population.
karim-coca
Sauf à imaginer la fabrication sur mesure de canettes à son nom.

La publicité n’a fait, ici, que suivre les usages. « Monsieur le Premier Ministre, mon cher Manuel » écrivait, hier, l’ancienne ministre de la culture sur sa lettre de dé-motivation. Même les sociologues utilisent, pour nommer leurs personnages, très souvent, des prénoms. Mais dans la pub, Coca est un cas à part: il n’y a pas toujours personnalisation/individualisation du consommateur, le prénom est le plus souvent utilisé comme indicateur d’un groupe de classe/ethnicité/genre/âge.
Voici une récolte de publicité, réalisée au cours des derniers mois, principalement dans le métro parisien.

aider-karine

Deux hommes, deux femmes (dont une “issue de l’immigration”), mais l’on parle toujours de l’Homme :
amel-edf

Une jeune femme (probablement née vers 1995) :
camille-haut

Clémence (mais cela aurait pu être Victoire ou Coline … mais pas Cynthia)
clemence-livre

Les associations et les commerces trans-nationaux signalent à demi-mots le public visé.
yezekiel

emma-aider
Parfois le corps redouble le prénom :

idriss-banque

khalid-banque

La ratp, entreprise citoyenne, favorise la diversité :

lounes-ratp

Mais si on laisse faire la ratp, on se retrouve vite avec des prénoms “bien de chez nous” :
serge-josephine
Des prénoms de hipster, comme Marcel :
marcel

Lauriane est “Responsable”, Sophie est “Assistante” :
lauriane-responsable
sophie-assistante

Lola est moustachue :
lola-asterix

Certains en perdent même leur titre :
pierre

Dispositif narratif, le prénom vise à assurer, en l’absence de corps, l’identité d’un personnage tout au long d’un texte. Il n’y a que dans les romans expérimentaux de Claire Chazal ou d’un collègue historien démographe de l’EHESS que l’on observe une variabilité importante. Il en va de même dans les publicités, concentré narratif :

muriel-orpi

romain-livre

thomas-livre

Déformation professionnelle : certains mots ressemblent à des prénoms.

virginie-jambon

Eux aussi font partie de notre monde. Ils ont aussi un prénom, une race, un genre :
malix-chien

oscar-chien

Les prénoms nous entourent.

Androgynous names in the USA

Very often, boys have boys’ names and girls, girls’ names. But sometimes, the same name (Leslie, Dana, Sammie, Alva, Lou…) is given to boys and to girls. Those “androgynous” or epicene names are interesting : most of the time, they are unstable, they begin as male names and end as female names. [See Lieberson, Stanley, Susan Dumais, and Shyon Baumann, ‘The Instability of Androgynous Names: The Symbolic Maintenance of Gender Boundaries’, The American Journal of Sociology, 105 (2000), 1249–87 jstor]

Let’s take Leslie :
epicene-usa-1
At the end of the 19th century, it is given to baby boys more than 9 times out of 10. Around 1950, it is given at the same frequency among boys and girls. But now, male Leslies are much less frequent than female Leslies.
It is difficult to find the opposite evolution, where a female name is masculinized.

Let’s consider that a name is epicene if the babies born year N and receiving this name are girls more than 10% of the times and less than 90%. This definition is restrictive, I consider that some names — such as Leslie now — aren’t really epicene anymore even if they were epicene before (because in 2013, there were fewer than 1 boys for 10 Leslie). This definition focuses on the current use of epicene names.
10/90 are arbitrary boundaries, one could use 1/99 or 30/70 (and it is easy to do, see the R code below).

epicene-usa-2

In 1880, 2% of the babies had an epicene name (and there were very few such names). During most of the 20th century, around 3.5% of babies received an epicene. Since 1960 (or 1980) this proportion is increasing : 8% of the babies born in 2010 received an epicene. And today (dotted line) more than 1500 names are epicene. The consequence of these number : epicene names are “small” names, given to a small number of babies each year.

epicene-usa-3

The real proportion of epicene babies is higher : names given to less than 5 male or female babies are not included in the database, and we lack information about 10% of the babies. And very rare names are more likely to be epicene than common names.

Let’s focus now on the population of babies receiving an epicene. From 1900 until 1950 (black line), more than 50% of epicene babies are male (which means that parents are more often than not giving “male” names to their daughters when they give them an epicene). From 1950 until 1990, the epicene babies are mostly female.
As you can see (dotted red line) there are always more “male” names than “female” names in epicene names [a "male" name is a name given to a higher proportion of male babies than female babies].

epicene-usa-4

There seems to be an interesting evolution of the Gini coefficient. The Gini coefficient is a measure of inequality (most often used to describe inequality of income in a country). Here, it is used to describe the distribution of name frequency.

Notes : I relied on Social Security Administration’s applicants numbers and first name. They are closely related to birth for the current period, but not before the 1930s : I very crudely corrected the skewed sex ratio. I used the ‘babynames’ package for R.
You can download the R code (it is not pretty) : epicene-usa-web.R

Nouvelle édition

La première édition était sortie en juin 2011, une réimpression (avec correction de quelques coquilles) en mai 2012. La deuxième édition, remaniée, mise à jour, sortira à l’automne :
socioprenomcouv2x

La participation électorale (en Ohio)

Je suis tombé, un peu par hasard, sur ce site : Ohio Voter Files Download Page, qui donne accès aux listes électorales de l’Ohio, 7 716 460 d’électeurs (registered voters), avec leur nom, leurs prénoms, leur date de naissance, leur adresse… et surtout l’historique de leur participation depuis 2000 (45 élections). Il manque la race et le sexe, mais l’on dispose de leur affiliation partisane.
Il est alors possible de regarder si les “Républicains” votent plus ou moins que les “Démocrates” :
ohio2012
Parmi les “registered voters”, démocrates et républicains votent dans des proportions égales. Les personnes affiliées au “green party” ou aux “libertarians” votent un peu moins. Les non-affiliés (celles et ceux qui ne déclarent aucun parti) votent beaucoup moins.
Les taux de participation sont très élevés, plus de 80% des électeurs “partisans” inscrits ont voté aux présidentielles de 2012. Si l’on calculait le taux de participation non pas en relation aux inscrits, mais en relation à la “population en âge de voter”, alors on retrouverait des taux bien plus bas [l'abstention, aux Etats-Unis, est le plus souvent calculée sur la base de cette population en âge de voter].
En 2012, les inscrits les plus jeunes votent moins que leurs aînés : l’on remarque une petite différence chez les “indépendants” les plus jeunes.

L’âge et l’origine

inscrits
Cliquez pour agrandir

Ce graphique montre, pour l’année 2014, le nombre d’inscrits sur les listes électorales parisiennes [la taille des points], en fonction de l’année de naissance, de l’année d’inscription et de la proportion d’inscrits nées en France.
Toutes les inscriptions précédant 1981 ont été enregistrées comme ayant eu lieu en 1981.
Ceux qui s’inscrivent à 18 ans sont presque toujours nés en France (ils sont bien rouge sur le graphique). Mais ceux qui s’inscrivent tardivement (suite à un déménagement…) sont plus souvent nés à l’étranger : je lis cela en relation avec les naturalisations (les naturalisés, adultes et déjà relativement âgés, deviennent tardivement de nouveaux électeurs).
Mais il y a peut-être d’autres explications.

Je n’ai pas réussi à bien le faire apparaître, mais un peu avant 1995, 2002, 2007 et 2012, on voit plus d’inscriptions. La présidentielle actualise des électeurs virtuels.

Le cumul des variables

Les filles ont en moyenne plus de mention “très bien” que les garçons. Les parisiens ont plus souvent la mention que les non-parisiens. Les candidats avec une année d’avance (nés en 1997 par exemple) ont plus de mention très bien que les autres. Les candidats avec trois prénoms ou plus ont eu aussi plus de mention très bien que ceux qui n’ont qu’un ou deux prénoms.
Est-ce que tous ces indicateurs se cumulent ?
cumuls
Les “filles” [cf note], parisiennes, en avance, qui ont 3 prénoms ou plus ont une chance sur deux d’obtenir une mention TB. Les garçons, non-parisiens, en retard (nés avant 1996), qui ont moins de trois prénoms sont une chance sur cent d’obtenir la mention “très bien”.
[Les premières sont beaucoup plus rares que les seconds]
La même chose est calculable en ajoutant encore un indicateur, la particule (“Sixtine DE MACHIN”). Mais on se retrouve avec de très petits effectifs, notamment pour les filles, nobles, parisiennes, en avance, qui ont trois prénoms ou plus et qui ont autorisé la diffusion des résultats nominatifs au bac.
Ou comment combiner un peu de “toutes choses égales par ailleurs” et de “toutes choses inégales réunies”.

Mise à jour : en combinant les années 2013 et 2014, l’on dispose de suffisamment de candidats à particule (Amicie d’HAUCOURT par exemple) pour produire le même tableau :
particules-bac
[L'indicateur est très imparfait : il faudrait sans doute comparer terme à terme les porteurs de particule et les personnes dont le nom de famille est parmi les plus répandus en France, comme MARTIN, DURAND, BERNARD, RICHARD...]

Note : les “filles” ici, sont les personnes ayant des prénoms surtout donnés à des filles (et vice-versa pour les “garçons”).