Categories

Archives

Archives de la catégorie : 'General'

Les prénoms et la mention, édition 2018

Entre l’année dernière et cette année, tous les candidats ou presque ont changé. Mais si les personnes ont changé, ce n’est pas le cas de leurs prénoms. Prenons les Juliette. Les Juliette qui ont passé le bac en 2017 ne sont pas celles qui ont passé le bac en 2018. Et même plus : les Juliette de 2017 n’ont pas les mêmes parents que les Juliette de 2018. Et pourtant leur nombre est presque le même (2200), et leur taux d’accès à la mention Très bien est identique (20%). En tant qu’individu, elles sont toutes différentes. En tant que groupe (du simple fait de partager un prénom) elles sont semblables. Les Juliette de 2018 sont, en tant que groupe, et au regard du taux d’accès à la mention Très bien, identiques aux Juliette de 2017.
Cette année, 25% des Garance (qui ont eu plus que 8 au bac général et technologique et qui ont autorisé la diffusion de leurs résultats) ont obtenu la mention Très bien. C’est le cas de 5% des Océane ou des Anthony. Les prénoms les plus donnés vers 2000 (quand ces bachelier.e.s sont né.e.s), Léa, Thomas et Camille, ont des taux moyens de proportion Très bien. Vous remarquerez aussi assez vite la plus grande excellence scolaire féminine : à la droite du graphique, on ne trouve que des prénoms féminins bourgeois (Garance, Apolline, Diane…). A gauche, ce sont surtout des prénoms masculins et de classes populaires (Steven, Ryan, Christopher, Allan).


Cliquez pour agrandir

Pour les années précédentes, voir 2017, ou en 2016 ou encore en 20152014,2013, 2012 ou 2011. Vous pouvez aussi lire Sociologie des prénoms (édition La Découverte) [sur amazon, dans une librairie indépendante].

Trente-neuf « Cartes blanches », bilan d’étape.

Depuis quelques années, toutes les six semaines, je rédige une chronique sociologique pour Le Monde. En 2015, j’avais déjà proposé un bilan, que je renouvelle ici.

J’ai écrit 39 textes en cinq ans. Ces textes portent sur des articles publiés récemment, ou une question liée à l’actualité. J’y expose le travail d’une sociologue ou de son équipe. J’ai cherché à diversifier les thèmes et les méthodes. La moitié des “Cartes blanches” exposent des travaux reposant sur des méthodes dites “qualitatives” (entretiens, observations), l’autre moitié sur des méthodes “quantitatives”. Le thème le plus fréquent est lié à la description du travail sociologique, suivi des questions de stratification, politique et de genre/sexualité.
J’y ai cité le nom de 88 sociologues et assimilés (on y trouve quelques économistes, par exemple). Les sociologues les plus fréquemment cités sont Émile Durkheim (à trois reprises), Max Weber (à deux reprises) et Etienne Ollion (à deux reprises). 60 de ces sociologues sont français ou publient en France, 25 sont étatsuniens (au sens où ils travaillent dans une université nord-américaine). Et Weber est allemand. Je suis limité ici par mes connaissances linguistiques: il n’y a qu’en français et en anglais que je suis capable de bien lire. Mon allemand est rustique, et mon roumain presque oublié.
25 femmes ont été citées, et 62 hommes l’ont été, ce qui est loin de respecter la parité (dès qu’on l’oublie, elle disparait). Mais ces 25 femmes sont souvent les auteures centrales de la chronique, celles dont les travaux sont exposés (alors que de nombreux hommes, Mauss, Tarde, Weber, Sorokin, Krugman… ne sont cités qu’en appui au texte). Quand on pondère les citations par le nombre d’auteurs cités dans la chronique, alors il y a “13” femmes pour “26” hommes.
Quelques unes des dernières “Cartes blanches” :
En Algérie, les plages de la discorde, autour des travaux de Jennifer Bidet
Les odeurs ont un sens, et une classe sociale, autour des travaux de Karen Cerulo
Le charme discret du contournement de l’ISF, autour des travaux de Camille Herlin-Giret
L’art de l’insulte chez les jeunes filles, autour des travaux d’Isabelle Clair
Les pourboires, drôles d’espèces, autour des travaux d’Amélie Beaumont

Ma grande modestie me perdra

Pendant plus de six mois, sur le portail “cairn.info“, j’ai pu voir ceci :

En sociologie, en histoire, en science politique, mon article « le petit peuple des sociologues » était l’article le plus lu, ou le 3e le plus lu. Je savais qu’il avait été très lu au moment de sa publication en juin 2017 (tout est relatif, et le « très lu » est à estimer au regard de ce que l’on sait du nombre limité de lecteurs sociologues).
Je disposais même d’un indicateur, un mail de “cairn.info” de janvier 2018 indiquant que « le petit peuple des sociologues » était le 6e article le plus lu sur cairn en 2017 (voir sur l’image ci-contre). Au début, ça ne m’a pas dérangé, d’être le sociologue le plus lu en France. D’être Top numéro 1. Une semaine. Deux semaines. Un mois. Deux mois… Six mois… Mais je trouvais très bizarre que l’article “Impact des troubles maternels borderline” reste numéro 1 dans le palmarès des articles les plus lus en sociologie. Très bizarre. Et que le palmarès reste figé aussi. L’article d’Amélie Beaumont, Le pourboire et la classe restait 10e. Sans bouger d’un poil depuis novembre 2017. Il me semblait bizarre, par exemple, qu’un article aussi lu que —— au hasard —— « Toujours pas de chrysanthèmes pour les variables lourdes de la participation électorale n’apparaisse jamais dans le top 10 des articles les plus lus en science politique.
Mais aujourd’hui, les choses ont changé : ce fut ma surprise ce matin du 12 juin 2018. Le palmarès entièrement rénové. En sociologie et dans les autres disciplines. J’y suis un peu pour quelque chose :

J’ai contacté Cairn (à quelques reprises depuis quelques mois)… et il y avait bien un bug dans leur classement. Hélas, ce bug n’a pas eu pour effet de dé-classer “Impact des troubles maternels borderline” et de placer « le petit peuple des sociologues » au sommet du classement. On ne peut pas tout avoir.
Plus sérieusement : si la stabilité de ce palmarès m’énervait, c’est que je m’en sers comme outil de veille pour lire des articles qui peuvent faire l’objet de ma chronique pour Le Monde, que je dois écrire toutes les six semaines. Celle de cette semaine, d’ailleurs, porte sur Blédards et immigrés sur les plages algériennes de Jennifer Bidet (lisez-le, cet article, et placez-le Top n°1 sur cairn, il le mérite !)

À la rentrée

Couverture manuel courants contemporains montageEn 2008, Céline Béraud et moi avions écrit un manuel d’introduction, à destination des licences de sociologie, Les courants contemporains de la sociologie (Presses universitaires de France). Après dix ans dans les librairies, la première édition n’est actuellement plus disponible. Mais à la rentrée, c’est une nouvelle édition remaniée qui sera mise en vente, toujours aux Presses universitaires de France, mais dans la collection Quadrige – Manuels. Nous venons de rendre le manuscrit.
Pour en savoir plus sur ce manuel, vous pouvez consulter la page consacrée à la première édition.

L’honneur et le mérite

En France, si vous observez des groupes inégalement prestigieux, ou placés à des degrés différents dans une hiérarchie, vous observerez aussi que les membres de ces groupes n’ont pas la même probabilité d’avoir un nom à particule. Comme les noms à particule sont très rares en France (moins de 0,8% des personnes nées en France en sont dotés), il faut avoir des groupes de grande taille pour trouver des gens à particule. Ou alors il faut avoir des groupes que l’on peut rattacher aux classes dominantes, et l’on verra qu’au sein de ces groupes, les gens à particule constitue une sorte d’aristocratie, de paranoblesse.
Ici, je vais explorer la liste des personnes ayant reçu la Légion d’honneur ou l’Ordre national du mérite entre 1990 et aujourd’hui. Soit environ 222 340 individus (une partie cumule les titres, et on les retrouve dans les deux listes). L’Ordre national du mérite est un ordre bâtard, de création récente (1963). La Légion d’honneur, elle, est doté du prestige de l’ancienneté. La proportion de gens à particule varie : 2,5% des «méritants» ont une particule, et c’est le cas de 3,6% des «légionnaires». Un rapport de 1 à 1.44 entre ces deux ordres, et surtout, une surreprésentation importante quand on la compare avec la population de la France. Il y a au minimum 4,5 fois plus de gens à particule chez les légionnaires que dans la population.
Ces différences entre ordres ne sont pas dues au hasard. Elles se répêtent chaque année, de manière systématique, comme le montre ce graphique:


Année après année, il y a toujours plus de récipiendaires à particule dans les listes de légionnaires que dans les listes de méritants. Encore aujourd’hui, dans la France contemporaine. (Et ce n’est pas du aux militaires recevant la Légion d’honneur, j’ai vérifié.)

La proportion de personnes à particule varie, au sein de ces ordres, de deux façons. Tout d’abord, plus on grimpe dans la hiérarchie locale, plus la proportion de gens à particule augmente.


11% des Grand’croix de la Légion d’honneur ont un nom à particule, ce n’est le cas que de 3,5% des simples “Chevaliers” (qui, contrairement à leur titre, ne sont que que de la piétaille). L’augmentation de la proportion de gens à particule avec les titres se repère aussi dans le cas de l’Ordre du mérite.

Pour devenir Grand’Croix, il faut d’abord être Grand Officier, et pour être Grand Officier il faut être Commandeur, etc… et il faut attendre un moment avant de pouvoir monter l’échelle. Les plus titrés sont donc les plus âgés, et les plus âgés dans l’Ordre. Entrer jeune a des effets sur la fin de carrière. C’est pourquoi il est fascinant de voir que, encore aujourd’hui dans la France contemporaine, la proportion de récipiendaire à particule est beaucoup plus élevée quand ces récipiendaires ont un faible nombre d’«années de service» :

Ce graphique ne concerne que les “Chevaliers” : 6% de celles et ceux qui sont nommés après juste 20 ans de service ont un nom à particule. La prime à la jeunesse est aussi clairement visible dans le cadre des entrées dans l’Ordre national du mérite. Voilà pourquoi il est fort probable que, dans quelques décennies encore, les Grand’Croix et Grand.e.s Officier.e.s auront toujours plus de noms à tiroir que les Chevaliers.

 
Notes : les données proviennent de Légifrance, par l’intermédiaire de Nathann Cohen

Anamorphoses cartographiques

Les bureaux de vote parisiens regroupent un nombre presque identique d’électeurs sur une surface approximativement de même taille. Mais le nombre d’inscrits varie de 1 à 2 et la surface varie aussi beaucoup.
La carte suivante, qui illustre où le vote Fillon fut fréquent à Paris, est donc trompeuse (comme toutes les cartes).

Trompeuse, parce qu’une bonne partie des bureaux où Fillon fait un score élevé sont des bureaux de grande surface et où relativement peu d’électeurs sont inscrits.
Il est possible de transformer la surface de chaque bureau afin que cette surface soit proportionnelle au nombre d’électeurs inscrits. La carte suivante illustre cette transformation par anamorphose :

Le huitième arrondissement disparaît presque entièrement, et le dix-huitième voit sa surface augmenter.

Pour celles que cela intéresserait, j’ai mis le code sur github.

Les différences entre les deux formes de cartes sont bien plus apparentes si l’on s’intéresse aux communes d’Île de France, car certaines (comme le 15e arrondissement) sont très peuplées alors que d’autres (en Seine et Marne par exemple) sont presque vides.

Le beau linge

Il y a le tissu social. Et il y a le beau linge social [*]. Mais parfois le beau linge est caché dans de vieilles armoires grinçantes. Ouvrons une de ces armoires : les noms à particules (et, parfois, à armoiries). Je vais m’appuyer sur les résultats nominatifs au bac général et technologique, entre 2012 et 2017, soit 2,2 millions d’individus.
Parmi eux, 25 000 ont un nom à particule (la particule ici étant “de”, “du”, “des” ou “d'” : d’Hauterives, de La Tour d’Aigues, des Restifs, Chabault du Fals, etc…), et parmi eux quelques De Souza. 68 000 ont un des 30 noms de famille les plus fréquents en France (Martin, Durand) mais aussi Da Silva. Les autres, qui sont donc 2,1 millions environ, représentent le tout-venant.
Si la particule ne disait rien (mais vraiment rien du tout) de la position sociale, alors les prénoms des bacheliers à particule devraient ressembler très fort aux prénoms des bacheliers sans particule. Si l’on pense que la particule est quand même un signe d’immigration potentiellement lointaine, alors on peut comparer avec les prénoms de celles et ceux qui ont un nom de famille très fréquent en France (un des trente noms de famille les plus fréquents). Les choix de monsieur et madame Dupont ne devraient pas trop différer des choix de Monsieur et Madame du Pont.

Le tableau des prénoms les plus fréquents ne révèle que peu de différences. Les prénoms des “Dupont” (c’est à dire des personnes ayant un des 30 noms de famille les plus fréquents en France) sont, grosso modo, rangés dans le même ordre que les prénoms de l’ensemble de la population des bacheliers. Les prénoms des “du Pont” (c’est à dire des personnes ayant un nom à particule) montrent de légères différences de rang : on y préfère Marie à Camille, on apprécie un peu moins Léa et Manon. On adoooore Louis et Paul.

rang DUPONT TOUS DU PONT
1 Camille Camille Marie
2 Thomas Thomas Antoine
3 Manon Marie Thomas
4 Lea Manon Alexandre
5 Marie Lea Camille
6 Pauline Alexandre Louis
7 Antoine Antoine Paul
8 Mathilde Maxime Guillaume
9 Maxime Nicolas Nicolas
10 Nicolas Pauline Pierre
11 Alexandre Mathilde Lea
12 Marine Chloe Charlotte
13 Julie Marine Marine
14 Chloe Laura Hugo
15 Quentin Julie Mathilde
16 Clement Quentin Manon
17 Julien Clement Maxime
18 Guillaume Pierre Quentin
19 Laura Marion Pauline
20 Valentin Julien Alexis

Sources : Résultats nominatifs au bac

Ainsi, pour ce qui est des choix les plus fréquents, les choix des Dupont et des du Pont se ressemblent. Les prénoms les plus fréquents n’ont qu’un faible pouvoir de distinction.

Le diable est dans les détails. Certains prénoms (des prénoms relativement fréquents, présents chez plus de 500 bacheliers et bachelières) ne sont pas répartis de la même manière entre Dupont et du Pont. Examinons la “sur-représentation” et la “sous-représentation” de ces prénoms fréquents. Pour ce faire, on divise la fréquence du prénom dans la population à particule par la fréquence du prénom dans la population complète. Quand ce rapport est supérieur à 1, cela signifie que les du Pont choisissent un peu plus souvent ce prénom que la population générale. Et l’on fait la même chose pour les Dupont.

Là, les différences apparaissent très visibles. Les parents à particules choisissent Sixtine, Maylis et Stanislas beaucoup plus souvent que le commun des mortels. Les Dupont, eux, ont des choix peu spécifiques : à la fois Teddy et Thibaud, Andy et Léonie : c’est que l’on trouve de tout dans les Dupont, qu’ils ont des choix très peu différents des choix du commun des mortels.

rang (de surreprésentation) DUPONT DU PONT
1 Solenne Sixtine
2 Alexane Maylis
3 Suzanne Stanislas
4 Andy Gaspard
5 Timothe Albane
6 Xavier Hugues
7 Segolene Hortense
8 Cassandra Henri
9 Joffrey Philippine
10 Gwenaelle Marin
11 Gabin Bertrand
12 Teddy Diane
13 Thibaud Victoire
14 Antony Alix
15 Charlene Astrid
16 Corentin Alban
17 Leonie Joseph
18 Coraline Malo
19 Etienne Amaury
20 Leopold Augustin

Sources : Résultats nominatifs au bac

Alors que nous serions bien en peine de distinguer les Dupont sur le tissu social (ce sont, collectivement, des omnivores culturels), les du Pont, eux, s’y distinguent bien, notamment par leurs choix spécifiques : ils sous-utilisent les prénoms les plus fréquents, et ils sur-utilisent un corpus de prénoms rares. Ainsi, alors que rien ne devrait distinguer les Dupont des du Pont, si la particule n’était vraiment rien, certaines de leurs pratiques culturelles les différencient encore, à la marge, du reste de la société. Quand donc arriveront-ils à s’intégrer ?

[*] La métaphore n’est pas seulement filée, elle est ici cousue de fil d’or.

Les prénoms et la mention, édition 2017

Le monde social est fait de routine et de familiarité. De surprises parfois, de fascinations, mais d’habitudes aussi. C’est pourquoi, cette année encore, les toutes nouvelles bachelières prénommées Diane ont plus souvent obtenu la mention « Très bien » que leurs camarades prénommées Cindy ou Morgan.
Plus de 20% des Adèle, Diane, Anna, Théophile et Juliette ont obtenu la plus haute mention. C’est le cas de 5% environ des Cassandra, Anissa et Anthony.

Cliquez pour agrandir

Pour en savoir plus, j’ai écrit un petit texte pour l’INED On ne nomme jamais, on classe.
Et j’ai aussi, au cours des années précédentes, montré l’intérêt de cette étude : en 2016 ou encore en 20152014,2013, 2012 ou 2011. Vous pouvez aussi lire Sociologie des prénoms (édition La Découverte) [sur amazon, dans une librairie indépendante].

 

Enfin un mini-site interactif qui vous permet de consulter les résultats de votre prénom est disponible ici : https://coulmont.com/bac/

The little guys of French sociology. Anonyms and pseudonyms in sociological litterature.

This text is a quick and dirty translation of the main arguments of le petit peuple des sociologues” (published in Genèses, 2017, n.107).

First names are often used to identify characters in books and article written by French sociologists. This is rather new. Why are French sociologists increasingly using first names? Who gets to be called by a first name?

This paper is an analysis of the argumentative styles in sociology. It is also an analysis of the consequences of anonymization. Sociologists write that they anonymize in order to protect the privacy of the people who were interviewed or observed: they use pseudonyms to anonymize. But this ethical framing hinders the analysis of the consequences of anonymization. In the last part of the article, I propose an analysis of the power relations that are intertwined with the uses of a first name. One should note that the use of first names in everyday social relations is different in France and the USA. The use of “tu” instead of “vous” and the use of first names are both a way to mark closeness and a way to mark hierarchy, depending on the reciprocity of these uses.

To explore these themes I have read the 8 main French sociological journals from 1960 to 2015 (every 5 years) and, for each issue, I have counted the number of articles that used first names to refer to the people interviewed, observed or surveyed. There are many ways to refer to someone: the name (Monsieur Dupont), the first name (Pierre), the first letter (P.), a combination of letters (P. D.), some letters or numbers (“A” for the first interviewee, or “Interviewee n.1”), a position (“the head of the bureau”, “the cousin of…”), or even dates (“Interview realized on 1/1/2000”)… but I only focused on the presence or not of a first name.

The first result is the increasing use of first names:

 

year

Number of Articles

Number of articles
with first names

Proportion (%)

1960

55

0

0

1965

76

0

0

1970

66

1

2

1975

98

2

2

1980

82

4

5

1985

111

3

3

1990

142

6

4

1995

165

9

5

2000

177

12

7

2005

155

15

10

2010

182

37

20

2015

132

44

33

Table 1: The increasing use of first names in French sociological articles

 

In 2010, 182 articles were published in the main journals. 37 articles anonymized the surveyed people with a first name: 20% of the corpus.

Why do French sociologist use first names?

  • (1) Recent sociology textbooks and manuals [I have read 53 methodology textbooks published between 1945 and 2016] recommend first names to anonymize (whereas there was no recommendation for anonymization in older sociology textbooks) but sociologist never write in their article why they chose to use first names instead of another anonymization technic. It has become a routine.
  • (2) First names are increasingly used in French society: beginning in the 1970s first names are increasingly used in professional settings and in various social settings.
  • (3) First names are useful in a narrative context, and the “narrative turn” in French sociology may have increased this use. They establish recurring characters: “Sophie” is more memorable than “interviewee n.37”. First names are also useful as a narrative technic, to differenciate characters within a sociological text : whereas “Baptiste Coulmont” or “Coulmont” would be another sociologist [such as “as Coulmont (2011) shows…”] , “Baptiste” (without a last name) would be an interviewee [“at some time during our conversation, Baptiste stated that…”], and the main author refers to herself/himself as “the sociologist”.
  • (4) Using a first name is a generational marker : “young” sociologists use first names as a routine (that is, sociologists who were “young” in the 1990 and that, increasingly, get involved in the editorial board of these journal) – to establish this, I looked at the journals : the newer the journal is (some were created in the 1950, some in the 1960, some in the 1970…), the larger is the frequency of first names. I also looked at the “prize for the young author” (prix du jeune auteur, best graduate paper): articles written by “young” sociologists use first names at a much higher frequency than articles written by other sociologists.

Who gets a first name?

Because first names are used as marker of familiarity and as marker of hierarchy, it is crucial to understand who gets a first name in the sociological literature. I looked closely at 123 articles published in 2010. 58 articles do not use any pseudonyms (purely quantitative article, purely theoretical articles, or article about historical individuals: Mao Zedong, Charles de Gaulle…). 65 articles refer to individual actors, and among those articles, 33 are using first names.

  1. Surveyed people (interviewees, people met during fieldwork…) getting first names are: “genitally mutilated migrant women”, “farm workers”, “supermarket cashier”, “students”, “women”, “homeless people”, “pupils”, “migrants”, “civil servants”, “young women”, “musicians”, “campaigner / political canvasser”. Very often, those people have very little power.
  2. Surveyed people without a first name are: “high class bourgeois”, “writers”, “supervisors”, “wine-grower”, “high ranking official in the European commission”, “head of service”, “veterinarian”, “engineer”, “manager”, “senior citizen”, “activist”… Mostly, those are people in a power position, often presented as male (or in the French grammatical male formulation: “les ingénieurs”).

In 15 articles, the authors used first names for some surveyed people, and another reference for the other surveyed people. The more power someone has, the less likely he [rarely she] is to get a first name. On the same page, the blue collar workers is assigned a first name, the manager gets “the manager”; children have a first name (“Léa”) parents get a name (“Madame Dupont, la mère de Léa” : “Mrs Dupont, mother of Léa”)

Sociologists (almost) never write that they used first names to refer to people with whom they used first names during their fieldwork. Naming is a “a staging of the methodological self” (une mise en scène de soi): the use of first names to refer to the little guys shows “whose side we are on” (we are close to the little guys, whom we refer to by a first name, we exhibit a distance with the upper class, whom we refer to by a title). But as a consequence domination always appears disembodied: domination is always performed by “managers”, “head of services”, never embodied in a “Jean-Luc”.

Zones de sur-performance

À partir des résultats au premier tour de l’élection présidentielle de 2017, à Paris, on peut tracer cette carte montrant les zones où les différents candidats ont réalisé des scores supérieurs à leur moyenne parisienne.

cliquez pour agrandir

Et voici le code, non commenté. Je commence par repérer où se trouvent les zones de sur-performance (les bureaux de votes). J’extrait du fond de carte parisien les 4 zones distinctes. Je trace ensuite quatre cartes les unes sur les autres.

library(tidyverse)
library(classInt)
library(RColorBrewer)
library(maptools)
library(rgdal)

setwd("~/Dropbox/projets-R/")

# le "shapefile" se trouve sur opendata.paris.fr
paris<-readOGR("../data/2017-listes-paris/secteurs-des-bureaux-de-vote-3/",
               "secteurs-des-bureaux-de-vote")

# frontières des arrondissements
parisarr <- readOGR ("../procurations/paris/arrondissements/parisarr.shp", layer="parisarr")
# les résultats électoraux se trouvent sur opendata.paris.fr
df <- read_csv2("~/Dropbox/procurations/paris/paris-2017/resultats_electoraux.csv")
df <- df %>% filter(`date du scrutin`=="2017-04-23") %>% 
  select(3,4,6,7,8,9,10,12,14,15,16,17) %>% 
  spread(key=`nom du candidat ou liste`,value=`nombre de voix du candidat ou liste obtenues pour le bureau de vote`) %>% 
  mutate(numbv=paste(`numero d'arrondissement 01 a 20`,`numero de bureau de vote 000 a 999`,sep="-"))

res <- df %>% group_by(numbv) %>% 
  summarize(arr=mean(as.numeric(`numero d'arrondissement 01 a 20`)),
            prop_macron=100*MACRON/`nombre d'exprimes du bureau de vote`,
            prop_lepen=100*`LE PEN`/`nombre d'exprimes du bureau de vote`,
            prop_fillon=100*FILLON/`nombre d'exprimes du bureau de vote`,
            prop_melenchon=100*(HAMON+`MÉLENCHON`)/`nombre d'exprimes du bureau de vote`) %>% 
  gather(key=type,value=valeur,-numbv,-arr)

res <- res %>% group_by(type) %>% 
  mutate(sur_rep=valeur/(mean(valeur)+.2*sd(valeur))) %>% # "la moyenne et un peu plus" (.2 écart type)
  filter(sur_rep>1) %>% group_by(numbv) %>% 
  mutate(keep=type[which.max(sur_rep)],valeur_keep=valeur[which.max(sur_rep)]) # on garde le candidat "le plus au dessus" de sa moyenne

# on ne garde pas les bureaux dupliqués
res <- res[!duplicated(res$numbv),]

# extraction des zones-candidats
macron <- subset(paris,paris$id_bv %in% res$numbv[res$keep=="prop_macron"])
lepen  <- subset(paris,paris$id_bv %in% res$numbv[res$keep=="prop_lepen"])
melenchon <- subset(paris,paris$id_bv %in% res$numbv[res$keep=="prop_melenchon"]) # avec le score d'Hamon ajouté
hamon <- subset(paris,paris$id_bv %in% res$numbv[res$keep=="prop_hamon"])
fillon <- subset(paris,paris$id_bv %in% res$numbv[res$keep=="prop_fillon"])

png("~/Desktop/parissur_rep.png",width=1100,height=800,res=150)
par(mar=c(1,0,1,1))
plot(paris) # on commence par "tracer" Paris 

m<-match(macron$id_bv,res$numbv)
plotvar<-res$valeur_keep
nclr <- 3
plotclr <- brewer.pal(nclr,"Greens")
class <- classIntervals(plotvar[m], nclr, style="fisher",dataPrecision=1)
colcode <- findColours(class, plotclr)
plot(macron,col=colcode,border=colcode,add=T)

m<-match(fillon$id_bv,res$numbv)
plotvar<-res$valeur_keep
nclr <- 3
plotclr <- brewer.pal(nclr,"Blues")
class <- classIntervals(plotvar[m], nclr, style="fisher",dataPrecision=1)
colcode <- findColours(class, plotclr)
plot(fillon,col=colcode,border=colcode,add=T)

m<-match(melenchon$id_bv,res$numbv)
plotvar<-res$valeur_keep
nclr <- 3
plotclr <- brewer.pal(nclr,"Reds")
class <- classIntervals(plotvar[m], nclr, style="fisher",dataPrecision=1)
colcode <- findColours(class, plotclr)
plot(melenchon,col=colcode,border=colcode,add=T)

m<-match(lepen$id_bv,res$numbv)
plotvar<-res$valeur_keep
nclr <- 3
plotclr <- brewer.pal(nclr,"Purples")
class <- classIntervals(plotvar[m], nclr, style="fisher",dataPrecision=1)
colcode <- findColours(class, plotclr)
plot(lepen,col=colcode,border=colcode,add=T)

plot(parisarr,add=T,lwd=.1) # on ajoute les frontières des arrondissements
legend(2.232, 48.91,legend=c("Hamon/Melenchon","Le Pen","Fillon","Macron"), fill=c("red","purple","deepskyblue","chartreuse3"), cex=1, bty="n",title="")
title(main="Zone de sur-performance des candidats. Paris. Présidentielles 2017.")
title(sub="Fond : opendata.paris.fr | données : Ville de Paris | Cartographie : B. Coulmont\nZones où les candidats font mieux que leur moyenne",line=-.5,cex.sub=.8)
dev.off()

Et, en bonus, le code, amélioré par Christophe P. :


library(tidyverse)
library(classInt)
library(RColorBrewer)
library(maptools)
library(rgdal)

rep_data_secteurs < - 'DATA/secteurs-des-bureaux-de-vote'
# "../data/2017-listes-paris/secteurs-des-bureaux-de-vote-3/"


setwd("~/Dropbox/projets-R/")

# le "shapefile" se trouve sur opendata.paris.fr
paris<-readOGR(rep_data_secteurs,
               "secteurs-des-bureaux-de-vote")

# frontières des arrondissements
parisarr <- readOGR ("../procurations/paris/arrondissements/parisarr.shp", layer="parisarr")
# les résultats électoraux se trouvent sur opendata.paris.fr
df <- read_csv2("~/Dropbox/procurations/paris/paris-2017/resultats_electoraux.csv")
df <- df %>% filter(`date du scrutin`=="2017-04-23") %>% 
  select(3,4,6,7,8,9,10,12,14,15,16,17) %>% 
  spread(key=`nom du candidat ou liste`,value=`nombre de voix du candidat ou liste obtenues pour le bureau de vote`) %>% 
  mutate(numbv=paste(`numero d'arrondissement 01 a 20`,`numero de bureau de vote 000 a 999`,sep="-"))

res < - df %>% group_by(numbv) %>% 
  summarize(arr=mean(as.numeric(`numero d'arrondissement 01 a 20`)),
            prop_macron=100*MACRON/`nombre d'exprimes du bureau de vote`,
            prop_lepen=100*`LE PEN`/`nombre d'exprimes du bureau de vote`,
            prop_fillon=100*FILLON/`nombre d'exprimes du bureau de vote`,
            prop_melenchon=100*(HAMON+`MÉLENCHON`)/`nombre d'exprimes du bureau de vote`) %>% 
  gather(key=type,value=valeur,-numbv,-arr)

res < - res %>% group_by(type) %>% 
  mutate(sur_rep=valeur/(mean(valeur)+.2*sd(valeur))) %>% # "la moyenne et un peu plus" (.2 écart type)
  filter(sur_rep>1) %>% group_by(numbv) %>% 
  mutate(keep=type[which.max(sur_rep)],valeur_keep=valeur[which.max(sur_rep)]) # on garde le candidat "le plus au dessus" de sa moyenne

# on ne garde pas les bureaux dupliqués
res < - res[!duplicated(res$numbv),]

# extraction des zones-candidats
extract_zone <- function (name)
{
    field <- paste0("prop_", name)
    return(subset(paris,paris$id_bv %in% res$numbv[res$keep==field]))
}

macron <- extract_zone('macron')
lepen  <- extract_zone('lepen')
melenchon <- extract_zone('melenchon') # avec le score d'Hamon ajouté
hamon <- extract_zone('hamon')
fillon <- extract_zone('fillon')

png("~/Desktop/parissur_rep.png",width=1100,height=800,res=150)
par(mar=c(1,0,1,1))
plot(paris) # on commence par "tracer" Paris 

plot_candidate <- function (cand, color)
{
    m<-match(cand$id_bv,res$numbv)
    plotvar<-res$valeur_keep
    nclr <- 3
    plotclr <- brewer.pal(nclr, color)
    class <- classIntervals(plotvar[m], nclr, style="fisher",dataPrecision=1)
    colcode <- findColours(class, plotclr)
    plot(cand,col=colcode,border=colcode,add=T)
}

plot_candidate(macron, "Greens")
plot_candidate(fillon, "Blues")
plot_candidate(melenchon, "Reds")
plot_candidate(lepen, "Purples")

plot(parisarr,add=T,lwd=.1) # on ajoute les frontières des arrondissements
legend(2.232, 48.91,legend=c("Hamon/Melenchon","Le Pen","Fillon","Macron"), fill=c("red","purple","deepskyblue","chartreuse3"), cex=1, bty="n",title="")
title(main="Zone de sur-performance des candidats. Paris. Présidentielles 2017.")
title(sub="Fond : opendata.paris.fr | données : Ville de Paris | Cartographie : B. Coulmont\nZones où les candidats font mieux que leur moyenne",line=-.5,cex.sub=.8)
dev.off()