Categories

Archives

Géographie des prénoms en Turquie, suite

Suite de l’étude des prénoms en Turquie commencée hier.
On dispose, pour chaque province, des 3 prénoms les plus donnés aux garçons et des trois prénoms les plus donnés aux filles. On peut considérer que plus deux provinces partagent des prénoms, plus elles sont similaires : si elles en partagent six, elles sont “semblables”.
Nous sommes limités dans l’analyse par le nombre réduit de prénoms et par l’absence d’informations sur la fréquence. Etre “numéro 1” quand on est donné à 20% des garçons et “numéro 1” quand on est donné qu’à 5% des garçons… ce n’est pas vraiment pareil.
J’ai réalisé une analyse en composantes principales (ACP) à partir des informations recueillies. Le premier axe n’est pas représenté : il est du à la seule province de Tunceli, petite et avec moins de 1000 naissances en 2013. Je ne représente ici que les axes 2 et 3.
pca-resume
L’axe 2 oppose des prénoms comme Hiranur, Nisanur, Muhammed et Yusuf à des prénoms comme Emir, Cinar, Kerem et Elif. L’axe 3 Mehmet et Mustafa à Irmak, Arda ou Emir.
Les individus, ici, sont les provinces : TR213 est Kiklareli province à la frontière de la Bulgarie (et que les Bulgares appellent Lozengrad).TRB24, c’ets Hakkari, à l’extrême Est de la Turquie (à la frontière avec l’Iran et l’Irak). D’un côté, à l’Ouest, les parents choisissent plutôt Emir et Elif, et à l’Est plutôt Nisanur et Muhammed.
Dans la carte suivante, les provinces sont coloriées en fonction de leur coordonnée sur l’axe 2 de l’ACP. Les rouges/orangées ont des coordonnées positives (les provinces à la droite du graphique, à l’Ouest géographiquement), les bleues foncées ont des coordonnées négatives (les provinces à l’Est, à gauche du graphique).

acp2

A partir d’une analyse des six prénoms les plus donnés aux enfants par province, en 2013, on voit apparaître des différences entre l’Est et l’Ouest de la Turquie.

À pied, en voiture, à cheval ou en métro ?

Comment se déplacent les Franciliens pour aller au travail ?
Voici une petite exploration à partir des données du recensement 2010 (disponibles sur le site de l’INSEE). Il y a trois possibilités : à pied, en voiture, ou en transport en commun. L’occasion de faire une analyse “ternaire”. Ici, le vert-vert signifie le recours à la voiture, le bleu le recours aux transports en commun, et plus cela tend vers le rouge, plus les pieds sont utilisés pour aller au travail.
deplacements

Voici le “ternary plot” :

ggtern

J’étais tombé sur une image proche visualisant les transports dans le grand-Londres, mais je ne sais plus où.
Et si vous me dites : « mais moi, je marche jusqu’à ma voiture et je roule jusqu’à la gare… » Je vous répondrai d’aller visiter le site de l’INSEE pour comprendre la construction des données.
Note : par “à pied”, il faut comprendre “sans aucun déplacement”, “à pied”, ou “en deux-roues”

Un peu en avance

De nombreux travaux ont montré que, s’agissant des prénoms les plus fréquents, les cadres étaient “en avance” sur le reste des professions et catégories socioprofessionnelles. Des parents cadres vont avoir tendance à donner des prénoms un peu avant que des parents “professions intermédiaires” ou “employés” ne donnent les mêmes prénoms.
L’avance sur la mode peut-elle alors être prise comme indicateur indirect de position sociale ?
À partir des listes électorales parisienne, j’ai comparé, pour chaque “premier prénom”, l’année de naissance de l’électeur et l’année pendant laquelle son prénom atteint son rang le plus élevé. Ainsi un électeur prénommé Matthieu, né en 1979, sera considéré comme “en avance” de dix ans sur la mode (le prénom “Matthieu” atteint son meilleur rang national en 1989). On peut faire cela pour le million d’électeurs et d’électrices né-e-s en France et inscrit-e-s à Paris. Les prénoms très rares posent problème, car les données disponibles ne permettent pas de calculer l’année de leur “pic”. C’est le cas pour 8,3% des électeurs/trices.
La carte suivante montre, à l’échelle du bureau de vote, quelle est la proportion d’inscrits dont le prénom est au moins 3 ans “en avance” sur le pic.

avance

On remarquera aisément que les quartiers de Paris les plus “bourgeois” sont aussi ceux où les prénoms sont les plus fréquemment “en avance”. Comme si la mode pouvait naître dans un coin caché du septième arrondissement et essaimer, ensuite, dans le reste du corps social.

Paris en couleurs

Les listes électorales sont une source de données formidables. J’ai eu l’occasion de les explorer récemment. Première tentative de synthèse ici.
mds-couleur
click to embigen

J’ai conservé quelques variables, à l’échelle du bureau de vote : l’âge moyen, la proportion de femmes inscrites, la proportion de personnes nées à l’étranger, la proportion de “nobles”, la proportion de personnes portant plus de deux prénoms.
J’ai appliqué à cela une procédure appelée “Multi-dimensional scaling“, qui permet de rapprocher entre eux des individus ayant des caractéristiques proches. Ici, les individus sont des bureaux de vote.
J’ai retenu trois dimensions.
La première dimension rassemble entre eux les bureaux de vote selon la proportion d’inscrits nés à l’étranger [on remarque que le 16e arrondissement est un peu différent du 8e et du 7e].
La deuxième dimension capture les variations de l’âge et du sexe apparemment.
La troisième dimension est plus complexe à interpréter immédiatement (et je n’ai pas encore exploré en détail).
Sur ces trois dimensions, chaque bureau de vote a un score, que je normalise entre 0 et 255, ce qui permet d’associer une couleur “RVB” à chaque bureau. Un bureau ayant un score semblable sur les trois dimension sera plutôt gris (clair ou foncé).

La carte oppose alors un bureau de vote situé au cœur du septième arrondissement (qui est ici vert foncé) aux bureaux de votes rose/orangés des marges de Paris. Mais aussi un bureau “vert-clair”, au cœur de Paris (plus masculin et jeune) à d’autres que je vous laisse trouver. La Butte Montmartre apparaît bien bleue. L’opposition entre Ouest et Est, importante à Paris, apparaît indirectement : les couleurs les plus sombres sont à l’Ouest, comme si un nuage était posé sur l’Ouest.
[Première synthèse qu’il faudra affiner, bien sûr].

d <- dist(mydata)
fit <- cmdscale(d,eig=TRUE, k=3)
x <- fit$points[,1]
y <- fit$points[,2]
z <- fit$points[,3]
range01 <- function(x){round(255*(x-min(x))/(max(x)-min(x)))}
xs<-range01(x)
ys<-range01(y)
zs<-range01(z)
mds<-cbind(xs,ys,zs)
couleurs<-rgb(mds[,1],mds[,2],mds[,3],maxColorValue=255)
# et ensuite, il suffit d'associer chaque Bureau de vote à chaque couleurs : le BV[i] recevra couleur[i]

Pretty R at inside-R.org

La méthode a été inspirée par cet article : Delineating Europe’s Cultural Regions: Population Structure and Surname Clustering [James Cheshire, Pablo Mateos et Paul A. Longley]

Où sont les femmes ?

Les listes électorales contiennent des informations intéressantes, à l’échelle du bureau de vote. On peut mettre en carte la proportion d’inscrits dont le nom de famille comporte une particule. On peut aussi cartographier d’autres caractéristiques, plus classiques.

Si l’on sait qu’il nait chaque année environ 105 hommes pour 100 femmes, l’on voit que cette proportion est inégalement répartie sur le territoire parisien. Au centre-nord de Paris, les inscrits sont plus souvent des hommes que des femmes. Ces dernières sont plus “rive-gauche” finalement.
femmesinscrites

D’autres informations montrent la diversité de l’espace parisien. Ainsi l’âge. L’âge de l’inscrit médian est d’environ 50 ans dans le XVIe… et d’environ 40 ans dans le XVIIIe.

agemedian
Mais la dispersion est aussi intéressante : le “centre-nord” de Paris a des inscrits moins dispersée en âge, alors que les XVIe, VIIe, XVe arrondissement ont une population d’inscrits plus diverses (sous le rapport de l’âge).

dispersionage

Et si l’on s’intéresse au lieu de naissance des électeurs ? On peut voir que les électeurs nés à l’étranger se trouvent surtout à proximité des périphériques. Le XVIe a plus d’étrangers que ce que j’aurai pensé a priori, mais ce ne sont probablement pas les mêmes étrangers que dans le XVIIIe arrondissement. Et Montmartre serait le dernier village gaulois.
paris-etranger

Sociologie d’un quartier

Un correspondant m’envoie un problème. Dans le cadre d’une enquête portant sur la socio-histoire d’un quartier, il a eu accès à des archives qui indiquent, pour quelques pâtés de maison (pâtés d’immeubles), la composition sociale.
Ces données apparaissent sur des cartes réalisées à différents moments :
quartier
Les zones les plus foncées sont celles où la population a fréquemment une certaine caractéristique (peu importe la caractéristique, que ce soit la composition sexuée, la proportion de cadres ou de joueurs de banjo).
La question posée était : comment refaire la carte ? Plus précisément, il m’écrit : “Je souhaite montrer les évolutions que connaissent ces différentes zones en utilisant les fonctions cartographiques de R, surtout les cartes choroplèthes et en cercles proportionnels. En bref, comment faire pour coder ces zones ?”

Ce n’est pas très compliqué :
Pour commencer, il faut retracer les formes. Pour cela, il est possible de créer une carte sur google maps (cliquer sur “My places” (à côté de “Get Directions”) dans l’interface de google maps (il vous faudra peut-être un compte google).
Il est ensuite possible de dessiner des formes (“shapes”), et de leur associer un identifiant (qui sera la “clé” à partir de laquelle associer les données chiffrées).
map-google-quartier
Ensuite, google maps permet d’exporter les “shapes” au format .kml

Voici une explication en vidéo :

Et dès qu’on a du .kml, alors on peut lancer R.
Imaginons que notre fichier .kml s’appelle quartier.kml

Dans R : (Note : il faut le package osmar, que j’ai présenté ici)

library(maptools)
library(rgdal)
library(osmar)
#charger les polygones du quartier :
quartier < - readOGR("Desktop/quartier.kml",layer="quartier")
#charger la carte du quartier
#grâce au package osmar [info] 
src < - osmsource_api()
bb <- center_bbox(LONGITUDE,LATITUDE, 800, 800)
ua <- get_osm(bb, source = src)
#dessiner les bâtiments (c'est optionnel)
bg_ids <- find(ua, way(tags(k == "building")))
bg_ids <- find_down(ua, way(bg_ids))
bg <- subset(ua, ids = bg_ids)
bg_poly <- as_sp(bg, "polygons")
#dessiner les routes (pour donner une idée)
plot(bg_poly, col = "lightgray",border="#ffffff00")
cw_ids <- find(ua, way(tags(k %in% c("highway"))))
cw_ids <- find_down(ua, way(cw_ids))
cw <- subset(ua, ids = cw_ids)
cw_line <- as_sp(cw, "lines")
plot(cw_line, add = TRUE, col = "black",lwd=10)
plot(quartier,add=TRUE,col=CODECOULEUR)

Created by Pretty R at inside-R.org

carto-quartier
Cliquez pour avoir un PDF vraiment yummy-yummy

Par comparaison, voici un morceau de la carte originale :
quartier-comparaison
Je ne sais pas ce que mon correspondant va faire avec ses cartes, mais l’objectivation cartographique peut sans doute contribuer au raisonnement sociologique.

Les sex-shops à Paris. Quelques chiffres

Comment les sex-shops, à Paris, ont évolué numériquement depuis une douzaine d’années. Est-il possible d’avoir des chiffres comparables ? Oui, car l’APUR (l’Atelier parisien d’urbanisme) réalise, tous les trois ans environ, une étude très poussée sur les quelques 60 000 commerces parisiens, et que les différentes études sont globalement comparables entre elles. Comme nous allons pouvoir le constater, ces magasins sont actuellement en crise :
 
Entre 2000 et 2005 l’évolution avait été changeante : une petite hausse entre 2000 et 2003, une forte baisse entre 2003 et 2005.


source : Banque de données sur le commerce parisien. Résultats du recensement 2005 et évolutions 2000-2003-2005. (APUR, 2005)

Depuis 2005, la tendance est encore à la baisse : -3 % entre 2005 et 2007, -4% entre 2007 et 2011.


source : L’évolution des commerces à Paris. Inventaire des commerces 2011 et évolutions 2007-2011 (APUR, 2012)

Depuis 2003, la baisse cumulée est d’environ 25% (il y en avait près de 130 en 2003, il y en a un peu moins de 100 aujourd’hui).

De manière intéressante, les autorités municipales semblent ne pas s’inquiéter de la disparition d’un petit commerce de quartier, qui avait pourtant l’intérêt d’être ouvert en soirée et d’avoir une clientèle habitant parfois assez loin. Au contraire, il semble qu’une politique d’urbanisme bien réfléchie vienne contribuer au remplacement des sex-shops par d’autres magasins :


source : extrait de L’évolution des commerces à Paris. Inventaire des commerces 2011 et évolutions 2007-2011 (APUR, 2012)
 

Il faudrait signaler, aussi, les restrictions spatiales mises à l’installation de nouveaux sex-shops depuis 2007 (où un amendement à une loi de 1987 est venu étendre à 200m autour des établissements scolaires la zone d’interdiction des sex-shops). Cela pourrait expliquer pourquoi, si des magasins ferment, d’autres ne se créent pas. Mais pour en être certain, il faudrait pouvoir étudier, outre le stock, les flux (ouvertures et fermetures depuis 2000).

Note : Je disais au début que les vagues d’enquête de l’APUR étaient globalement comparables entre elles. Car dans le détail, certains magasins peuvent apparaître à certains enquêteurs comme des magasins de lingerie (CC108) ou des magasins de vidéo (CF405, SA401) et non pas comme des sex-shops (CF502)… De même les séries d’arrondis sur les pourcentages, et l’incertitude à la marge (est-ce 125 ? est-ce 131 ?) ne doivent pas tromper : la tendance est bien à la baisse.

Vous êtes ici. Là !

C’est peut-être le besoin de se rassurer, de s’assurer qu’on n’est pas seulement ici, mais bel et bien , qui fait se rencontrer le bout d’un doigt et la carte des stations.

Quand j’étais petit, et que Paris était une ville étrangère, ces zones arrachées m’indiquaient où j’étais : il suffisait de les repérer pour pouvoir ensuite s’orienter. Les traces d’usage collectif remplaçaient fort bien le “Vous êtes ici” accolé à certaines cartes. Crowdsourcing avant l’heure, objectivation d’une combinaison du volume de fréquentation de chaque station et de son caractère touristique. Aujourd’hui, dans la plupart des stations, les cartes sont protégées par un film plastique, qui empêche d’user trop vite la zone de la station.

En 1994, une artiste italienne, Paola di Bello, avait photographié, dans les 350 stations du métro, ces zones. Pour ensuite en reconstituer une grande carte du métro, sur lesquelles les stations étaient soumises à la disparition paradoxale. On trouve quelques explications de sa démarche sur le site de Paola di Bello.
Note : Ce billet est un effet secondaire de la lecture de Petite sociologie de la signalétique : Les coulisses des panneaux du métro.

La variété des productions culturelles

Deux fois par semaine, je fais le tour du quartier Château Rouge, juste au Nord de Barbès, pour y recueillir les affiches des églises évangéliques et pentecôtistes “noires” ou “africaines”. L’affichage sauvage est répandu dans quelques rues, autour de la station de métro. Les afficheurs se livrent à une concurrence permanente pour l’espace des murs aveugles et des barrières de chantier (d’autres gestionnaires d’espace s’y opposent). On voit, sur la photo ci-contre, un “Messager de Dieu” dire “Sans toi, je ne suis rien” mais aussi une affiche politique “Kabila dégage”, ainsi qu’une comédie, “Le string qui tue“.
Mais aujourd’hui, j’ai aussi trouvé l’indice d’une production culturelle moins légitime :
Il s’agit de publicité pour un film pornographique qui propose des scènes “dans des arbres”, et qui n’a rien à envier aux couvertures de “Hot Vidéo” qui parsèment les vitrines des vendeurs de journaux. Le messager de Dieu aura fort à faire pour lutter contre le messager de la luxure.
Je ne connais pas de travaux ethnographiques portant sur la pornographie “africaine” (ses marchés, ses modes de diffusion, ses formes de “captation” de ce que les vidéastes pensent être les fantasmes rentables…). Il semble cependant, d’après divers indices, que certaines formes de régulation par les “bonnes moeurs” ne fonctionnent plus très bien. J’avais été en contact avec des personnes cherchant à ouvrir des sex-shops en Afrique. Dans un site consacré au Cameroun, on peut lire qu’après une descente de police, les DVD reviennent à Youndé… Et, récemment, dans les Inrockuptibles un petit article donnaient quelques informations.
Sur l’affiche de Château-Rouge, aucun lieu de vente précis n’est indiqué. Juste “Château Rouge” : les petits revendeurs à la sauvette, qui proposent, sur des étals en carton, de fausses montres, des légumes exotiques ou des DVD, doivent parfois proposer ce genre de DVD.
 

Aaaargh ! Helvetica !

À la station Ménilmontant, l’autre jour, un panneau de signalisation, au lieu de contenir l’habituel Parisine, était rédigé dans un sans-serif familier.

Le fabricant du panneau, au moins, n’a pas utilisé Arial. Ni, ouf !, Comic Sans. On trouve, ailleurs sur internet, un autre match Parisine vs. Helvetica.
Si vous voulez savoir comment cette erreur a pu arriver et combien de points cette erreur va coûter au directeur de la station, vous pouvez lire la Petite sociologie de la signalétique de J. Denis et D. Pontille.