Categories

Archives

Archives de la catégorie : 'cartographie'

L’écart d’âge entre conjoints

En France, l’écart d’âge entre conjoints (de sexes différents) est de 2 ans et demi. En moyenne, dans un couple, l’homme est 2,5 ans plus âgé que la femme.
Mais il y a une géographie de cet écart d’âge. En France métropolitaine, voici ce que cela donne, à partir du “Fichier détail individu” du Recensement 2014. L’intérêt du Fichier détail du recensement, c’est de pouvoir travailler sur près de 4,5 millions de couples (effectif non pondéré). Les zones sous la moyenne sont en bleu, les zones au dessus de la moyenne sont en rouge.

Du bassin minier au nord à la Charente, l’écart d’âge est faible. Dans le centre et en Corse, il a tendance à être plus élevé. Même chose en région parisienne et particulièrement en Seine Saint-Denis. On pourrait certainement trouver une explication culturaliste ou matérialiste : France du partage égalitaire et des petites fortunes à l’Ouest, formes d’héritages autrement constituées au Centre. Clanisme corse ? Mais il y a, pour un sociologue, d’autres explications.
On sait, par exemple, que l’écart d’âge est plus important pour les couples âgés que pour les jeunes couples. Il se pourrait donc que les variations de l’écart d’âge soient dûes au fait qu’à certains endroits de France habitent surtout des couples jeunes, et qu’à d’autres endroits, des couples plus âgés résident.
Dans la carte suivante, je “contrôle” par l’âge moyen du couple (c’est à dire la moyenne de l’âge de chaque conjoint), au niveau individuel. Puis je trace la carte des écarts par rapport à cette moyenne. Par exemple, dans les couples dont l’âge moyen est 35 ans, l’écart d’âge moyen est de 2,5 ans. Si l’écart constaté pour le couple n° 2 542 447 est de 3 ans, alors je considère qu’il est 0,5 an plus âgé (c’est le “résidu”). La carte suivante représente donc la moyenne des résidus par zone.

Ce contrôle par l’âge n’a pas tendance à atténuer les différences entre zones. Il semble avoir peu d’effet.
On va alors contrôler par la catégorie socio-professionnelle : car les femmes cadres ont des goûts en matière d’hommes que n’ont pas les femmes ouvrières ou agricultrices. De fait, les couples “cadres-cadres” ont un écart d’âge plus faible que les couples “ouvriers-ouvrières”. Et il se pourrait donc que les écarts d’âge moyens par zone soient dûs à la composition socioprofessionnelle de ces zones.
La carte suivante montre, par l’éclaircissement des coloris, que, en effet, le contrôle par la CS réduit les écarts. Une bonne partie des zones “très rouges” ou “très bleues” étaient de cette couleur en raison de la composition sociale.

Mais on sait aussi que les personnes qui ont un diplôme du supérieur n’ont pas les mêmes choix que les personnes qui n’ont pas de diplôme. On contrôle alors par ce niveau de diplôme. Là encore, on voit un effet :

Enfin il semble y avoir toujours une zone rouge en Seine Saint-Denis. L’on sait que c’est le département où la proportion d’immigrés est la plus importante, en France. Or les immigrés (c’est à dire les personnes nées étrangères à l’étranger) ont pu se marier avant d’arriver en France. De fait l’écart d’âge dans les couples immigrés est plus élevé (peut-être en raison d’un effet de sélection lors de la migration, peut-être en raison de la composition socioprofessionnelle de ce groupe). On va donc contrôler par l’âge moyen du couple, la CS des conjoints, le diplôme des conjoints et le fait d’être immigré ou non-immigré.
La carte s’éclaircit et “jaunit”, car de nombreuses zones bleues deviennent jaunes clair : il n’y a presque plus de différences entre régions françaises si la structure de la population est prise en compte. Quelques mois d’écart tout au plus.

Reste le cas de la Corse. Il y a visiblement, là, un goût pour l’écart d’âge qui ne s’explique pas par les variables utilisées ici.

Les immigrés cadres

Dans l’ancien département de la Seine (Paris et sa banlieue proche), où résident les cadres ?
La carte suivante s’intéresse aux personnes non immigrées : dans les zones en rouge, la population active est composée de plus de 70% de cadres et de professions intermédiaires, dans les zones en bleu, de moins de 34%.


Cliquez pour agrandir

On voit que Paris et l’Ouest ont une proportion importante de cadres et de professions intermédiaires.

Interessons-nous maintenant aux immigrés. La proportion de cadres et de professions intermédiaires dans la population active immigrée est plus faible. Mais grosso modo la distribution géographique ressemble à la précédente. Parmi les immigrés, il y a aussi plus de cadres à l’Ouest.

Cliquez pour agrandir

Les distributions géographiques sont proches, mais pas semblables. On peut voir qu’il y a certaines zones où semblent résider relativement plus de cadres immigrés (en proportion du total des actifs immigrés) que de cadres non-immigrés (en proportion du total des actifs natifs). Par exemple des zones où, parmi les immigrés actifs, il y a 45% de cadres (ce qui est bien supérieur à la moyenne — chez les immigrés) et où il n’y a “que” 50% de cadres parmi les natifs actifs (ce qui serait inférieur à la moyenne — chez les natifs).
Il y a des lieux où les immigrés de classe sup sont plus fréquents qu’attendus (par comparaison avec les natifs de classe sup) — et des lieux où ils sont relativement moins fréquents. Ce sont des différences de différences. Des lieux où, finalement, les immigrés cadres s’installeront un peu moins fréquemment que les immigrés natifs (des lieux refusés) et des lieux où il y aura un peu plus d’installation par comparaison aux natifs (des lieux recherchés).

Pour tracer la carte suivante, j’ai lissé les données en prenant en compte les 4 plus proches voisins (en pondérant par la population des IRIS).


Cliquez pour agrandir

Ces lieux : Anthony, Chatenay Malabry, Courbevoie et un morceau de Nanterre, mais aussi la zone frontière entre les 13e et 14e arrondissements.

Il s’agit de « différences de différences » : cette carte ne représente pas les zones où se trouvent beaucoup d’immigrés, mais où, après avoir pris en compte les différences et similitudes de distributions (géographique et statistique) entre les populations actives “natives” et “immigrées”, on repère un « résidu », des zones où l’on ne s’attendrait pas à voir “autant” ou “si peu” de cadres immigrés. … Mais il n’est pas certain qu’une telle carte soit très utile.

Zones de sur-performance

À partir des résultats au premier tour de l’élection présidentielle de 2017, à Paris, on peut tracer cette carte montrant les zones où les différents candidats ont réalisé des scores supérieurs à leur moyenne parisienne.

cliquez pour agrandir

Et voici le code, non commenté. Je commence par repérer où se trouvent les zones de sur-performance (les bureaux de votes). J’extrait du fond de carte parisien les 4 zones distinctes. Je trace ensuite quatre cartes les unes sur les autres.

library(tidyverse)
library(classInt)
library(RColorBrewer)
library(maptools)
library(rgdal)

setwd("~/Dropbox/projets-R/")

# le "shapefile" se trouve sur opendata.paris.fr
paris<-readOGR("../data/2017-listes-paris/secteurs-des-bureaux-de-vote-3/",
               "secteurs-des-bureaux-de-vote")

# frontières des arrondissements
parisarr <- readOGR ("../procurations/paris/arrondissements/parisarr.shp", layer="parisarr")
# les résultats électoraux se trouvent sur opendata.paris.fr
df <- read_csv2("~/Dropbox/procurations/paris/paris-2017/resultats_electoraux.csv")
df <- df %>% filter(`date du scrutin`=="2017-04-23") %>% 
  select(3,4,6,7,8,9,10,12,14,15,16,17) %>% 
  spread(key=`nom du candidat ou liste`,value=`nombre de voix du candidat ou liste obtenues pour le bureau de vote`) %>% 
  mutate(numbv=paste(`numero d'arrondissement 01 a 20`,`numero de bureau de vote 000 a 999`,sep="-"))

res <- df %>% group_by(numbv) %>% 
  summarize(arr=mean(as.numeric(`numero d'arrondissement 01 a 20`)),
            prop_macron=100*MACRON/`nombre d'exprimes du bureau de vote`,
            prop_lepen=100*`LE PEN`/`nombre d'exprimes du bureau de vote`,
            prop_fillon=100*FILLON/`nombre d'exprimes du bureau de vote`,
            prop_melenchon=100*(HAMON+`MÉLENCHON`)/`nombre d'exprimes du bureau de vote`) %>% 
  gather(key=type,value=valeur,-numbv,-arr)

res <- res %>% group_by(type) %>% 
  mutate(sur_rep=valeur/(mean(valeur)+.2*sd(valeur))) %>% # "la moyenne et un peu plus" (.2 écart type)
  filter(sur_rep>1) %>% group_by(numbv) %>% 
  mutate(keep=type[which.max(sur_rep)],valeur_keep=valeur[which.max(sur_rep)]) # on garde le candidat "le plus au dessus" de sa moyenne

# on ne garde pas les bureaux dupliqués
res <- res[!duplicated(res$numbv),]

# extraction des zones-candidats
macron <- subset(paris,paris$id_bv %in% res$numbv[res$keep=="prop_macron"])
lepen  <- subset(paris,paris$id_bv %in% res$numbv[res$keep=="prop_lepen"])
melenchon <- subset(paris,paris$id_bv %in% res$numbv[res$keep=="prop_melenchon"]) # avec le score d'Hamon ajouté
hamon <- subset(paris,paris$id_bv %in% res$numbv[res$keep=="prop_hamon"])
fillon <- subset(paris,paris$id_bv %in% res$numbv[res$keep=="prop_fillon"])

png("~/Desktop/parissur_rep.png",width=1100,height=800,res=150)
par(mar=c(1,0,1,1))
plot(paris) # on commence par "tracer" Paris 

m<-match(macron$id_bv,res$numbv)
plotvar<-res$valeur_keep
nclr <- 3
plotclr <- brewer.pal(nclr,"Greens")
class <- classIntervals(plotvar[m], nclr, style="fisher",dataPrecision=1)
colcode <- findColours(class, plotclr)
plot(macron,col=colcode,border=colcode,add=T)

m<-match(fillon$id_bv,res$numbv)
plotvar<-res$valeur_keep
nclr <- 3
plotclr <- brewer.pal(nclr,"Blues")
class <- classIntervals(plotvar[m], nclr, style="fisher",dataPrecision=1)
colcode <- findColours(class, plotclr)
plot(fillon,col=colcode,border=colcode,add=T)

m<-match(melenchon$id_bv,res$numbv)
plotvar<-res$valeur_keep
nclr <- 3
plotclr <- brewer.pal(nclr,"Reds")
class <- classIntervals(plotvar[m], nclr, style="fisher",dataPrecision=1)
colcode <- findColours(class, plotclr)
plot(melenchon,col=colcode,border=colcode,add=T)

m<-match(lepen$id_bv,res$numbv)
plotvar<-res$valeur_keep
nclr <- 3
plotclr <- brewer.pal(nclr,"Purples")
class <- classIntervals(plotvar[m], nclr, style="fisher",dataPrecision=1)
colcode <- findColours(class, plotclr)
plot(lepen,col=colcode,border=colcode,add=T)

plot(parisarr,add=T,lwd=.1) # on ajoute les frontières des arrondissements
legend(2.232, 48.91,legend=c("Hamon/Melenchon","Le Pen","Fillon","Macron"), fill=c("red","purple","deepskyblue","chartreuse3"), cex=1, bty="n",title="")
title(main="Zone de sur-performance des candidats. Paris. Présidentielles 2017.")
title(sub="Fond : opendata.paris.fr | données : Ville de Paris | Cartographie : B. Coulmont\nZones où les candidats font mieux que leur moyenne",line=-.5,cex.sub=.8)
dev.off()

Et, en bonus, le code, amélioré par Christophe P. :


library(tidyverse)
library(classInt)
library(RColorBrewer)
library(maptools)
library(rgdal)

rep_data_secteurs < - 'DATA/secteurs-des-bureaux-de-vote'
# "../data/2017-listes-paris/secteurs-des-bureaux-de-vote-3/"


setwd("~/Dropbox/projets-R/")

# le "shapefile" se trouve sur opendata.paris.fr
paris<-readOGR(rep_data_secteurs,
               "secteurs-des-bureaux-de-vote")

# frontières des arrondissements
parisarr <- readOGR ("../procurations/paris/arrondissements/parisarr.shp", layer="parisarr")
# les résultats électoraux se trouvent sur opendata.paris.fr
df <- read_csv2("~/Dropbox/procurations/paris/paris-2017/resultats_electoraux.csv")
df <- df %>% filter(`date du scrutin`=="2017-04-23") %>% 
  select(3,4,6,7,8,9,10,12,14,15,16,17) %>% 
  spread(key=`nom du candidat ou liste`,value=`nombre de voix du candidat ou liste obtenues pour le bureau de vote`) %>% 
  mutate(numbv=paste(`numero d'arrondissement 01 a 20`,`numero de bureau de vote 000 a 999`,sep="-"))

res < - df %>% group_by(numbv) %>% 
  summarize(arr=mean(as.numeric(`numero d'arrondissement 01 a 20`)),
            prop_macron=100*MACRON/`nombre d'exprimes du bureau de vote`,
            prop_lepen=100*`LE PEN`/`nombre d'exprimes du bureau de vote`,
            prop_fillon=100*FILLON/`nombre d'exprimes du bureau de vote`,
            prop_melenchon=100*(HAMON+`MÉLENCHON`)/`nombre d'exprimes du bureau de vote`) %>% 
  gather(key=type,value=valeur,-numbv,-arr)

res < - res %>% group_by(type) %>% 
  mutate(sur_rep=valeur/(mean(valeur)+.2*sd(valeur))) %>% # "la moyenne et un peu plus" (.2 écart type)
  filter(sur_rep>1) %>% group_by(numbv) %>% 
  mutate(keep=type[which.max(sur_rep)],valeur_keep=valeur[which.max(sur_rep)]) # on garde le candidat "le plus au dessus" de sa moyenne

# on ne garde pas les bureaux dupliqués
res < - res[!duplicated(res$numbv),]

# extraction des zones-candidats
extract_zone <- function (name)
{
    field <- paste0("prop_", name)
    return(subset(paris,paris$id_bv %in% res$numbv[res$keep==field]))
}

macron <- extract_zone('macron')
lepen  <- extract_zone('lepen')
melenchon <- extract_zone('melenchon') # avec le score d'Hamon ajouté
hamon <- extract_zone('hamon')
fillon <- extract_zone('fillon')

png("~/Desktop/parissur_rep.png",width=1100,height=800,res=150)
par(mar=c(1,0,1,1))
plot(paris) # on commence par "tracer" Paris 

plot_candidate <- function (cand, color)
{
    m<-match(cand$id_bv,res$numbv)
    plotvar<-res$valeur_keep
    nclr <- 3
    plotclr <- brewer.pal(nclr, color)
    class <- classIntervals(plotvar[m], nclr, style="fisher",dataPrecision=1)
    colcode <- findColours(class, plotclr)
    plot(cand,col=colcode,border=colcode,add=T)
}

plot_candidate(macron, "Greens")
plot_candidate(fillon, "Blues")
plot_candidate(melenchon, "Reds")
plot_candidate(lepen, "Purples")

plot(parisarr,add=T,lwd=.1) # on ajoute les frontières des arrondissements
legend(2.232, 48.91,legend=c("Hamon/Melenchon","Le Pen","Fillon","Macron"), fill=c("red","purple","deepskyblue","chartreuse3"), cex=1, bty="n",title="")
title(main="Zone de sur-performance des candidats. Paris. Présidentielles 2017.")
title(sub="Fond : opendata.paris.fr | données : Ville de Paris | Cartographie : B. Coulmont\nZones où les candidats font mieux que leur moyenne",line=-.5,cex.sub=.8)
dev.off()

Procuration, mobilisation

Au premier tour des régionales de 2015, 10578 Parisiennes et Parisiens ont votés par procuration (ils ont du trouver environ 10500 électeurs pour voter à leur place). Au second tour, ce sont 18104 personnes qui ont voté par procuration à Paris. Presque le double. Et comme il faut un nombre équivalent de personnes mandatées pour mettre le bulletin dans l’urne, ce sont environ 36 000 votes qui sont concernés par la procuration.
Cette augmentation des votes par procuration entre les deux tours ne sont pas réparties aléatoirement sur l’espace parisien. C’est surtout dans les bureaux de votes qui avaient déjà vu un grand nombre de procurations au premier tour que l’augmentation est la plus forte, mais on repère aussi que dans les arrondissement de l’Ouest (8e, 17e, 16e) le recours à la procuration avait été faible au premier tour, il est fort au second tour.
procurationsparisdiffreg2015

Les votes par procurations à Paris (régionales 2015)

Le premier tour des élections régionales de décembre 2015 a suscité relativement peu de votes par procuration (moins de 2% des votes exprimés). Mais la géographie parisienne des votes par procurations en décembre 2015 ressemble à celle des élections européennes de 2014 : plus de procurations au centre de Paris.

procurationsparisregionales1
cliquez pour agrandir

 

Il y en avait eu deux fois plus lors des Européennes de 2014 (mais elles avaient eu lieu le 25 mai, c’est à dire à un moment où il est agréable de partir en week-end dans sa maison de campagne).

procurationspariseuropeennes
cliquez pour agrandir

La carte des procurations lors des élections présidentielles et législatives n’est pas tout à fait la même : les procurations sont alors bien plus importantes à l’Ouest qu’à l’Est.

Le second tour des élections régionales devrait voir plus de procurations, si l’on en croit la presse (Le Figaro, Le Parisien, 20 Minutes) : il semble en effet qu’à Paris (mais aussi Toulouse ou Arras ou Ajaccio et Grenoble) de nombreuses personnes cherchent à établir des procurations. Il y en avait aussi eu beaucoup au second tour des présidentielles de 2002.

Et voici, comme autre point de comparaison, une carte similaire pour le premier tour des municipales de 2014 à Paris. Des petites différences se repèrent : certains arrondissements sans aucun suspens électoral (16e, 20e, 19e, 13e…) voient peu de votes par procuration.
procurationsparismunicipales

Lissage

Confronté à une carte de la France à l’échelon communal, on peut avoir parfois envie de calculer une moyenne prenant en compte plusieurs communes. En effet, il y a énormément de communes très petites, pour lesquelles un individu de plus ou de moins peut conduire à des taux différents. On peut passer de suite à l’échelle départementale (comme je le fais ici), mais on perd en finesse.

Par exemple, si je dresse la carte du ratio “Inscrits/résidents”, je me retrouve avec une carte qui semble stochastique. Il peut être intéressant de calculer non plus ce ratio pour une commune, mais pour le groupe des N communes les plus proches. Le GIF-animé, ci dessous, montre ce qu’il advient de cette carte quand on augmente le nombre de voisins (ici entre 1 et 32).
lissage-bargel
On voit apparaître plus clairement des zones où les inscrits sont plus nombreux que les résidents majeurs et des zones où, au contraire, les inscrits sont beaucoup moins nombreux que les résidents (à la fois parce que celles et ceux qui y résident sont inscrits ailleurs ou parce que ces résident.e.s n’ont pas le droit de vote en France).

Avec le logiciel R, voici les instructions qui permettent, à partir du fichier GEOFLA des communes (ici “france”), de déterminer les k plus proches communes voisines.

library(spdep) # package à charger : spdep
france.cntr<-cbind(france$X_CENTROID,france$Y_CENTROID) # on extrait les centroides des communes
k <- 8 # nombre de voisins à extraire
nn <- knearneigh(france.cntr, k, longlat=FALSE)
france.neighbors.knn <- knn2nb(nn)
df<-do.call(rbind.data.frame, france.neighbors.knn) # df est le data.frame contenant, pour chaque colonne i, l'indice des voisins d'ordre i 

 
Pour aller plus loin et mieux comprendre l’Effet Bargel .

« Je vote ailleurs »

Vous avez sans doute déjà entendu une connaissance, un ami, une collègue vous dire « Je vote ailleurs ». De nombreuses personnes, en effet, ne sont pas inscrites là où elles résident. Ce découplage entre inscription et résidence se perçoit assez bien à l’échelle des communes ou des départements. Dans un département sur six, en France, un tiers des communes comptent plus d’inscrits que de résidents majeurs (c’est à dire où le nombre d’inscrits est au moins 10% supérieur au nombre de résidents).

effet-bargel-departement

Cela a sans doute des implications au niveau local : élections municipales tout d’abord, mais aussi élections législatives, voire régionales… Si vous êtes candidat.e, vous devez aussi capter les votes « de l’extérieur », capter celles et ceux qui « votent à distance ».

Pour mettre en évidence ce découplage, j’ai comparé le nombre d’inscrits par commune en 2012 (disponible sur data.gouv.fr) et le nombre de résidents majeurs par commune en 2012 (disponible sur le site de l’INSEE).
Les résultats sont similaires pour les années qui précèdent 2012.
france070910dep
Pour aller plus loin : une exploration de l’effet Bargel

La France des spécialités agricoles

La France, c’est le pays des fromages, des agneaux, des miels, des vins, du cresson, etc… et depuis longtemps, ces productions font l’objet de protection diverses. Attention à ne pas produire de Camembert à Roquefort, ou de Champagne à Brie.
Deux bases produites par l’INAO (l’Institut national de l’origine et de la qualité), portant sur les aires géographique des AOC-AOP et des IGP, nous donnent un aperçu des France agricoles, si l’on relie ces bases au fichier des communes de l’IGN.
J’ai combiné ces deux fichiers pour cartographier, pour chaque commune de France métropolitaine, le nombre cumulé d’IGP et d’AOC/AOP. Le Nord de Paris est plutôt vide : est-ce parce que le blé et les betteraves n’ont ni AOC ni IGP, ni appellation d’origine, ni indication géographique protégée? Il apparaît en grisé (voir note). Certaines communes sont le lieu de plus d’une dizaine d’AOC/IGP : on y produit vins, fromages, boeufs, cresson, oies, bergamotes, miels, rillettes et saucisses, toutes plus authentiques les unes que les autres.
La France industrielle et minière y apparaît en vert : le charbon du Nord n’a pas d’AOC, l’acier de Lorraine non plus. Et le porc de Bretagne a sans doute tout eclipsé.

france-aoc-igp
cliquez pour agrandir

La victoire revient à la petite commune de Chassagne-Montrachet en Côte d’Or, lieu de 73 AOC/AOP et IGP (principalement du vin).

Note : J’ai choisi le grisé, car les bases n’indiquent pas “zéro” IGP dans ces communes. Elles n’apparaissent simplement pas dans les bases de l’INAO. Probablement parce que c’est “zéro”, mais on ne traite pas des “vides” comme des “zéros”, si ?

Le Suicide en 1890

Le Compte général de l’administration de la justice criminelle donne, pour le XIXe siècle, le nombre annuel de suicides par département. En combinant ces chiffres avec ceux des recensements, il est possible de cartographier les zones suicidogènes et les zones protégées.
Ainsi, en 1890, le taux des suicides variait, dans les départements de France métropolitaine, entre 46 suicide par millions d’habitant et 556 suicides par million.
suicide-1890
Les recensements sont disponibles sur le site de l’INSEE à partir de 1851 et jusqu’en 1921.
Il me semble que le Compte général de la justice n’a malheureusement pas été transformé en fichier utilisable directement. On les trouve sur gallica.bnf.fr mais sous la forme de copies numériques. Il faut donc faire un petit travail de copie.
Le “Compte général de la justice” a de nombreuses informations sur les suicides : nombre annuel par département, différencié selon les hommes et les femmes, par tranche d’âge, par état civil (marié, veuf, avec ou sans enfants…) On a aussi des informations sur le lieu du suicide, sur le mode de suicide :
suicide-1890-mode
Nous disposons aussi de la répartition mensuelle et des professions des suicidés, croisées avec le “motif présumé” (la “grossesse hors mariage” est le motif principal des suicides des “domestiques”).
La transposition de ces informations en base de données utilisables sera probablement un des exercices que je donnerai dans le cadre du cours que je vais donner sur Le Suicide de Durkheim… si, véritablement, on ne trouve pas de fichier déjà disponible.

Géographie des prénoms en Turquie, suite

Suite de l’étude des prénoms en Turquie commencée hier.
On dispose, pour chaque province, des 3 prénoms les plus donnés aux garçons et des trois prénoms les plus donnés aux filles. On peut considérer que plus deux provinces partagent des prénoms, plus elles sont similaires : si elles en partagent six, elles sont “semblables”.
Nous sommes limités dans l’analyse par le nombre réduit de prénoms et par l’absence d’informations sur la fréquence. Etre “numéro 1” quand on est donné à 20% des garçons et “numéro 1” quand on est donné qu’à 5% des garçons… ce n’est pas vraiment pareil.
J’ai réalisé une analyse en composantes principales (ACP) à partir des informations recueillies. Le premier axe n’est pas représenté : il est du à la seule province de Tunceli, petite et avec moins de 1000 naissances en 2013. Je ne représente ici que les axes 2 et 3.
pca-resume
L’axe 2 oppose des prénoms comme Hiranur, Nisanur, Muhammed et Yusuf à des prénoms comme Emir, Cinar, Kerem et Elif. L’axe 3 Mehmet et Mustafa à Irmak, Arda ou Emir.
Les individus, ici, sont les provinces : TR213 est Kiklareli province à la frontière de la Bulgarie (et que les Bulgares appellent Lozengrad).TRB24, c’ets Hakkari, à l’extrême Est de la Turquie (à la frontière avec l’Iran et l’Irak). D’un côté, à l’Ouest, les parents choisissent plutôt Emir et Elif, et à l’Est plutôt Nisanur et Muhammed.
Dans la carte suivante, les provinces sont coloriées en fonction de leur coordonnée sur l’axe 2 de l’ACP. Les rouges/orangées ont des coordonnées positives (les provinces à la droite du graphique, à l’Ouest géographiquement), les bleues foncées ont des coordonnées négatives (les provinces à l’Est, à gauche du graphique).

acp2

A partir d’une analyse des six prénoms les plus donnés aux enfants par province, en 2013, on voit apparaître des différences entre l’Est et l’Ouest de la Turquie.