Categories

Archives

Sans commentaire

Pareto Rules !

[En fait, il faut un commentaire. Les données portent sur l’année 2004, elles proviennent du “Fichier des prénoms”, obtenu par le Centre Quêtelet. Et : il faut beaucoup plus que 10000 prénoms pour nommer 100% des naissances, mais les données auxquelles j’ai accès contiennent une catégorie globale, “Prenoms rares”, donnée en 2004 à plus de 7% des naissances, sans qu’il soit possible de savoir combien de prénoms se trouvent dans cette catégorie. Mais cela ne changerait pas du tout la forme de la courbe.]

Amusements cartographiques

Pour rédiger mon tutoriel cartographique pour R, je cherchais des données variées. J’ai réussi à trouver les résultats à la présidentielle de 2007, par départements. J’ai du retravailler un peu le fichier, que je donne à la collectivité :
presidentielles.csv
Avec ça, on peut faire de jolies cartes. Mes premières essaient de repérer les zones où les candidats ont reçu leur pourcentages maxi et mini de votes.
Je classe les données par intervalles avec le package classInt :
class<-classIntervals(plotvar, nclr, style=”equal”)

 

 

Je sais, ces cartes n’ont rien de formidable, on en trouve de mieux sur internet, il n’y a pas de légende… Mais vous pouvez les reproduire ces cartes. Talk about empowerment !

plotvar <- presidentielles$schivardi/presidentielles$exprime
nclr <- 6
plotclr <- brewer.pal(nclr,”RdBu”)
plotclr <- plotclr[nclr:1] # reorder colors
class <- classIntervals(plotvar, nclr, style=”equal”)
colcode <- findColours(class, plotclr)
plot(departements,col=colcode,lty=”blank”,lwd=.5)
title(main=”Votes pour Schivardi”)

Cartographie avec R, “tutoriel”

Voici une oeuvre en voie de composition : un tutoriel pour la cartographie avec R. Considérez que le fichier, disponible à l’adresse suivante https://coulmont.com/cartes/rcarto.pdf, est pour l’instant une version très préliminaire. Disons une version 0.1
Il existe de bons “tutoriels” en ligne en français, notamment pour la régression logistique (Lemercier et Sofio 1) ou l’analyse factorielle (Sofio et Lemercier 2).
Je n’en connais pas pour la cartographie, d’où mon initiative.
Les commentaires sont les bienvenus.

La danse étrange des mariages

Récemment, Timothée Poisot, en étudiant la répartition annuelle des mariages, se demandait pourquoi les variations mensuelles semblaient cycliques. En juin par exemple, tout les 5 ans environ, le nombre de mariage est plus élevé que la moyenne des années précédentes.
Je pensais au début que c’était lié aux congés mobiles. Mais il n’y en a pas en juin. @abracarioca sur twitter, apporta la solution : c’est lié au nombre de samedis dans le mois. Il y a des années ou juin est un mois à 4 samedis, et d’autres ou c’est un mois à 5 samedis.
Dans le graphique ci-dessous, qui représente le nombre de mariages entre mai (mois n°5) et octobre (mois n°10) entre 1975 et 2010, les mois à 5 samedis sont marqués d’un rond rouge.

version PDF plus lisible

Cette représentation graphique me suffit pour conclure qu’@abracarioca avait raison. Pour les mois d’été, compter 5 samedis fait augmenter le nombre de mariages.

Un joli dessin

Voici une analyse en composantes principales réalisées sur les prénoms masculins, en 2000, à partir du fichier des prénoms de l’insee, par départements.

Les nombres rouges sont les codes départementaux (avec 20 pour la Corse).
Il me semble, si je ne fais pas trop d’erreur d’interprétation, qu’on voit apparaître différents groupes. La gauche du graphique représente, à mon avis, des prénoms aujourd’hui peu donnés dans la France entière, mais présents dans certains départements (en Corse, Lisandru, dans le Neuf-Trois Yanis et Mohamed). La droite du graphique associe entre eux des prénoms en vogue.
Le haut du graphique est trusté par les prénoms bretons. Le plus haut, le plus breton.
Et “Loïc”, situé en bas, n’est pas une erreur de casting : c’est aujourd’hui un prénom du croissant Est de la France.
Si vous voulez voir ce dessin en PDF, suivez ce lien : ACP-2000. Mais si vous téléchargez le fichier PDF, j’exige vos commentaires.

Réseaux musicaux

A quoi est dû le succès ? Aux qualités intrinsèques de l’oeuvre ? D’autres caractéristiques ne joueraient-elles pas ?
Cette question ne trouvera pas facilement de réponse : avant tout parce que mes collègues sociologues rechignent à étudier de trop près les goûts populaires. Combien de thèses sur des acteurs comme Bernard Ménez (par comparaison avec Jean Vilar) ? Sur des chanteuses comme Catherine Lara ? Et combien sur le théâtre de boulevard ? Combien de thèses sur la variété populaire utilisant les mêmes outils que ceux que Bourdieu utilisait dans Homo Academicus ? Il y a de bons articles sur la bande-dessinée (Boltanski). Sur le Rap, le Jazz, et d’autres styles aptes à l’élévation distinctive… Mais je n’en connais pas sur la variété, sur les artistes invités par Drucker à la grande époque de Champs Elysées [car il y eu une grande époque…]
C’est probablement parce que la hiérarchie sociale dicte en partie les intérêts sociologiques (on me souffle qu’une thèse est en préparation qui s’intéresse aux carrières de Bourdieu, Derrida et Foucault…) C’est aussi que la popularité de la variété ne se prête pas facilement à l’objectivation. Il n’y a pas d’académie (ni de chanteurs de variété à l’Académie française, à part Giscard). Pas d’intellectuels organiques (sauf Drucker ?). Pas même d’association des artistes de variété (la SACEM a un autre but, je crois). Il est en fait difficile de mesurer la popularité, quoi qu’on en dise. Qui croit sérieusement que les chiffres de vente annoncés reflêtent les ventes réelles ? Et qui a la base de données exhaustive de ces ventes ?

Prenons donc un chemin de traverse.
Le concours de l’Eurovision nous donne accès — via wikipedia — à une base de données. En cherchant un peu, il serait possible de comparer le succès que remporte un “groupe” par rapport à une personne toutes choses égales par ailleurs, de repérer l’effet de la langue ou du sexe, ou encore de l’ancienneté du pays dans le concours.
L’intérêt des données de l’Eurovision, écrivait perfidement Kieran Healy il y a quelques années, c’est l’absence de qualité intrinsèque de toutes les chansons : la popularité n’est donc ici pas “polluée” par la qualité. Il n’y a que de la merde, plus ou moins populaire. [Je mets ABBA de côté, ils jouaient dans une autre ligue.]
Je vais m’intéresser ici à la composition des votes lors de la dernière épreuve, samedi dernier, parce que je ne peux pas tout faire, non plus. Que voit-on ?
Une toile d’araignée, certes, mais que l’algorithme Kamada-Kawai construit d’une certaine manière. Les votes, en fait, rapprochent certains pays et éloignent d’autres pays. La RFA (ou Allemagne, mais j’en suis resté à la Grande Epoque du Mur) est au centre : sa chanteuse a remporté le concours. Les perdants sont sur la frange extérieure : ils n’ont reçu aucun vote, ou presque.

On peut essayer de mettre un peu de sens dans ce graphique. J’ai donc simplifié le précédent, en ne représentant que les votes de “twelve points” et “ten points” (mais les autres votes sont pris en compte dans la construction du réseau). Les rapprochements semblent avoir une base géopolitique :


Les patatoïdes permettent de se rendre compte que l’Eurovision n’est que la continuation de la diplomatie par d’autres moyens [si je pouvais placer une référence aux deux corps du Roi je le ferai ici]. Le bloc russe [je suis gaulliste sur ce point là, l’URSS n’étant que le corps mortel de l’immortelle corps russe], bien que scindé, plissé et morcelé, a des pratiques de votes similaires. Le monde balkanique se recompose dans la variété. L’Europe des démocraties libérales est unitaire (ce qui montre bien, s’il le fallait encore, que ce que raconte Esping-Andersen est un peu fumeux).

Je ne fais ici que reprendre l’analyse proposée il y a déjà six ans par Kieran Healy, qui, malheureusement, avait écrasé ses données en voulant constituer une base de grande ampleur (1975-1999). En effet, des périodes plus courtes sont nécessaires pour saisir les conséquences de l’éclatement de l’URSS (en créant plein de petits pays avec droit de vote).

Précisions : Vous venez de lire un billet ironique. Mais rien n’empêche d’étudier statistiquement l’Eurovision, ses principes de votes, les conditions du succès… Il devrait être possible, à mon avis, d’élaborer ainsi une stratégie gagnante pour la France, qui, souvenez-vous n’a gagné qu’une seule fois. Non les carottes, ne sont pas cuites. Rendez-nous vite, Marie Myriam!

Quelques réseaux d’invitations académiques (suite)

[Suite]
Il y a quelques jours, j’ai présenté le réseau composé par les jurys de maîtrise au département de sociologie de l’université Paris 8 (entre 1968 et 1983). Dans le département apparaissaient deux pôles (qui se sépareront ensuite). L’étude d’un autre département, par Marie-Pierre Pouly (qui vient de soutenir une thèse sous la direction de Stéphane Beaud) donne ce réseau [que M.-P. Pouly représente sous une forme matricielle dans ses travaux, mais que j’ai transformé ici en graphe] :

[La légende et les principes de lecture se trouvent dans le billet précédent : le graphe est construit sur le même principe]
Ce département apparaît plus éclaté que le département de sociologie, dont les membres entretenaient — somme toute — de nombreux liens croisés d’invitations aux jurys de maîtrise. Ici, ce que l’on voit, et que l’étude historique assure, ce sont des stratégies d’évitement, entre un pôle qui aspire à la noblesse de la vraie littérature (anglaise, pas américaine), un pôle de linguistes et un autre plus proche de la civilisation.
Pour en savoir plus sur l’utilisation de la sociologie des réseaux pour l’étude du monde académique, je ne peux que vous renvoyer vers les travaux d’Olivier Godechot.

Quelques réseaux d’invitations académiques

La vie académique est faite de conflits politiques, épistémologiques et statutaires. Elle est aussi faite de collaborations nécessaires. Une étude de ces collaborations pourrait sans doute mettre en évidence la cristallisation des conflits. Prenons Paris 8. Sous la direction de Charles Soulié une histoire de Vincennes est en cours de finalisation. Un étudiant de master, Frédéric Carin, a ainsi relevé la composition des presque 450 maîtrises soutenues entre 1968 et 1984 au département de sociologie.
Après un petit passage sous “R” (avec le package “sna”), on peut obtenir de beaux graphes, objectivant sous une forme synthétique ces invitations croisées. Dans le graphe suivant, les ronds rouges correspondent aux individus (et leur taille au nombre de personnes avec qui ils sont en relation de soutenance). Les traits noirs ou gris correspondent au nombre d’invitations (les traits sont noirs quand les invitations ont été supérieures à 2, la taille des traits est proportionnelle au nombre de soutenances en commun).

Ce graphe fait sens quand on l’associe à une histoire du département de sociologie : l’on y distingue deux pôles de coopération, pôles encore en lien entre 1968 et 1983, et qui s’autonomiseront par la suite. Le pôle nord, autour de Terray-Rey-Lazarus-Benzine-Poulantzas, est celui des anthropologues, qui vont fonder un département d’anthropologie ou quitter Paris 8 (Quiminal partira à Paris 7, Poulantzas se suicidera…). Le pôle sud, avec Castel-Gaudemar-Defert-Dufrancatel-Passeron-Martinon, constitue le pôle “sociologique” (une partie quittera aussi rapidement Paris 8). Il est fort probable que ces pôles correspondent aussi à des options politiques (PC/autre) ou à des “clientèles” différentes.

De Yves à Valérie

Un article du Monde a soulevé mon intérêt. Il y est fait mention du changement de sexe d’un chef d’entreprise devenue cheffe d’entreprise. L’article se termine ainsi :

en attendant son changement d’état civil, elle a voulu, dans un premier temps, que son nouveau prénom puisse chasser l’ancien de ses papiers d’identité. Fin janvier, le tribunal de grande instance de Grenoble a donné droit à ce souhait.

C’est que le prénom est, en France comme dans la quasi-totalité des cultures connues, marqueur du genre.
Mais on sait que ce n’est pas qu’un marqueur du genre. Le prénom marque aussi bien l’appartenance à une classe d’âge. 1947 est l’année où “Yves” est le plus donné [la “Yves” de l’article est née à la fin des années cinquante, à un moment où le prénom était encore populaire, mais en déclin depuis une dizaine d’années].
En changeant de prénom, Yves n’a donc pas fait que manifester un changement de sexe : elle s’est rajeunie d’une vingtaine d’années. Valérie est un prénom “typique” des années 60-70, 1969 étant l’année où il est le plus donné.

Il est peu probable que ce rajeunissement ait été aussi conscient que le changement de sexe. Mais il est intéressant de voir que ce n’est pas un prénom typique des années quarante qui a été choisi (comme “Martine”, “Monique”, “Michelle” ou “Danièle”). Reste à étudier ce lien entre changement de prénom et rajeunissement social sur un échantillon plus grand.

 
Mise à jour : mon échantillon a quadruplé (source : légifrance, jurisprudence judiciaire, recherche sur l’article 60 du code civil)… Il semble bien que l’abandon d’un prénom (ligne fine) pour un nouveau prénom (ligne grasse) aille dans le sens du rajeunissement. Les graphiques suivants (où Marianne est devenue Maya, Gérald est devenue Lauren, et Christian est devenue Mylène) vont dans le même sens : celles et ceux qui changent de prénom prennent un prénom donné à celles et ceux qui pourraient être leurs enfants.

Réseaux musicaux

Les outils de la sociologie des réseaux permettent bien de visualiser, entre autres, les pratiques de citations. On voit apparaître des acteurs centraux, des personnes très citées, des personnes citant beaucoup. J’ai essayé, rapidement, de voir si les citations dans “L’Enquête sur l’évolution littéraire” de Jules Huret (1891) permettait d’objectiver une partie du monde littéraire de l’époque… Mais j’ai travaillé trop rapidement [avec le logiciel R]. Cela ne donne rien de bien joli :

Même une sélection d’un sous-réseau, suivant certains critères, ne donne pas d’image suffisamment synthétique pour être immédiatement explicative.

Si, donc, un-e étudiant-e s’intéressant à la socio-histoire de la culture, au monde littéraire de la fin du XIXe siècle… voulait faire un mémoire de master… je l’accueillerai avec plaisir ! et l’encadrerai (sans grande compétence) avec joie.
Car la sociologie des réseaux appliquée aux disciplines inspirées donne des choses intéressantes :

Deux articles récents se penchent sur la place des réseaux dans la constitution d’un “monde social” ou d’une “scène musicale”.
Karim Hammou s’intéresse aux invitations dans les chansons de rap, le featuring, dans un article intitulé “Des raps en français au « rap français ». Une analyse structurale de l’émergence d’un monde social professionnel” (Histoire et mesure, 2009, vol.24, n°1).
L’article m’a intéressé pour trois raisons :
Je n’ai pas lu énormément de sociologie des réseaux, mais j’ai apprécié la multiplicité des illustrations : quoi qu’en disent certains des auteurs que j’ai lus, les sociogrammes sont très utiles pour la démonstration. Visualiser des acteurs centraux et d’autres plus marginaux se fait plus facilement avec un petit dessin, surtout quand ce qui importe n’est pas l’établissement de théorèmes d’analyse structurale, mais l’usage des outils de la sociologie des réseaux pour la compréhension des données.
featuring-hammou

J’ai aussi apprécié l’aspect diachronique : les liens ne sont pas pérennes et s’élaborent dans le temps. L’article de K. Hammou montre que les liens se font et se défont, que des acteurs qui apparaissent centraux à un moment (comme MCSolaar) prennent de la distance ensuite.
Et, dernier point apprécié aussi, l’étude porte sur le rap (et pas sur la musique classique, le jazz ou un autre style plus légitime).

Un autre article, écrit par un sociologue britannique, Nick Crossley, a pour titre “The man whose web expanded: Network dynamics in Manchester’s post/punk music scene 1976–1980” (Poetics, Volume 37, Issue 1, Pages 24-49). La problématique est très proche de celle de K. Hammou, mais il me semble que ses sources, ses données, son matériau empirique… est moins solide (Crossley s’appuie sur des sources secondaires, des sites de fans, des biographies…).
crossley-punk

It is widely acknowledged that the Manchester scene took off in the late 70s, and it is my contention that this ‘take off ’ consisted in the formation of a network between a ‘critical mass’ of key actors who, collectively, began to make things happen in the city.

Dans un article que je n’ai pas pu lire [Pretty connected: the social network of the early UK Punk Movement, Theory, Culture and Society 25 (6) (2008), pp. 89–116.] Crossley semble faire la même chose avec la scène punk londonienne.