Categories

Archives

Réseaux “aléatoires”, suite

J’ai essayé de comprendre un peu plus précisément les résultats du billet précédent.
Partons d’un réseau bimodal représenté, ci-dessous, sous la forme d’une matrice puis d’un graphe :

La Matrice

x1 x2 x3 x4 x5 x6 x7 x8
a 1 1 0 0 0 0 0 0
b 1 1 0 0 0 0 0 0
c 0 1 1 1 0 0 0 0
d 1 1 0 0 0 0 0 0
e 0 0 0 0 1 0 0 0
f 0 0 0 0 1 1 0 0
g 0 0 0 0 1 0 0 0
h 0 0 0 0 0 0 1 1
i 0 0 0 0 0 0 1 1

Le Graphe


On peut comprendre ce réseau comme une description d’événements (X1 à X8) auxquels participent (ou non), les personnes “a”… “i”.
Ce réseau est un peu spécifique : Le premier et le deuxième “événement” (X1 et X2) réunissent les mêmes personnes (a, b et d), la personne “c” participant au 2e événement seulement. J’observe, dans les invitations de pasteurs repérées sur les affiches pentecôtistes, le même genre de “réinvitations”.
Ce qui m’intéressait était de comparer ce réseau avec des réseaux qui auraient une structure similaire. Par “structure similaire”, j’entends “les marges des matrices sont les mêmes” : l’événement X a n participants dans le réseau de départ et dans le réseau auquel on le compare.
Un problème similaire s’est posé en “écologie quantitative” (ou écologie des communautés) : on peut imaginer que la matrice, plutôt que de représenter un réseau, représente une “communauté” (en colonne, les espèces — présentes ou non –, et en ligne, des lieux échantillonés). On en trouve, par exemple, un usage dans cet article
Partitioning of functional diversity reveals the scale and extent of trait convergence and divergence ou dans cet autre article Using biodiversity deconstruction to disentangle assembly… :

We generated 1000 random matrices by a quasi swap algorithm (Miklós & Podani, 2004) using the function ‘commsimulator’ in vegan for R (Oksanen et al., 2007). The null matrices were subsequently uploaded into a custom-coded (…)

Ce problème, sous des formes plus proches des miennes, s’est aussi posé à des sociologues travaillant sur des réseaux sociaux. Jean Finez, travaillant sur la co-participation aux comités d’administration (les liens interlocks), a tenté d’en comprendre la logique en les comparant à des réseaux aléatoires de même structure Solidarités patronales et formation des interlocks [halshs] :

nous comparons le réseau des interlocks à des réseaux générés aléatoirement de manière à mettre en évidence ses spécificités et à ne pas mésinterpréter des propriétés qui relèvent en fait des contraintes juridiques et organisationnelles. Nous avons généré 50 réseaux aléatoires bimodaux, construits de manière à posséder de nombreuses caractéristiques identiques à celles du réseau interlock. […]
Dans chaque réseau aléatoire bimodal, les conseils d’administration sont choisis par les individus par un tirage dans une loi uniforme. En outre, les réseaux ont été construits de manière à partager de nombreuses caractéristiques avec le réseau interlock de l’élite de premier ordre. Premièrement, comme dans le réseau réel, chaque réseau aléatoire est composé de 27 sommets « dirigeants » et de 40 sommets « entreprises » reliés par 91 liens dirigeants-entreprises. Deuxièmement, chaque dirigeant est présent dans 3 à 5 conseils d’administration et chacune des 40 entreprises ne peut accueillir plus de 18 dirigeants.

J’ai donc utilisé, dans le package “vegan”, l’instruction commsimulator (méthode “quasi swap”), qui génère une matrice aléatoire respectant les marges de la matrice de départ.

Souvent, l’instruction va donner quelque chose de ce genre : Il n’y a plus que 2 composantes (par rapport au réseau de départ, il y a moins de “ré-invitations”.)
Si l’on génère 10 000 réseaux, l’histogramme du nombre de composantes est celui-ci :

A quelques 500 reprises, des réseaux à 3 composantes apparaissent. Et, surprise, à 3 reprises, des réseaux à 4 composantes (très rares, donc, dans cette configuration).
Voici ce réseau à 4 composantes respectant les contraintes de départ :

Dans cet exemple, les “ré-invitations” sont maximales.

Des réseaux religieux d’invitations

Les données recueillies à partir d’une collection de 150 affiches d’églises africaines sont très riches. J’ai déjà montré ici qu’on pouvait y déceler des indications d’implantation géographique, ou une “politique du titre” qui manifeste l’existence d’une hiérarchisation poussée.
Ces affiches donnent aussi des informations “réticulaires” : les pasteurs pentecôtistes passant une partie de leur temps à s’inviter les uns les autres, à pratiquer le “partage de la chaire”, un réseau apparaît. Voici une représentation graphique de ce réseau d’invitations. Vous remarquerez, en plissant les yeux, une grosse composante et de nombreuses petits groupes. Le nombre de composantes est de 60.
La question que je me pose est : mais comment donc un tel réseau est généré ? Est-ce qu’il peut être simplement déduit de certaines contraintes ?
Pour commencer à apporter une réponse, j’ai demandé à R de générer des réseaux aléatoires qui respectent 2 contraintes.

  • 1/ si dans le réseau observé l’individu (i) participe à (n) événements, il en va de même dans le réseau généré
  • 2/ si dans le réseau observé l’événement (j) a réuni (m) personnes, il en va de même dans le réseau généré

Les réseaux générés “aléatoirement et sous contraintes” ont une particularité : leur nombre moyen de composantes n’est pas proche de 60, il est proche de 41. Les réseaux “aléatoires” relient beaucoup plus les individus (alors que chaque individu participe au même nombre d’événements et que chaque événement réuni le même nombre de personnes, par comparaison avec le réseau observé).
Mes pasteurs pentecôtistes noirs, donc, semblent ne pas “inviter au hasard”, mais choisir une “distance” moindre que les “pasteurs aléatoires”. De ce fait, ils créent un monde un peu plus “troué” que celui du modèle.
Note : Je ne sais pas si je dois vraiment mettre cela en ligne. En effet, je ne maîtrise pas totalement ce dont je parle et j’ai peut-être fait n’importe quoi… J’expose donc maintenant la méthode utilisée. Je démarre d’une matrice d’adjacence, nommée “mat”, qui indique “qui participe à quoi” :
E1 E2 E3 E4
P1 1 0 1 0
P2 1 1 0 0
P3 0 1 0 1
P4 0 0 0 1
P5 0 0 0 1
P6 1 1 1 0

Dans laquelle E1 est l’événement n°1, P1 la personne n°1 (qui ici, participe à E1 et E3).
Dans le logiciel R, le package “vegan” dispose d’une commande :
b< -commsimulator(mat, method="quasiswap")

Methods quasiswap and backtracking are not sequential, but each call produces a matrix that is independent of previous matrices, and has the same marginal totals as the original data.

Cette commande permet de générer des matrices qui ont les mêmes marges que les matrices de départ (ce qui fait que chaque événement aura le même nombre de participants et chaque personne participera au même nombre d'événements).

Suites : Voici un synthèse du nombre de composantes après avoir généré 1000 réseaux aléatoires :

La probabilité de tomber sur un réseau à 60 composantes (avec les contraintes de départ) est donc bien faible.

Politique sociologique

L’on trouve en ligne la composition du nouveau comité de rédaction de la Revue française de sociologie. J’y repère l’entrée de mon collègue de Paris 8 Camille Peugny (et futur camarade de bureau, quand les travaux seront réalisés rue Pouchet) et de mon condisciple de l’ENS Olivier Godechot.
Ce comité est maintenant composé de 8 femmes sur 25 membres : la tierité est atteinte, la parité est pour bientôt. Je suis trop paresseux pour repérer les autres caractéristiques (“provinciaux” / “parisiens” ; “rang A” / “rang B” ; “CNRS” / “Université”) ni même pour comparer l’ancien et le nouveau comité.

En revanche, je me suis amusé à repérer quels laboratoires étaient dans quelles revues :

Il y a des labos centraux et d’autres moins… Mais il me faudrait d’autres données, sur d’autres revues.

Mise à jour : un beau PDF avec 13 revues (RFS, ARSS, politix, sociétés contemporaines, sociologie, socio du travail, travail genre société, cahiers du genre, regards sociologiques, revue fra de socio-éco, genèses et l’année sociologique) : reseau des revues

Réseaux musicaux

A quoi est dû le succès ? Aux qualités intrinsèques de l’oeuvre ? D’autres caractéristiques ne joueraient-elles pas ?
Cette question ne trouvera pas facilement de réponse : avant tout parce que mes collègues sociologues rechignent à étudier de trop près les goûts populaires. Combien de thèses sur des acteurs comme Bernard Ménez (par comparaison avec Jean Vilar) ? Sur des chanteuses comme Catherine Lara ? Et combien sur le théâtre de boulevard ? Combien de thèses sur la variété populaire utilisant les mêmes outils que ceux que Bourdieu utilisait dans Homo Academicus ? Il y a de bons articles sur la bande-dessinée (Boltanski). Sur le Rap, le Jazz, et d’autres styles aptes à l’élévation distinctive… Mais je n’en connais pas sur la variété, sur les artistes invités par Drucker à la grande époque de Champs Elysées [car il y eu une grande époque…]
C’est probablement parce que la hiérarchie sociale dicte en partie les intérêts sociologiques (on me souffle qu’une thèse est en préparation qui s’intéresse aux carrières de Bourdieu, Derrida et Foucault…) C’est aussi que la popularité de la variété ne se prête pas facilement à l’objectivation. Il n’y a pas d’académie (ni de chanteurs de variété à l’Académie française, à part Giscard). Pas d’intellectuels organiques (sauf Drucker ?). Pas même d’association des artistes de variété (la SACEM a un autre but, je crois). Il est en fait difficile de mesurer la popularité, quoi qu’on en dise. Qui croit sérieusement que les chiffres de vente annoncés reflêtent les ventes réelles ? Et qui a la base de données exhaustive de ces ventes ?

Prenons donc un chemin de traverse.
Le concours de l’Eurovision nous donne accès — via wikipedia — à une base de données. En cherchant un peu, il serait possible de comparer le succès que remporte un “groupe” par rapport à une personne toutes choses égales par ailleurs, de repérer l’effet de la langue ou du sexe, ou encore de l’ancienneté du pays dans le concours.
L’intérêt des données de l’Eurovision, écrivait perfidement Kieran Healy il y a quelques années, c’est l’absence de qualité intrinsèque de toutes les chansons : la popularité n’est donc ici pas “polluée” par la qualité. Il n’y a que de la merde, plus ou moins populaire. [Je mets ABBA de côté, ils jouaient dans une autre ligue.]
Je vais m’intéresser ici à la composition des votes lors de la dernière épreuve, samedi dernier, parce que je ne peux pas tout faire, non plus. Que voit-on ?
Une toile d’araignée, certes, mais que l’algorithme Kamada-Kawai construit d’une certaine manière. Les votes, en fait, rapprochent certains pays et éloignent d’autres pays. La RFA (ou Allemagne, mais j’en suis resté à la Grande Epoque du Mur) est au centre : sa chanteuse a remporté le concours. Les perdants sont sur la frange extérieure : ils n’ont reçu aucun vote, ou presque.

On peut essayer de mettre un peu de sens dans ce graphique. J’ai donc simplifié le précédent, en ne représentant que les votes de “twelve points” et “ten points” (mais les autres votes sont pris en compte dans la construction du réseau). Les rapprochements semblent avoir une base géopolitique :


Les patatoïdes permettent de se rendre compte que l’Eurovision n’est que la continuation de la diplomatie par d’autres moyens [si je pouvais placer une référence aux deux corps du Roi je le ferai ici]. Le bloc russe [je suis gaulliste sur ce point là, l’URSS n’étant que le corps mortel de l’immortelle corps russe], bien que scindé, plissé et morcelé, a des pratiques de votes similaires. Le monde balkanique se recompose dans la variété. L’Europe des démocraties libérales est unitaire (ce qui montre bien, s’il le fallait encore, que ce que raconte Esping-Andersen est un peu fumeux).

Je ne fais ici que reprendre l’analyse proposée il y a déjà six ans par Kieran Healy, qui, malheureusement, avait écrasé ses données en voulant constituer une base de grande ampleur (1975-1999). En effet, des périodes plus courtes sont nécessaires pour saisir les conséquences de l’éclatement de l’URSS (en créant plein de petits pays avec droit de vote).

Précisions : Vous venez de lire un billet ironique. Mais rien n’empêche d’étudier statistiquement l’Eurovision, ses principes de votes, les conditions du succès… Il devrait être possible, à mon avis, d’élaborer ainsi une stratégie gagnante pour la France, qui, souvenez-vous n’a gagné qu’une seule fois. Non les carottes, ne sont pas cuites. Rendez-nous vite, Marie Myriam!

Quelques réseaux d’invitations académiques (suite)

[Suite]
Il y a quelques jours, j’ai présenté le réseau composé par les jurys de maîtrise au département de sociologie de l’université Paris 8 (entre 1968 et 1983). Dans le département apparaissaient deux pôles (qui se sépareront ensuite). L’étude d’un autre département, par Marie-Pierre Pouly (qui vient de soutenir une thèse sous la direction de Stéphane Beaud) donne ce réseau [que M.-P. Pouly représente sous une forme matricielle dans ses travaux, mais que j’ai transformé ici en graphe] :

[La légende et les principes de lecture se trouvent dans le billet précédent : le graphe est construit sur le même principe]
Ce département apparaît plus éclaté que le département de sociologie, dont les membres entretenaient — somme toute — de nombreux liens croisés d’invitations aux jurys de maîtrise. Ici, ce que l’on voit, et que l’étude historique assure, ce sont des stratégies d’évitement, entre un pôle qui aspire à la noblesse de la vraie littérature (anglaise, pas américaine), un pôle de linguistes et un autre plus proche de la civilisation.
Pour en savoir plus sur l’utilisation de la sociologie des réseaux pour l’étude du monde académique, je ne peux que vous renvoyer vers les travaux d’Olivier Godechot.

Quelques réseaux d’invitations académiques

La vie académique est faite de conflits politiques, épistémologiques et statutaires. Elle est aussi faite de collaborations nécessaires. Une étude de ces collaborations pourrait sans doute mettre en évidence la cristallisation des conflits. Prenons Paris 8. Sous la direction de Charles Soulié une histoire de Vincennes est en cours de finalisation. Un étudiant de master, Frédéric Carin, a ainsi relevé la composition des presque 450 maîtrises soutenues entre 1968 et 1984 au département de sociologie.
Après un petit passage sous “R” (avec le package “sna”), on peut obtenir de beaux graphes, objectivant sous une forme synthétique ces invitations croisées. Dans le graphe suivant, les ronds rouges correspondent aux individus (et leur taille au nombre de personnes avec qui ils sont en relation de soutenance). Les traits noirs ou gris correspondent au nombre d’invitations (les traits sont noirs quand les invitations ont été supérieures à 2, la taille des traits est proportionnelle au nombre de soutenances en commun).

Ce graphe fait sens quand on l’associe à une histoire du département de sociologie : l’on y distingue deux pôles de coopération, pôles encore en lien entre 1968 et 1983, et qui s’autonomiseront par la suite. Le pôle nord, autour de Terray-Rey-Lazarus-Benzine-Poulantzas, est celui des anthropologues, qui vont fonder un département d’anthropologie ou quitter Paris 8 (Quiminal partira à Paris 7, Poulantzas se suicidera…). Le pôle sud, avec Castel-Gaudemar-Defert-Dufrancatel-Passeron-Martinon, constitue le pôle “sociologique” (une partie quittera aussi rapidement Paris 8). Il est fort probable que ces pôles correspondent aussi à des options politiques (PC/autre) ou à des “clientèles” différentes.

Réseaux musicaux

Les outils de la sociologie des réseaux permettent bien de visualiser, entre autres, les pratiques de citations. On voit apparaître des acteurs centraux, des personnes très citées, des personnes citant beaucoup. J’ai essayé, rapidement, de voir si les citations dans “L’Enquête sur l’évolution littéraire” de Jules Huret (1891) permettait d’objectiver une partie du monde littéraire de l’époque… Mais j’ai travaillé trop rapidement [avec le logiciel R]. Cela ne donne rien de bien joli :

Même une sélection d’un sous-réseau, suivant certains critères, ne donne pas d’image suffisamment synthétique pour être immédiatement explicative.

Si, donc, un-e étudiant-e s’intéressant à la socio-histoire de la culture, au monde littéraire de la fin du XIXe siècle… voulait faire un mémoire de master… je l’accueillerai avec plaisir ! et l’encadrerai (sans grande compétence) avec joie.
Car la sociologie des réseaux appliquée aux disciplines inspirées donne des choses intéressantes :

Deux articles récents se penchent sur la place des réseaux dans la constitution d’un “monde social” ou d’une “scène musicale”.
Karim Hammou s’intéresse aux invitations dans les chansons de rap, le featuring, dans un article intitulé “Des raps en français au « rap français ». Une analyse structurale de l’émergence d’un monde social professionnel” (Histoire et mesure, 2009, vol.24, n°1).
L’article m’a intéressé pour trois raisons :
Je n’ai pas lu énormément de sociologie des réseaux, mais j’ai apprécié la multiplicité des illustrations : quoi qu’en disent certains des auteurs que j’ai lus, les sociogrammes sont très utiles pour la démonstration. Visualiser des acteurs centraux et d’autres plus marginaux se fait plus facilement avec un petit dessin, surtout quand ce qui importe n’est pas l’établissement de théorèmes d’analyse structurale, mais l’usage des outils de la sociologie des réseaux pour la compréhension des données.
featuring-hammou

J’ai aussi apprécié l’aspect diachronique : les liens ne sont pas pérennes et s’élaborent dans le temps. L’article de K. Hammou montre que les liens se font et se défont, que des acteurs qui apparaissent centraux à un moment (comme MCSolaar) prennent de la distance ensuite.
Et, dernier point apprécié aussi, l’étude porte sur le rap (et pas sur la musique classique, le jazz ou un autre style plus légitime).

Un autre article, écrit par un sociologue britannique, Nick Crossley, a pour titre “The man whose web expanded: Network dynamics in Manchester’s post/punk music scene 1976–1980” (Poetics, Volume 37, Issue 1, Pages 24-49). La problématique est très proche de celle de K. Hammou, mais il me semble que ses sources, ses données, son matériau empirique… est moins solide (Crossley s’appuie sur des sources secondaires, des sites de fans, des biographies…).
crossley-punk

It is widely acknowledged that the Manchester scene took off in the late 70s, and it is my contention that this ‘take off ’ consisted in the formation of a network between a ‘critical mass’ of key actors who, collectively, began to make things happen in the city.

Dans un article que je n’ai pas pu lire [Pretty connected: the social network of the early UK Punk Movement, Theory, Culture and Society 25 (6) (2008), pp. 89–116.] Crossley semble faire la même chose avec la scène punk londonienne.

Les réseaux du CAC 40

Comment s’organise le capitalisme français ? Si l’on prend la composition des conseils d’administration des entreprises du CAC 40, trouverait-on… trouverait-on quoi ?
Comme je n’ai pas trouvé facilement de belle image sur internet, j’ai cherché la composition de ces conseils, je suis tombé sur des données datant de 2005 [Mise à jour : les données proviennent de l’Opesc, j’aurais du l’écrire tout de suite. Voir aussi la mise à jour en bas], et après nettoyage, mon vaillant R (et son mignon, le “package sna”) ont fait le reste. Voici ce que cela donne.
Chaque rond rouge est une personne (Bébéar, Fourtou…) et chaque losange bleu une compagnie du CAC 40 (Axa, Accor…). Un trait noir qui relie un point rouge à un losange bleu signifie que le point rouge est membre du CA (ou du CS) de cette compagnie.
C’est un petit monde…
cac40
téléchargez le graphe au format PDF

Un petit zoom :
cac40zoom
Si quelqu’un me trouve des données plus récentes, 2008 ou 2009, ça m’intéresse [j’ai bien peur d’avoir attrapé la grippe réticulaire et de vouloir tout transformer en réseau].
Note : Je n’ai pas eu le temps de faire les recherches bibliographiques, mais je sais que l’étude des liens croisés qui unissent les boards sont assez nombreuses. N’hésitez pas à les indiquer en commentaire…

Mise à jour : En visitant le site de l’Opesc je découvre aujourd’hui qu’un grand nombre de graphiques sont disponibles, dont le réseau des patrons en 2007. [Lors de ma précédente visite, je n’avais consulté que les annuaires.]

Mon premier réseau

Il y a un peu plus d’un an, j’ai commencé à prendre en photo et à collectionner les affiches que les églises “africaines” utilisent pour leurs “Grandes Croisades d’Evangélisation”. J’en avais parlé rapidement ici : “Grandes Croisades à Paris” (billet de septembre 2008).
J’ai maintenant presque 70 affiches en provenance d’une cinquantaine d’églises, qui donnent des informations sur environ 150 individus. Petit à petit, j’ai cru remarquer que certaines personnes “revenaient”, et que sous la collection d’affiches se cachait peut-être un réseau. Grâce à R (le logiciel “open-source” d’analyse statistique et au “package sna”, on peut faire une analyse de réseau rapide (et sans doute aussi une analyse fouillée, mais je ne l’ai pas encore faite).
reseau eglises
Dans le schéma ci-dessus on voit apparaître, en effet, quelques petits réseaux, mais surtout des pasteurs dispersés. Je n’en dirai pas plus ici, en tout cas pas maintenant.