Des réseaux religieux d’invitations
Les données recueillies à partir d’une collection de 150 affiches d’églises africaines sont très riches. J’ai déjà montré ici qu’on pouvait y déceler des indications d’implantation géographique, ou une “politique du titre” qui manifeste l’existence d’une hiérarchisation poussée.
Ces affiches donnent aussi des informations “réticulaires” : les pasteurs pentecôtistes passant une partie de leur temps à s’inviter les uns les autres, à pratiquer le “partage de la chaire”, un réseau apparaît. Voici une représentation graphique de ce réseau d’invitations. Vous remarquerez, en plissant les yeux, une grosse composante et de nombreuses petits groupes. Le nombre de composantes est de 60.
La question que je me pose est : mais comment donc un tel réseau est généré ? Est-ce qu’il peut être simplement déduit de certaines contraintes ?
Pour commencer à apporter une réponse, j’ai demandé à R de générer des réseaux aléatoires qui respectent 2 contraintes.
- 1/ si dans le réseau observé l’individu (i) participe à (n) événements, il en va de même dans le réseau généré
- 2/ si dans le réseau observé l’événement (j) a réuni (m) personnes, il en va de même dans le réseau généré
Les réseaux générés “aléatoirement et sous contraintes” ont une particularité : leur nombre moyen de composantes n’est pas proche de 60, il est proche de 41. Les réseaux “aléatoires” relient beaucoup plus les individus (alors que chaque individu participe au même nombre d’événements et que chaque événement réuni le même nombre de personnes, par comparaison avec le réseau observé).
Mes pasteurs pentecôtistes noirs, donc, semblent ne pas “inviter au hasard”, mais choisir une “distance” moindre que les “pasteurs aléatoires”. De ce fait, ils créent un monde un peu plus “troué” que celui du modèle.
Note : Je ne sais pas si je dois vraiment mettre cela en ligne. En effet, je ne maîtrise pas totalement ce dont je parle et j’ai peut-être fait n’importe quoi… J’expose donc maintenant la méthode utilisée. Je démarre d’une matrice d’adjacence, nommée “mat”, qui indique “qui participe à quoi” :
E1 E2 E3 E4
P1 1 0 1 0
P2 1 1 0 0
P3 0 1 0 1
P4 0 0 0 1
P5 0 0 0 1
P6 1 1 1 0
Dans laquelle E1 est l’événement n°1, P1 la personne n°1 (qui ici, participe à E1 et E3).
Dans le logiciel R, le package “vegan” dispose d’une commande :
b< -commsimulator(mat, method="quasiswap")
Methods quasiswap and backtracking are not sequential, but each call produces a matrix that is independent of previous matrices, and has the same marginal totals as the original data.
Cette commande permet de générer des matrices qui ont les mêmes marges que les matrices de départ (ce qui fait que chaque événement aura le même nombre de participants et chaque personne participera au même nombre d'événements).
Suites : Voici un synthèse du nombre de composantes après avoir généré 1000 réseaux aléatoires :
La probabilité de tomber sur un réseau à 60 composantes (avec les contraintes de départ) est donc bien faible.
11 commentaires
Un commentaire par J.Finez (11/02/2011 à 14:20)
Très intéressant ! J’ai essayé le même genre de travail, mais sur les réseaux des dirigeants du CAC 40. Mes réseaux aléatoires répondaient à d’autres contraintes, bien sûr…
J’avais fait le travail sur seulement 50 réseaux aléatoires pour des raisons pratiques ( ayant des soucis avec R, les réseaux ont été générés à l’aide d’un programme rédigé en C++ et les résultats calculés sur le logiciel Pajek).
De belles perspectives en analyse de réseaux, me semble-t-il…
Un commentaire par Baptiste Coulmont (11/02/2011 à 14:21)
Merci ! Même en générant 10 000 réseaux, aucun d’entre eux n’arrive à 60 composantes. Le monde social est décidément non aléatoire.
Un commentaire par Claire Lemercier (11/02/2011 à 17:01)
Oui, ça semble juste et efficace comme traitement… même si je suis loin de maîtriser le truc des réseaux aléatoires, il me semble que souvent, c’est compliqué à fabriquer parce qu’on veut qu’ils aient la même densité (par ex) que ceux observés. Comme ce n’est pas ton cas ici je ne vois pas de pb dans la procédure utilisée et le résultat en termes de densité est particulièrement parlant.
Un commentaire par J. FINEZ (11/02/2011 à 19:34)
Votre travail suggère peut-être d’aller plus loin encore. Allez ! Moi aussi je me lance au risque de dire des bêtises…
On observe ici une différence entre le réseau réel et les réseaux aléatoires. C’est bien ! Ca signifie que la structure du réseau réel ne s’explique pas uniquement par un quelconque effet de construction : il y a bien “du social” dans notre réseau (sans blague?). Mais doit-on en rester là ? Est-ce qu’essayer de construire des réseaux aléatoires qui ressemblent davantage au réseau réel, en introduisant de nouvelles contraintes, n’est pas un bon objectif ? Par exemple, vous supposez que vos pasteurs choisissent des pasteurs moins éloignés que si c’était fait de manière aléatoire. On pourrait émettre des hypothèses qui prennent en compte des caractéristiques sociales, géographiques, etc. des pasteurs. L’idée serait alors de voir si, de proche en proche, on ne peut pas se rapprocher de la réalité et… valider ses hypothèses ? Je pense que la modélisation multi-agents permet ce genre de choses.
Qu’en pensez-vous ?
Un commentaire par Baptiste Coulmont (11/02/2011 à 20:17)
Je pense qu’il y a une préférence pour ré-inviter quelqu’un qu’on a déjà invité auparavant (ce qui limite les liens vers l’extérieur).
Un commentaire par Pierre (15/02/2011 à 12:14)
Ta façon de procéder ne me semble pas du tout absurde, elle ressemble beaucoup à ce qui peut se faire à partir de la simulation multi-agents appliquée aux réseaux sociaux, comme dans ce très récent travail d’Antonio Casilli et Paola Tubaro : “Légitimation intersubjective de la présence en ligne et formation de réseaux sociaux. Une approche ethno-computationnelle” (Journées d’étude du réseau thématique « Réseaux sociaux » de l’Association Française de Sociologie, Toulouse, 16-17 mars 2010). C4est disponible en ligne ici : http://www.bodyspacesociety.eu/wp-content/uploads/2010/03/CasilliTubaro_Article_RT26.pdf.
J’ajouterais, pour prolonger le message de J. Finez, que tu peux avancer aussi un peu dans la caractérisation des différences entre réseau aléatoire et réseau observé, en recourant à des techniques assez simples comme le “triad census”, qui consiste à compter, dans un réseau de relations, la proportion de triades correspondant à chacun des 16 types de triades possibles (suivant la présence
ou l’absence des 6 relations possibles entre trois individus), puis à comparer la distribution ainsi obtenue avec la distribution « espérée » qui aurait résulté d’une distribution aléatoire du même nombre de relations : les « déviations » entre la distribution observée et la distribution attendue fournissent une description synthétique des propriétés structurales générales d’un réseau. Sur le triad census, tu peux voir HOLLAND P. W. et LEINHARDT S. [1970], « A Method for Detecting Structure in Sociometric Data », American Journal of Sociology, vol. 76, nº 3, p. 492-513.
Un commentaire par Baptiste Coulmont (15/02/2011 à 12:18)
Merci !
Plusieurs personnes me demandent de faire du “triad census”… je vais donc en faire !
Un commentaire par J.Finez (15/02/2011 à 14:21)
Pour faire du triadic census, il faut des liens orientés, non ?
Un commentaire par Frédéric (15/02/2011 à 23:42)
C’est assez fascinant. Si je comprends bien (je ne connais rien à ses méthodes), tu compares les réseaux sociaux existants avec d’autres réseaux générés par des modèles, en changeant les “contraintes”. Dans quelle mesure ces modèles exploratoires expliquent les réseaux qu’on observe dans les faits? Pour ma part, à titre d’hypothèse, je me demande si les pasteurs qui invitent et sont invités ne font pas en sorte de ne pas dépasser un seuil de pasteurs invités/invitants, de manière à ne pas trop se disperser. Est-ce que trop de pasteurs visiteurs ne risquent pas d’amoindrir la personnalité du pasteur qui invite? Ensuite, penses-tu qu’il est possible d’établir une hiérarchie des pasteurs, du plus invité au moins invité. Tu leur as parlé en ces termes aux anthropologues à Bruxelles ? Amitiés
Un commentaire par Baptiste Coulmont (16/02/2011 à 9:54)
> Frédéric : la hiérarchie : pas avec les données dont je dispose.
Les pratiques d’invitations ne consistent pas seulement à “inviter au plus loin” (à créer des liens nouveaux), mais aussi à “ré-inviter au plus proche” (à renforcer des liens qui existent déjà, par des invitations précédentes). Il y a beaucoup de “ré-invitations” finalement.
Un commentaire par Dis moi avec qui tu interagis… | Scenopoésie et Facteur d'impact (24/08/2011 à 18:46)
[…] Pour conclure, avec une approche assez astucieuse (et très simple à programmer!), on peut gagner un temps assez important dans notre analyse des réseaux d’interaction, qu’ils soit écologiques ou sociaux! […]