Un classement ? Non, sire, un espace !
La semaine dernière, j’ai proposé de jouer à classer entre eux les départements de sociologie. Le jeu consistait à choisir entre des paires de départements (Paris 8 contre Perpignan; Paris 4 contre Paris 7…).
Deux cents personnes ont fourni plus de 5600 votes, et 2000 “non-votes”. J’ai commencé à analyser les données de ces votes. Les contraintes du jeu lui-même orientent fortement ce qu’il est possible de faire à partir des données.
Commençons par regarder les “non-votes”. Les votants avaient la possibilité de signaler qu’entre deux universités, ils ne pouvaient pas choisir car ils n’avaient pas assez d’informations sur ces universités, ou parce que ces deux universités étaient semblablement les mêmes.
Le graphe suivant considère que deux universités (mais il faudrait dire “deux départements de socio”) ont un “lien” entre elles quand des votants ont déclaré que ce sont “les mêmes” :
Si vous cliquez, vous verrez mieux [pdf]
Les universités sont représentées par un point, et la taille du point dépend du nombre de réponses “ce sont les mêmes”. Comme on le voit, certaines universités/départements (Montpellier3, repère postmoderne; l’IEP de Paris; Paris9-Dauphine) apparaissent suffisamment distinctement pour ne pas être jugé “comme les autres”. Les universités “centrales” dans ce graphe (Amiens/Besançon/Metz) sont celles qui apparaissent souvent difficiles à distinguer. Mais Amiens, par exemple, apparaît très peu dans les réponses “je ne connais pas” (ce sont Chambéry et Saint-Etienne qui sont dans cette situation).
Enfin, j’ai réalisé une Analyse en composantes principales, en prenant en compte, pour chaque votant et chaque université, la proportion de votes “gagnants” : si V(i) [le votant n°i] a voté 3 fois pour le département de socio de l’université j, U(j), et une fois contre, alors P(i/j) est de 75%.
C’est illisible : cliquez pour ouvrir un PDF
Dans ce graphique, les universités en rouge sont celles pour lesquelles les votants mettent beaucoup de temps avant de les déclarer préférables à d’autres.
Le premier axe oppose les universités/départements sur une échelle Province/Paris, qui est peut-être corrélée à une échelle de prestige : mais cela est peut-être directement lié aux contraintes du jeu lui-même. Le deuxième axe apparaît plus intéressant, en opposant entre elles des universités/départements sur ce qui m’apparaît être un principe de vision et de division “politique” (sur le principe générateur gauche/droite, où Paris8 s’oppose à l’IEP).
Si le jeu conduisait à l’établissement d’un “ranking” automatique, l’analyse rapide des données recueillies auprès de collègues (200 votants, 5600 votes et 2000 non-votes) montre la diversité des principes de division, qui pointent même quand l’on cherche uniquement à recueillir “l’évaluation sociale des formations”. C’est peut-être ce qui explique l’échec de la diffusion, en France, des tentatives de création d’échelles de prestige [Chambaz, Maurin, Torelli. L’évaluation sociale des professions en France. Construction et analyse d’une échelle des professions. Revue française de sociologie. 1998, 39-1. pp. 177-226. doi : 10.2307/3322788]. Sous l’échelle unidimensionnel, c’est l’espace multidimensionnel qui pointe.
3 commentaires
Un commentaire par Kart (23/03/2013 à 15:44)
En même temps, ton deuxième axe (que tu interprètes comme l’axe gauche/droite) n’explique que 4% de la dispersion… Dès lors, ta conclusion (“sous l’échelle unidimensionnel[le], c’est l’espace multidimensionnel qui pointe”) paraît extrapolée. C’est surtout l’absence d’échelle, qu’elle soit uni ou multi dimensionnelle, qui paraît évident avec les éléments que tu nous offres. Tes données ne permettent pas de trancher entre le prestige, la concordance disciplinaire, la couleur politique et la proximité géographique. Il faudrait des caractéristiques des votants (discipline fine, indicateurs des préférences politiques, etc.) pour analyser plus en profondeur ce jeu de données.
Mais belle initiative : c’est toujours plus intéressant qu’une échelle de notes.
Un commentaire par Baptiste Coulmont (23/03/2013 à 15:50)
> Kart : J’ai bien conscience des limites (ou des Limites, avec un L majuscule) de cette méthode de recueil de données, sans info précise sur les votants. Et conscience aussi de la faiblesse du 2e axe de l’ACP… Mais cela suffisait pour un billet de blog, un premier “débroussaillage” des données. Il est possible d’installer le jeu sur un serveur et donc de modifier les réglages (pour demander des informations sur les votants). Je le ferai peut-être un jour.
Un commentaire par Sociology Department Rankings for 2013 | orgtheory.net (25/03/2013 à 17:58)
[…] by people who thought the very idea of such a ranking was morally offensive—and presented a nice analysis of it on his blog. Inspired by that, here’s are the results of a factor analysis of the voting […]