Categories

Archives

Les billets de February, 2014 (ordre chronologique)

Sexualitics : une collaboration

sexualitics-logo-150x150Antoine Mazières a mis en ligne Sexualitics, une collaboration pluridisciplinaire autour de “big data” issues de sites vidéo pornographiques. Les données (concernant 2 millions de clips) sont là http://sexualitics.github.io.
sexualitics-thumb

À partir de ces données, Antoine, avec Christophe Prieur, Mathieu Trachman, Jean-Philippe Cointet et moi-même avons proposé un article à la revue Porn studies, le “working paper” est disponible sur HAL.
Une autre exploration de ces données est proposée sur http://porngram.sexualitics.org où des graphiques représentent la proportion de titres comportant tel ou tel mot. La simplicité apparente de l’outil, et la possibilité de passer plusieurs minutes à tester tel ou tel mot, a intéressé plusieurs journalistes :

  1. wired.co.uk : Porngram: a Google Trends for niche sexual interests powered by ‘sexualitics’
  2. the atlantic : SFW: When Big Data Meets Porn
  3. fastCompany : Porn, Big Data, And What We Search For When No One’s Looking
  4. The Economist : “Worth Reading”
  5. L’Express : Porngram: plongée dans les fantasmes des amateurs de porno
  6. Le Tag Parfait [NSFW] : Porngram : le big data du porn

Sexualitics (et la grande majorité des titres et des tags des vidéos) est en anglais, et cela permet sans doute d’être diffusé, dans d’autres langues, par des anglophones. Ci-dessous, un extrait de reprises sur twitter, en allemand, en turc, néerlandais, japonais, suédois (?), espagnol, russe (ou bulgare ?)…
porngram-twitter-international

Qui codirige avec qui ?

Voici une petite visualisation interactive du réseau des co-directions en sciences sociales, en France, à partir du fichier du site theses.fr :
http://coulmont.com/varia/2014/codirections/

datavizsociocodir

Cela commence par mettre Stéphane Beaud au centre, mais si vous cliquez sur un co-directeur, vous verrez apparaître son réseau égocentré.
Bonne balade.

Explorer la procuration

La Vie des Idées vient de publier un article écrit avec Arthur Charpentier et Joël Gombin, article qui porte sur le vote par procuration en France.
Je poursuis ici l’exploration des données du vote par procuration et Arthur Charpentier fait de même sur son blog.

Tout d’abord un mot sur les données :
Dans l’article, nous nous appuyons sur les données recueillies par l’ANR Cartelec, notamment pour les fonds de carte des bureaux de vote (au format shapefile .shp) et pour les données du recensement à l’échelle de ces bureaux de vote. Ces données sont accessibles sur le site de Cartelec.
Mais Cartelec n’a pas d’informations concernant les procurations. Et il n’est pas simple de trouver le nombre de votes par procuration aux niveaux nationaux, départementaux, communaux ou à l’échelle du bureau de vote. Mon premier réflexe a été de rechercher des données dans les enquêtes “Participation électorale” de l’INSEE (1983-2012)… mais ces enquêtes n’a-ont pas pris en compte les procurations… Ce qui est dommage, car l’on dispose, avec ces enquêtes, de données individuelles.
Il a donc fallu se rabattre sur d’autres sources, partielles et à une échelle agrégée… Nous avons travaillé ici avec des données “écologiques” (et donc avec un risque d’ecological fallacy) À ma connaissance, seules quatre grandes villes donnent accès à des données sur les procurations.

  1. Montpellier : Résultats des élections (1994-2012), et aussi le shapefile des Bureaux de vote pour les élections de 2012.
  2. Nantes : résultats des élections (de 2007 à 2012) et shapefile des Bureaux de vote (pour 2012)
  3. Paris : résultat des élections (2007-2012) Etrangement, la ville de Paris n’a pas mis à disposition des citoyens le shapefile des bureaux de vote
  4. Lyon : C’est plus compliqué dans le cas de Lyon. On trouve bien le shapefile des bureaux de vote, mais les résultats doivent être moissonés sur le site de la ville de Lyon. Julien Barnier a mis en ligne le code R sur github pour récupérer les données et une analyse ici

J’ai contacté les sites « opendata » de Strasbourg, Marseille, Toulouse et Bordeaux pour essayer d’obtenir des données similaires, mais pour l’instant soit “le logiciel” des services électoraux municipaux ne recueille pas le nombre de votes par procuration (Strasbourg), soit les services des élection diffusent un format inutilisable (Marseille), soit les services des élections, très occupés en ce moment, répondront plus tard à ces demandes.
J’ai aussi contacté (à deux reprises au moins) la préfecture des Hauts de Seine, pour connaître le nombre de votes par procuration à Neuilly et aux alentours, mais sans réponse.
Le bureau des élections du Ministère de l’Intérieur m’a envoyé un fichier excel contenant pour la France entière des données départementales très “trouées” : apparemment, le Ministère ne contrôle pas de très près le nombre de votes par procuration et beaucoup de préfectures n’envoient pas les chiffres. Cela rend très complexe l’évaluation de l’évolution nationale de la fréquence de la procuration.
Mais j’ai réussi à faire cette petite carte nationale (en faisant soit la moyenne des deux tours, quand c’était disponible, soit en ne prenant qu’un seul tour) :
proddep2012pres
Il semble y avoir un peu plus de procurations dans le Sud de la France en avril-mai 2012… Mais si, lors du premier tours, les trois zones scolaires étaient en vacances, ce n’était pas le cas le 6 mai quand seule la zone B (Lille, Aix…) était en vacances. La région parisienne et la Corse ont un recours plus intense à la procuration.

Une autre carte qui ne se trouve pas dans l’article de la Vie des idées est reproduite ici. Une carte parisienne montrant le rapport entre votes par procurations et votes “blancs ou nuls”, carte intéressante : elle permet de bien distinguer des zones où les votes par procurations ne sont pas beaucoup plus nombreux que les votes nuls et des zones où le vote par procurations est de 6 à 17 fois plus fréquent que le vote nul, c’est à dire des zones où l’offre politique disponible rencontre tellement bien l’assentiment des résidents qu’ils votent même en cas d’empêchement.

proc-nuls

Terminons par quelques “copies d’écran” montrant le rôle d’internet dans la procuration.

L’équipe de NKM, candidate à la mairie de Paris, a mis en place une procédure permettant à un sympathisant UMP de trouver quelqu’un pour qui voter (comme l’équipe de Hollande l’avait fait en 2012) :

procurations-nkm-janvier2014

L’équipe d’Anne Hidalgo fait presque la même chose, mais en permettant aussi à des personnes souhaitant être mandatées de se déclarer, en jouant sur le plaisir du vote : “Vous êtes disponible et impatient-e (…) Votez deux fois !”
procuration-hidalgo2014

Ces deux dispositifs peuvent se comprendre comme des “pièges à sympathisants” : l’UMP locale — et le PS local — connaît sans doute ses militants, mais moins ses sympathisants. Avec ce dispositif, des informations peuvent être recueillies sur des personnes qu’il est possible de mobiliser ensuite.

Et dans le même temps, le gouvernement prépare la dématérialisation de l’établissement du vote par procuration :
procurations-simplification
Simplifier le vote par procuration vise à rendre plus aisé l’acte de vote. Mais l’on voit — c’est mon hypothèse — que la procuration semble utilisée de manière prioritaire par des personnes aisées (diplômées, propriétaires, cadres…) : c’est à mon avis une des modalités du vote des classes dominantes. Il est fort possible que rendre plus aisée la procuration ne bénéficie pas vraiment au gouvernement actuel… mais c’est une autre histoire.

Can you really vote twice? Proxy votes in France

Here is the companion piece to my blog post on The Monkey Cage (thanks Erik!). You can also see Arthur Charpentier’s companion piece.

France does not allow for early voting nor mail-in voting. If you want to vote, you have to go to the ballot box, or vote by proxy. Proxy voting is now easier than before, but one still has to go to the police, the gendarmerie or to a local tribunal to officialize the proxy. And one has to sign “sur l’honneur” that going to the ballot box on the day of the election is impossible. Another condition : The proxy voter needs to be registered to vote in the same city.
I was surprised to realize that French political scientists never studied proxy voting (it has been extensively studied by legal scholars of electoral fraud). Until a few years ago, it was indeed a rounding error in ballot box results, but that is not the case anymore. And to be brief, proxy voting seems to be a way for the politically active to vote when they can not physically vote. With two colleagues, Arthur Charpentier and Joël Gombin, we have begun to explore the social and political logics of the “procuration” — as proxy voting is known in France. We focused our inquiry, at first, at the polling station level (bureaux de vote) : it is a very small geographical unit of around 1000 voters, and in many cities it should be somewhat homogeneous (at least with a smaller variance than bigger geographical units).
We focused on polling stations data because the “electoral participation surveys” of the INSEE (the French National Statistical Institute) did not gather information about “proxy votes” (they were considered to be too few).

For a few years now, the main French cities have put some data online. And in a few cases, we have data about proxy votes :

  1. Montpellier : Electoral results (1994-2012), and the shapefile of the Bureaux de vote for 2012.
  2. Nantes : electoral results (2007 to 2012) and shapefile of the polling stations (for 2012)
  3. Paris : electoral results (2007-2012) But no shapefile here. I have had access to a shapefile created by the Cartelec group
  4. Lyon : It is more complicated here. Data have to be scrapped from the municipal website. The shapefile of the polling station is available. Julien Barnier put on GitHub the code used to gather electoral results

In the working paper published by La Vie des idées, we also used data created by the ANR Cartelec, which recombined data from the French census to fit the geographical units of the polling stations.

Feel free to ask for more information about la procuration en France.

Bilan de la qualification CNU

Cette année, la DGRH A1-1 a encore fait du bon travail, et donne accès non pas à un rapport en pdf, mais à une série de tableaux excel qu’il est beaucoup plus facile de réutiliser. Merci ! On attend encore la possibilité, en tant que chercheur, d’avoir accès à des données individuelles, mais on ne peut pas tout avoir…
Commençons notre exploration. Les sections du CNU, en 2013, ont délivré 9183 qualifications MCF à 6774 candidats. Au départ, il y avait 10876 candidats à la qualif MCF, mais 3603 dossiers ont été éliminés (dossiers incomplets, non parvenus, renoncement…). Une candidate peut déposer plusieurs dossiers. 1937 personnes ont reçu plusieurs qualifications MCF (soit 28% des qualifiés).
25% des qualifiés MCF ont moins de 30 ans, 40% ont entre 30 et 34 ans. Les femmes sont 6 mois plus âgées que les hommes en moyenne.
En section 63 (Génie électrique), les femmes représentent 16% des qualifiés. En section 07, elles représentent près de 75% des qualifiés. Mais il faudrait comparer avec le nombre de femmes au départ de la procédure. Si l’on fait cela, on peut voir que, en section 08 (Latin, Grec…) la proportion des qualifiés compte proportionnellement plus de femmes que la proportion des candidats : elles gagnent 7 points. Idem en sociologie (section 19). En revanche en section 73 (“langues régionales”) et en section 03 (“Histoire du droit”) elles perdent plus de 10 points.

Il apparaît que plus les femmes sont nombreuses dans la population des personnes qualifiées, moins elles sont désavantagées lors de la qualification.
femmes-qualif-2014

Parlons un peu de la qualification aux postes de professeur. Cette demande de qualif n’est pas faite que par des MCF, mais aussi par des chercheurs (CNRS, INRA…) ou des enseignants non-universitaires souhaitant devenir professeurs des universités. Dans la section 29 “Constituants élémentaires”, les MCF représentent 33% des candidats à la qualif PR. En sections 16 (Psycho) et 74 (STAPS) les MCF représentent plus de 80% des candidats à la qualif PR.

Les qualifications multiples ne se font pas au hasard. On trouve peu de sociologues également qualifiés en mathématiques. La DGRHA1-1 propose donc un tableau des proximités disciplinaires, avec un “classement” des couples de disciplines les plus proches :

  1. Informatique & Mécanique, génie mécanique, génie civil se partagent 51 qualifiés [DM m’indique qu’il y a là une erreur : il faut lire Informatique & Génie informatique]
  2. Science politique & Sociologie, démographie en 2e place se partagent 46 qualifiés
  3. Milieux denses et matériaux & Chimie des matériaux se partagent 39 qualifiés
    [ et d’ailleurs les “Milieux denses” partagent de nombreux qualifiés avec de nombreuses autres sections ]

Une représentation synthétique donnerait ceci :

proximites2014
Cliquez pour avoir le PDF – beaucoup plus lisible

L’on remarque que deux disciplines, l’économie et la psychologie, servent d’intermédiaires entre le groupe des “lettres et sciences humaines” et le groupe des “sciences”. Urbanisme et géographie, cette année, se retrouvent de l’autre côté.

Les non-candidats (l’évaporation) : « 3768 personnes détenant globalement 5053 qualifications délivrées cette année n’ont pas candidaté sur les postes ouverts au recrutement ».
Y a-t-il un lien entre avoir plusieurs qualifications et ne pas candidater ? Oui, et c’est un peu paradoxal : les multiqualifiés sont un peu plus souvent que les monoqualifiés des personnes qui ne candidatent à aucun poste.

Qualifiés Non Candidats Proportion
1 qualification 4813 1969 40,9
2 qualifications 1557 690 44,3
3 qualifications 306 139 45,4
4 qualifications 67 24 35,8
5 qualifications 6 3 50,0

On laissera de côté les quadruples et quintuples qualifications (les effectifs, sur une année, sont faibles).
La proportion de non-candidats a fortement augmenté entre 2007 et 2011, elle est stable depuis : En 2013, 41,82% des qualifiés n’ont candidaté à aucun poste (41,5% en 2012, 41,3% en 2011, 38,9% en 2010… et 30,9% en 2007). Et cette année, pour les qualifiés PR, 57% n’ont candidaté à aucun poste.

Les données publiées permettent une analyse de la cohorte des qualifiés de 2009. Pour ce qui concerne les qualifiés MCF, 26% n’ont candidaté à aucun poste de 2009 à 2013. 27% ont candidaté une fois (en 2009), 11% ont candidaté deux fois. … 3% ont candidaté à cinq reprises. Au total, 26% des qualifiés MCF ont été recrutés : mais si l’on s’intéresse à celles et ceux qui ont effectivement candidaté, le taux de recrutement est plus élevé.

Je m’arrêterai là aujourd’hui, mais d’autres traitements statistiques sont possibles.