Categories

Archives

Billet

L’accès sécurisé aux données

Billet publié le 28/06/2013

Jusque dans les années 1960-1970, l’accès aux données administratives était relativement facile aux sociologues. Depuis le développement des législations protégeant la vie privée des acteurs sociaux, c’est plus compliqué. Heureusement, la plupart du temps, la sociologue n’a pas besoin d’informations comme le revenu déclaré par les individus et les ménages habitant telle adresse. Mais parfois, si.
Dans ce cadre a été créé le CASD, “Centre d’accès sécurisé aux données”.

C’était l’introduction.

Depuis quelques années, je travaille à comprendre les usages sociaux du prénom. Le “Fichier des prénoms” de l’INSEE, ou de vieilles “Enquêtes Emploi” non anonymisées permettent de répliquer des résultats connus depuis les travaux de Besnard et Desplanques. Mais on en fait le tour. Ma recherche sur les changements de prénoms et la lecture de travaux sur les prénoms donnés par les migrants à leurs enfants m’a incité à diriger mes recherches vers ce thème: quels prénoms sont donnés par les migrants et leurs descendants ?
L’enquête TeO, Trajectoires et Origines, est une enquête récente. Y ont été interrogées 11 000 personnes nées en France métropolitaine et 11 000 hors de France métropolitaine. Comme il est de coutume dans les enquêtes de l’INED et de l’INSEE, les prénoms sont recueillis au départ du questionnaire, afin que les questions posées soient “Depuis combien de temps Robert est-il…” et non pas “Depuis combien de temps Individu7 est-il…”
TeO-prenoms
[extrait du questionnaire de l’enquête TeO]
Puis les prénoms sont séparés de la base de données : les chercheurs n’y ont pas accès, ils n’ont accès qu’à des identifiants numériques. Et Robert n’y pourra rien : il n’est maintenant qu’un numéro.

J’ai donc demandé, après plusieurs contacts auprès de l’INSEE et de l’INED, au Comité du Secret Statistique l’autorisation d’avoir accès aux prénoms de TeO. En décembre 2012, j’ai été auditionné par le Comité (l’audition fut très courte, le dossier avait été instruit et ne soulevait pas de problèmes particuliers). Les données seront accessibles par l’intermédiaire du “CASD”, le Centre d’accès sécurisé aux données.

Le CASD fournit un terminal (gros comme une demi-freebox) qui permet de faire des traitements statistiques sur les données, mais ne permet ni copie d’écran ni téléchargement des données : les données restent sur un serveur localisé — peut-être — dans les sous-sols de Malakoff. Le terminal ne fonctionne qu’à travers une double identification individuelle : par carte à puce et empreintes digitales. Un VPN permet d’accéder au serveur. Si le terminal, qui est dans un placard fermé dans un bureau fermé dans un lieu surveillé, est volé, le voleur ne pourra rien faire. Il lui faudrait ma carte à puce (conservée ailleurs) et mes doigts (toujours sur moi).
sdbox
Une fois les traitements statistiques effectués, les tableaux ou graphiques seront évalués par un agent du CASD, afin de vérifier qu’ils ne contiennent pas de données permettant d’identifier un individu précis.

Ce système, un peu complexe, me semble pour l’instant parfait [même si, pour des raisons liées à la configuration du réseau dans les locaux où je travaille, le VPN n’a pas encore pu être mis en place] : la nécessaire protection de la vie privée s’accompagne de la possibilité de travailler sur des données individuelles.

[yarpp]

4 commentaires

Un commentaire par DM (28/06/2013 à 9:36)

Laisse-moi deviner, ton université a un firewall t’empêchant de te connecter à un VPN extérieur?

Un commentaire par Baptiste Coulmont (28/06/2013 à 9:38)

c’est plus compliqué que ça, apparemment. Et c’est dans les locaux du CNRS

Un commentaire par Godechot (28/06/2013 à 9:52)

Une photo de l’ordinateur du CASD… C’est presque litigieux. Ouf la session n’est pas ouverte !
(Welcome to CASD !)

Un commentaire par Baptiste Coulmont (28/06/2013 à 10:01)

J’ai vérifié, avant de poster cela, que des photos de la SD-Box étaient déjà en ligne http://casd.eu/docs/La_technologie_CASD.pdf