Categories

Archives

Archives de la catégorie : 'France'

Entrepreneur de soi-même

On peut penser que, quand on porte un prénom démodé, on le met moins en avant que quand on porte un prénom moins démodé. Mais c’est difficile d’en être certain, les usages quotidiens du prénom étant fluctuants et échappant au regard et à l’oreille du sociologue.
Mais on peut essayer de vérifier cela pour les enseignes commerciales. J’utilise ici la base Sirene, qui compte près de 4 millions d’entrepreneurs individuels (artisans, commerçants, professions libérales, etc…). Je dispose, pour ces personnes, de leur prénom et de l’enseigne commerciale de leur entreprise. Ainsi « Line Lefevbre » peut être la patronne de « Fleurs de Line ». Il est alors possible de vérifier que les personnes portant un prénom au succès récent utilisent plus souvent ce prénom dans leur enseigne commerciale que les personnes ayant un prénom dont le succès remonte au premier tiers du XXe siècle. « Huguette Garcia » ne sera pas la patronne de « Patisseries Huguette » mais de « Aux Délices des croissants ».


Cliquez pour agrandir

C’est en effet ce que l’on observe: Plus le prénom a un succès récent, plus les porteurs de ce prénom ont tendance à l’utiliser pour leur enseigne commerciale. Dans le détail, on repère que les «très vieux» prénoms (ceux dont le succès était important vers 1900) sont plus utilisés que les prénoms des années 1910-1940. Mais c’est que ces «très vieux» prénoms (Emile, Gabrielle, Paul, Victor…) ont aussi connu un second succès au début du XXIe siècle. A l’inverse les prénoms «trop jeunes», ceux dont le succès date d’après 2000, sont peut être trop peu sérieux, trop infantiles encore, pour être utilisés comme enseigne. Et enfin on remarque aussi que celles et ceux qui portent un prénom arabe (Mohamed, Said, Youssef…) utilisent beaucoup moins leur prénom que ce qui serait attendu en raison de leur caractère désuet ou non (ce sont les points oranges sur le graphique).

La demi-vie du « Top 20 »

Les prénoms les plus populaires à un moment donné ne le sont plus quelques années après. Mais combien de temps faut-il pour que la totalité du “top 10” ou du “top 50” soit renouvelée ? La question pose problème, car certains prénoms, comme Marie, Paul, Louis restent, pendant presque tout le XXe siècle et le début du XXIe siècle, parmi les prénoms les plus donnés. Oh, certes, leur fréquence diminue fortement, mais ils restent dans le Top 20 pendant très longtemps.
C’est pourquoi je m’intéresse ici à la “demi-vie” du top 20. La demi-vie est une notion très utilisée en physique. Prenez 100 atomes de plutonium (ou un peu plus). C’est radioactif. Au bout de combien de temps la moitié des noyaux se seront désintégrés ? On va considérer Huguette comme une sorte de noyau radioactif.

Désormais, il suffit d’à peine 10 ans pour que la moitié des prénoms du “top 20” soient sortis de ce “top 20”. Et les prénoms donnés aux garçons ont cessé d’être lents à se renouveler.

Lien vers le code R (calculs et graphique, sur github)

L’écart d’âge entre conjoints

En France, l’écart d’âge entre conjoints (de sexes différents) est de 2 ans et demi. En moyenne, dans un couple, l’homme est 2,5 ans plus âgé que la femme.
Mais il y a une géographie de cet écart d’âge. En France métropolitaine, voici ce que cela donne, à partir du “Fichier détail individu” du Recensement 2014. L’intérêt du Fichier détail du recensement, c’est de pouvoir travailler sur près de 4,5 millions de couples (effectif non pondéré). Les zones sous la moyenne sont en bleu, les zones au dessus de la moyenne sont en rouge.

Du bassin minier au nord à la Charente, l’écart d’âge est faible. Dans le centre et en Corse, il a tendance à être plus élevé. Même chose en région parisienne et particulièrement en Seine Saint-Denis. On pourrait certainement trouver une explication culturaliste ou matérialiste : France du partage égalitaire et des petites fortunes à l’Ouest, formes d’héritages autrement constituées au Centre. Clanisme corse ? Mais il y a, pour un sociologue, d’autres explications.
On sait, par exemple, que l’écart d’âge est plus important pour les couples âgés que pour les jeunes couples. Il se pourrait donc que les variations de l’écart d’âge soient dûes au fait qu’à certains endroits de France habitent surtout des couples jeunes, et qu’à d’autres endroits, des couples plus âgés résident.
Dans la carte suivante, je “contrôle” par l’âge moyen du couple (c’est à dire la moyenne de l’âge de chaque conjoint), au niveau individuel. Puis je trace la carte des écarts par rapport à cette moyenne. Par exemple, dans les couples dont l’âge moyen est 35 ans, l’écart d’âge moyen est de 2,5 ans. Si l’écart constaté pour le couple n° 2 542 447 est de 3 ans, alors je considère qu’il est 0,5 an plus âgé (c’est le “résidu”). La carte suivante représente donc la moyenne des résidus par zone.

Ce contrôle par l’âge n’a pas tendance à atténuer les différences entre zones. Il semble avoir peu d’effet.
On va alors contrôler par la catégorie socio-professionnelle : car les femmes cadres ont des goûts en matière d’hommes que n’ont pas les femmes ouvrières ou agricultrices. De fait, les couples “cadres-cadres” ont un écart d’âge plus faible que les couples “ouvriers-ouvrières”. Et il se pourrait donc que les écarts d’âge moyens par zone soient dûs à la composition socioprofessionnelle de ces zones.
La carte suivante montre, par l’éclaircissement des coloris, que, en effet, le contrôle par la CS réduit les écarts. Une bonne partie des zones “très rouges” ou “très bleues” étaient de cette couleur en raison de la composition sociale.

Mais on sait aussi que les personnes qui ont un diplôme du supérieur n’ont pas les mêmes choix que les personnes qui n’ont pas de diplôme. On contrôle alors par ce niveau de diplôme. Là encore, on voit un effet :

Enfin il semble y avoir toujours une zone rouge en Seine Saint-Denis. L’on sait que c’est le département où la proportion d’immigrés est la plus importante, en France. Or les immigrés (c’est à dire les personnes nées étrangères à l’étranger) ont pu se marier avant d’arriver en France. De fait l’écart d’âge dans les couples immigrés est plus élevé (peut-être en raison d’un effet de sélection lors de la migration, peut-être en raison de la composition socioprofessionnelle de ce groupe). On va donc contrôler par l’âge moyen du couple, la CS des conjoints, le diplôme des conjoints et le fait d’être immigré ou non-immigré.
La carte s’éclaircit et “jaunit”, car de nombreuses zones bleues deviennent jaunes clair : il n’y a presque plus de différences entre régions françaises si la structure de la population est prise en compte. Quelques mois d’écart tout au plus.

Reste le cas de la Corse. Il y a visiblement, là, un goût pour l’écart d’âge qui ne s’explique pas par les variables utilisées ici.

Une réforme efficace ?

En France, c’est le lundi que le nombre de suicides est le plus élevé, et le week-end qu’il est le plus bas. Entre 2004 et 2013, il y a près de 34 suicides chaque lundi et 26 le samedi et dimanche. Le nombre moyen diminue jour après jour au long de la semaine. Le nombre des suicides suit le rythme de la société. Ou plutôt les rythmes. Car des institutions diverses dictent des rythmes variés.
Ainsi il y a un creux dans la courbe des suicides le mercredi et une reprise le jeudi. Dans un article célèbre de 1984 de François Aveline, Christian Baudelot, Marc Beverraggi et Saadi Lahlou, les auteurs montrent que les rythmes scolaires sont en lien avec le nombre des suicides (des femmes). Avant 1972, le jour de congé des enfants était le jeudi (et le creux dans la courbe le jeudi), après 1972, le jour de congé passe au mercredi (et le creux passe au mercredi).
Et à la rentrée 2013, une nouvelle réforme est mise en place, une réforme des rythmes scolaires qui fait du mercredi matin un jour de classe.La charge des enfants disparaît ce jour-là. En 2014, le creux du mercredi disparaît.

J’ai contrôlé par la période de vacances : en juillet et août, avant 2013, il n’y a pas de creux du mercredi (qui n’existe qu’en période scolaire).
Une autre manière de représenter l’évolution consiste à considérer que le lundi représente la base 100 :

Le mystère des garçons en avance

L’avance scolaire des garçons m’étonne, depuis quelques temps déjà (voir les épisodes précédents ici ou encore ). J’ai commencé à explorer les données du “Panel 2007” (qui suit des élèves sur plusieurs années), mais ce n’est pas encore assez abouti.
L’avance scolaire des garçons est bizarre car elle n’est pas entièrement liée à leurs performances scolaires : à notes égales, les garçons sautent plus souvent une classe que les filles. Et cela se vérifie quelque soit la série ou filière du bac et quelque soit l’origine sociale des élèves. Cela peut s’illustrer avec les résultats nominatifs au bac, en prenant les prénoms comme des indicateurs (flous) d’origine sociale.
En abscisse : le pourcentage de mention “Très bien”. En ordonnées : le pourcentage d’élèves en avance. Chaque point représente un groupe d’élèves portant un prénom donné plus de 200 fois. La ligne bleue montre la relation (issue d’une régression linéaire) entre la proportion de garçons obtenant la mention Très bien et la proportion de garçons “en avance”. La ligne rouge montre la même chose pour les filles. Quelque soit l’année (non représentée), quelque soit la série, quelque soit l’origine sociale, les garçons, en moyenne, ont plus souvent sauté une classe que les filles qui ont les mêmes performances scolaires.

cliquez pour agrandir

Quand on connaît les primes diverses accordées à la précocité, on ne peut s’empêcher de penser que, décidément, les avantages masculins commencent tôt dans la vie.

Le Bingo de l’AFS, édition 2017

Le congrès de l’Association française de sociologie (AFS) a lieu à partir de lundi, à Amiens. J’ai repris une idée de Kieran Healy, parce qu’il faut bien une dizaine d’années pour qu’une innovation traverse l’Atlantique.
Voici donc le premier Bingo de l’AFS :

Cliquez pour télécharger et imprimer

Les règles sont simples, et vous gagnez à tous les coups. Par exemple un autocollant avec un 𝞅 ça compte.

Le petit peuple

Si vous avez lu de la sociologie, vous avez pu tomber, par exemple au milieu d’un article sur le ressentiment, sur un paragraphe construit ainsi :

 

« Des minus… je veux dire… des moins que rien… des envieux. J’ai une œuvre, moi. » (Didier, 58 ans, ancien journaliste)

Les propos de Didier [*] témoignent de l’angoisse produite par le déplacement social qu’il a connu récemment. […]
* Note 1 : Dans cet article, les prénoms ont été anonymisés pour protéger la vie privée de nos enquêtés.

 

Point n’est besoin de multiplier les exemples. Vous aurez reconnu l’habitude d’indexer « ses » enquêtés par un prénom. C’est cet usage que j’explore (en multipliant les exemples) dans un article paru aujourd’hui dans la revue Genèses : « Le petit peuple des sociologues. Anonymes et pseudonymes dans la sociologie française » (Genèses, n°107, juin 2017)
Quand j’ai commencé à écrire de la sociologie, vers 1996, dans le cadre d’un mémoire de maîtrise, je faisais déjà ça : mes enquêtées, des talas, s’appellent Marie-Adélaïde ou Juliette. En licence de sociologie, à Paris 5, on faisait ça (je me souviens d’un travail rendu dans le cadre du cours de François de Singly). À Paris 8, dans les séminaires de master, on faisait ça. À l’Ecole normale supérieure, où se déroulait une partie de ma formation, on faisait ça. Mais si vous lisez des articles de sociologie publiés avant 1995 (que ce soit dans la Revue française de sociologie, dans Sociétés contemporaines, dans les Actes de la recherche en sciences sociales, dans les Cahiers internationaux de sociologie ou dans L’Année sociologique…) vous ne trouverez qu’une poignée d’articles proposant des enquêtés résumés à un prénom. Il y eu un moment où on ne faisait pas ça, donner un prénom aux enquêtés.

Je le sais, parce que (après avoir repéré cette habitude) j’ai lu environ 1450 articles, publiés entre 1960 et 2015, pour repérer l’arrivée de l’utilisation des prénoms dans la sociologie française. Le résultat : un article qui retrace les incitations à l’individualisation du monde social, à la décomposition des collectifs réifiés, à la prise en compte de la dignité de la personne, à la “narrativisation”.

Mais seule une partie du monde social enquêté reçoit des prénoms : les « petits ». Faites une enquête dans les cabinets ministériels, et vos enquêtés ne seront pas Emmanuel, Pierre et Jean-Claude, il seront indexés autrement, souvent par la fonction (“directeur”), le titre, la profession, une place dans la structure. Faites une enquête auprès d’intermittents du spectacle, de femmes sans papier, et vous trouverez Camille et Fatou. Cela a pour conséquence une théorie implicite de la domination : la domination ne s’exerce pas directement, dans le corps à corps, mais de fonction à individu : c’est « Le manager » qui sanctionne « Josiane ». C’est « le responsable de la maraude » qui incite « Dylan » à se soigner.

Ainsi, au détour d’un article sur les réseaux de l’aristocratie parisienne, vous pourriez lire ce qui ressemblerait à ceci :

 

Après les déboires causés par la nationalisation de la banque familiale, en 1981, le maintien du statut de la lignée passa par des formes d’expatriation coloniale dont les enquêtés s’avèrent fort capables de retracer a posteriori la rationalité :

« Mon frère a choisi la Nouvelle-Calédonie et mon oncle le Mali, tous les deux dans l’import-export. Pas glorieux, mais ça rapportait beaucoup, à l’époque. Moi j’ai fait consultant en philo, j’ai monté ma boîte. » (Geoffroy-Marie [*], 35 ans, cadet de la branche cadette, héritier de l’appartement parisien)

* Note 1 : Les prénoms ont été modifiés pour protéger l’anonymat.

 

Mais dans un autre article, portant sur la même personne, vous pourriez lire ceci :

 

La densité des contacts, facilités par l’entregent familial et la sociabilité professionnelle — G. est l’auteur d’essais à prétention philosophique qui lui ont fait connaître les réseaux de la diplomatie culturelle — rend compte de la bifurcation :

« C’est D. qui m’a fait connaître E., qui était à l’époque Ambassadeur à Varsovie. C’est sur sa recommandation que j’ai pu entrer [dans le corps diplomatique]. » (G., directeur des services culturels)

 

Comme le montre l’exemple précédent, fictif mais pas tant que ça, utiliser un prénom place l’enquêté.e en situation de minorité.

Ainsi même les collectifs les moins susceptibles de sombrer dans la promotion des inégalités peuvent différencier les « grandes » (philosophes, cheffes d’orchestres, théoriciennes) des « petites » (paysannes, migrantes, caissières). Les grandes ont nom et prénoms, les petites, au mieux, l’initiale de leur nom de famille — quand bien même le but serait de donner la parole aux petites :

Il serait possible, avec un peu d’ironie, de proposer une version “égalitaire”, en privant les grandes du nom qui fait leur renom. Nancy “philosophe rebelle”, Claire “cheffe”, et “Judith B.”.

Dans une séquence hiérarchique, le prénom, selon qu’il est seul ou non, ou associé ou non au nom, à l’initiale, à la fonction… est confié aux plus petits d’entre nous.

Ce n’est pas la même chose d’indiquer « Baptiste Coulmont, professeur (classe exceptionnelle) au Collège de France et secrétaire général de l’Académie des sciences morales et politiques » ou « Baptiste, sociologue » : le personnage n’est pas le même [de fait, l’un est fictif, je vous laisse deviner lequel].
À cela on me répond : « oui mais c’est ainsi que j’interpellais mes enquêtés sur le terrain ». Devant la récurrence des usages différenciés, permettez-moi d’en douter. Et pourquoi un terme d’interpellation (dans l’interaction) devrait-il devenir, sans traduction aucune, un terme de référence (dans un article) ? L’usage du prénom, en assignant une place implicite aux enquêtés, permet à la sociologue de se mettre en scène au sein du monde décrit : à distance des dominants (réduits à une fonction lointaine), à proximité des petits (dont on a su capter la confiance, avec qui nous sommes à tu et à toi, comment en douter ?).
Je présenterai cet article au congrès de l’Association française de sociologie, et en attendant, vous pouvez lire l’article : « le petit peuple des sociologues ».

Pour l’anonymisation, voir Coulmont ?

Il y a quelques années, j’ai mis en ligne un outil permettant l’anonymisation des enquêtés : à partir des résultats nominatifs au bac, j’ai regroupé les prénoms qui obtenaient le même profil de résultats.
Après quelques années, cet outil commence à être utilisé [j’en avais parlé en 2012]. Et parfois, celles et ceux qui l’utilisent font le plaisir de le citer. Comme je suis un peu bête, j’ai oublié d’indiquer une manière unique de citer cet outil : voilà qui ne facilite pas la citation. Un petit bilan quantitatif s’impose donc.

Nicolas Jounin le mentionne dans Voyage de classes.

Et on en trouve l’usage dans une poignée de thèses soutenues récemment :


Thèse de Géraldine Comoretto

 


Thèse de Maud Gelly

 


Thèse de François Reyssat

 


Thèse de Marjorie Gerbier-Aublanc

 

Youpi ! N=5 ! [Si vous l’avez utilisé dans votre thèse, n’hésitez pas à me le signaler]

Une petite prime à la difficulté

Il y a peu de femmes députées, mais depuis la loi sur la parité, il y a presque autant de candidats que de candidates. Certes. Mais les femmes sont investies, en tendance, dans des circonscriptions plus difficiles à gagner.
On peut mettre cela en évidence en prenant les candidatures aux élections législatives de 2012.
On commence par s’intéresser à l’élection présidentielle et on calcule le score de chaque candidat au premier tour, dans chacune des circoncriptions. Hollande fait tant dans telle circonscription, etc… Puis on s’intéresse aux élections législatives, et on affecte les candidats-députés à chaque candidat-président en fonction de son “étiquette” : les candidats-députés socialistes sont affectées à Hollande, les candidats-députés “UMP” à Sarkozy, etc…
On peut alors regarder si les candidates-députées socialistes, par exemple, sont investies dans des circonscriptions où Hollande a fait un bon score ou un mauvais score, et faire la même chose pour les candidats-députés.
On sépare les candidats “sortants” (celles et ceux qui étaient déjà députés, et qui, très souvent, ont été élus dans des circonscriptions où leur “candidat-président” a fait un bon score) des candidats “nouveaux”.

cliquez pour agrandir

Ce que l’on peut voir, c’est que les candidates sont investies dans des circonscriptions où leur “candidat-président” a fait un mauvais score (un score plus bas que sa moyenne). Les candidats, eux, non. De ce fait, il est plus difficile d’être élue députée que d’être élu député.

Un peu d’imputation

Les résultats électoraux publiés sur opendata.paris.fr sont de bonne qualité : ils proviennent directement du bureau des élections de la ville de Paris. Mais il y a de petites bizarreries dans le nombre de votes par procuration de quelques bureaux de vote. C’est assez habituel : le nombre de votes par procuration ne change pas le résultat, et il ne fait pas partie des données scrutées avec attention (le nombre de voix reçues par les candidats, le nombre de votants…). C’est une donnée annexe, d’un peu moins bonne qualité.
Par exemple, les bureaux 10-1 et 16-46 ont indiqué zéro vote par procuration au premier tour des présidentielles. Tous les autres bureaux de vote ont au moins 9 procurations. Et les bureaux qui ont moins de 15 votes par procurations se trouvent tous dans les 18e, 19e ou 20e arrondissements. Les bureaux immédiatement adjacents au 10-1 et au 16-46 ont eux aussi bien plus de procurations.
J’ai donc été vérifier les listes d’émargement, à la préfecture de Paris. J’ai compté les procurations. Et en effet, le 10-1 a vu 81 procurations au premier tour, et le 16-46 a vu 44 votes par procuration. Aurai-je pu prédire ces chiffres et m’épargner un aller-retour en métro ?


Comme le montre le graphique ci-dessus, dans les deux bureaux concernés, le “vrai” taux de procuration ne devrait pas être zéro, mais plutôt 3% pour l’un et 4,5% pour l’autre.
Au lieu d’une régression sur une seule variable, on peut prendre en compte simultanément d’autres variables. L’idée est ici de se servir des corrélations assez fortes entre variables : taux d’abstention, proportion de votes Fillon ou Macron, taux de bulletins nuls… pour assigner une valeur probable au taux de procurations au premier tour.

Si l’on fait cette régression en enlevant les bureaux “problématiques”, alors on obtient 6,3% de procurations pour le bureau 10-1 et 4,6% pour le bureau 16-46. Soit, en valeur absolue : 74 procurations pour le 10-1 et 44 pour le 16-46. On tombe pipe-poil sur le vrai nombre pour le bureau du 16e, on est en dessous de 7 votants pour le bureau du 10e arrondissement. Pas mal !

Le problème se repose pour le second tour : certains bureaux ont des nombres de procurations très improbables, près de 400. Et d’autres assesseurs semblent avoir au contraire oublié un 1 devant le chiffre 11 ou 27. Et encore un bureau à zéro procuration.

Pour estimer le nombre de procurations réelles dans ces bureaux (que je n’avais pas pu identifier avant ma visite à la préfecture), je peux utiliser les résultats du second tour (vote Macron, abstention, bulletins nuls), mais aussi ceux du premier tour : ainsi le vote Fillon au premier tour est assez prédictif, ainsi que, bien entendu, le recours à la procuration au premier tour.

Une première régression permet d’identifier les bureaux aux chiffres aberrants : ce sont les bureaux dont le taux de procuration prédit est très éloigné du taux de procuration observé. On les enlève du jeux de données, on répète la régression, et on affecte à ces bureaux le taux de procuration prédit par cette nouvelle regression.

Cette procédure va faire augmenter artificiellement le « R^2 » de la régression, puisqu’on enlève les points aberrants et qu’on les remplace par des points prédits. Heureusement, cela ne porte que sur moins de 10 bureaux sur les 896 bureaux parisiens. Et ça permet de tracer des cartes un peu plus jolies.