The Economist, endogénéité, French Bashing et inégalité des sexes

The Economist, dans son édition du 5 mai, imagine ce qu’auraient donné les résultats de l’élection présidentielle française si la France avait le même système électoral que les Etats-Unis. La conclusion est que Marine Le Pen aurait pu gagner. Il ne s’agit pas juste d’une simulation pour le fun. L’hebdomadaire en déduit que « the difference between a populist tide and a centrist resurgence may come down to the electoral system ».

On voit bien le réconfort que les journalistes de l’américano-britannique Economist peuvent tirer d’une telle conclusion. Voilà que la France (!) leur donne des leçons d’ouverture et de tolérance en rejetant les idées xénophobes auxquelles ont succombé leurs deux pays de référence. Il serait tellement plus confortable que tout cela ne soit dû qu’au hasard des systèmes électoraux plus qu’à la nécessité du choix des votants.

Ecartons d’abord tout procès éventuel en anglophobie primaire. Je suis abonné à The Economist depuis 1986 et sa lecture hebdomadaire est un plaisir dominical. J’attends chaque année la double issue de Noël avec autant d’impatience que les ronds de Saint Nicolas que ma grand-mère nous envoyait de Calais début décembre.

Mais je sais aussi le mépris bienveillant qui inspire les articles consacrés à la France dans cet excellent journal et il peut lui arriver alors de s‘éloigner de toute rationalité. C’est le cas dans cet article.

La simulation de The Economist se base sur les résultats du premier tour, en imaginant un collège électoral avec 2 représentants pour chacune des 18 régions, auxquels s‘ajoutent 157 délégués répartis à la proportionnelle de la population des 18 régions.

Une première erreur évidente dans ce calcul est le travail au niveau des régions. Les régions françaises sont une création récente : administrativement, elles n’ont été créées qu’en 1956. Quant aux 18 régions actuelles, elles ont un peu plus d’un an d’existence. Si collège électoral il y avait, il serait très probablement au niveau du département, dont la création remonte à la Révolution. L’excellent site NC233 fait d’ailleurs des simulations équivalentes à The Economist (mais sans en tirer la moindre conclusion politique) précisément au niveau du département. Premier enseignement pour la data team de The Economist : un statisticien ne devrait jamais travailler hors sol sur ses chiffres, sans l’accompagnement d’un expert du sujet.

J’ai réalisé une simulation, en comptant un délégué par département (y compris les DOM et français de l’étranger), plus 577 délégués répartis à la proportionnelle des départements, système qui se rapproche du fonctionnement du collège électoral des Etats-Unis. Sur la base des résultats du premier tour, Emmanuel Macron obtient 214 délégués, Marine Le Pen 190, François Fillon 134 et Jean-Luc Mélenchon 132. Aucun candidat n’obtient de majorité absolue, mais Emmanuel Macron a bien une majorité relative, dont on ne voit pas bien dans quel système tordu (celui des Etats-Unis, peut-être ?) elle pourrait l’amener à perdre finalement.

La deuxième question que l’on peut se poser est sur l’utilisation des résultats du premier ou du second tour. Il n’y aurait évidemment pas photo dans ce cas : Emmanuel Macron obtient 505 délégués.

Premier tour ou second tour ? The Economist pourrait argumenter qu’il n’y a qu’un seul tour aux élections américaines et britanniques, et que donc c’est celui-là qu’il faut retenir : les électeurs français expriment alors leur vrai choix, sans contrainte. C’est là que se situe la seconde erreur. La manière dont les électeurs votent dépend du système électoral. Il est n’est pas possible de savoir comment auraient voté les français si le système électoral avait été différent. Vu le rejet que suscite le Front National, qui, au fil des élections, ne reste qu’une (importante) minorité, on peut penser que les résultats du premier tour auraient été différents s’il avait été décisif. Evidemment, ce serait mieux de pouvoir le prouver. J’explique dans les paragraphes suivants (un peu techniques) comment on peut le faire.

L’impossibilité de faire des simulations du type de celle de The Economist vient du fait que le système électoral ne peut pas être considéré comme exogène par rapport au vote. L’endogénéité étant une propriété mathématique des données, cela peut se démontrer. Pour cela, il faut modéliser les résultats d’un scrutin qui se déroulerait au même moment selon plusieurs modalités.

En France, nous avons précisément un scrutin qui se déroule de deux manières différentes selon le type de commune : ce sont les élections municipales. En-dessous de 1000 habitants dans la commune, il s’agit d’un scrutin uninominal majoritaire : on vote pour chacun des candidats séparément, et sont élus ceux qui obtiennent le plus de voix. Au-dessus de 1000 habitants, c’est un scrutin sur liste. Les électeurs choisissent une liste. La liste arrivée en tête obtient 50% des sièges du conseil municipal et le reste des sièges est attribué proportionnellement aux voies obtenues par l’ensemble des listes (je simplifie un peu).

Pour prouver que le système électoral est endogène, il faut donc modéliser les résultats du vote en fonction de ce système. On a assez peu d’information sur les petites communes : elles sont trop nombreuses, et l’appartenance politique n’a pas forcément de sens à ce niveau. La seule information dont on dispose est le nom et le sexe des candidats. Il est donc possible de modéliser le score obtenu par une liste ou un candidat, en fonction du type de scrutin et du sexe du candidat. Pour le scrutin de liste, j’ai retenu le sexe de la tête de liste (et pas le nombre de femmes) : en vertu du principe « chabadabada », les listes pour les municipales doivent comporter un homme et une femme en alternance. Afin d’éliminer les biais éventuels où des candidates femme auraient été choisies car elles auraient eu peu de chances de l’emporter, je me suis restreint aux candidats et listes élus. J’ai aussi intégré dans la régression des caractéristiques de la commune, issues du recensement le plus récent (répartition sexe, âge, csp, diplôme).

La démarche est alors la suivante : on cherche à savoir si le score obtenu par la liste ou le candidat élu dépend du type de scrutin et si le score obtenu par une femme est significativement différent de celui obtenu par un homme. On peut estimer le modèle en supposant que le système électoral est exogène, et sans faire cette hypothèse. Si les deux estimations donnent des résultats différents, c’est que le système électoral est endogène. Et c’est précisément le cas.

J’ai suivi la même procédure que dans ce papier, qui a obtenu le « Best Paper Award » du congrès Big Data World organisé par Esomar à Berlin en décembre 2016. Le test d’endogénéité de Hausman indique que les variables liées au système électoral sont bien endogènes.

Un résultat intéressant est qu’il y a bien un biais négatif sur le score des listes conduites par des femmes, biais qui n’existe pas dans le scrutin des petites communes (mais j’y reviendrai dans un autre blog, car cela mérite une analyse plus poussée). Quand on suppose le système électoral exogène, la modélisation indique qu’une liste avec une femme comme tête de liste obtient un score inférieur de 6% en moyenne, toute choses égales par ailleurs, par rapport à une liste dirigée par un homme. La modélisation qui tient compte de l’endogénéité nous indique que cette décote est en fait encore plus importante.

La conclusion principale est qu’il n’est pas possible de faire des simulations de changement de système électoral, car le comportement des électeurs dépend de ce système. La simulation de The Economist repose sur l’erreur classique du prévisionniste en herbe : considérer que la variable qui définit le scénario de la prévision est exogène. Un bel exemple d’application de la critique de Lucas.

Méconnaissance de la base de l’économétrie, ou juste difficulté à avaler que la France ait rejeté le populisme à 66/34 (49/51 en Angleterre et 46/43 aux US) ? Et peut-être aussi, mais je sors là totalement de mon domaine de compétence, désarroi face au lien possible avec le fait que la France n’a jamais appliqué in extenso les recettes économiques préconisées à longueur de colonnes par The Economist ?

Antoine Moreau
19/05/2017