Dans mon dernier article, je montrais comment la non prise en compte de l’endogénéité dans une analyse statistique peut amener à de mauvaises conclusions et décisions. Ainsi, l’abstention a un effet positif sur le score du Front National nettement plus significatif que ne le laisserait croire une analyse à plat des données : 1% d’abstention en plus fait croître le score du FN de 0,5%. 3 fois plus que ne le dirait une simple (fausse) corrélation.

Notre modélisation apporte d’autres éclairages sur le vote Front National. Comme je le soulignais dans le dernier article, outre la non prise en compte de l’endogénéité, un défaut des analyses réalisées à ce sujet est souvent de ne pas tenir compte des caractéristiques des communes concernées. Le modèle que nous avons estimé mesure l’impact d’une douzaine de caractéristiques des communes sur le vote Front National. Estimé à partir des données exhaustives de vote aux législatives de 2012, combinées avec des données provenant de l’INSEE, il est tout à fait robuste : tous les détails techniques sont ici.

Premier déterminant du vote FN, le chômage. 1% de chômage en plus se traduit par 1% de votes FN supplémentaires. C’est, avec l’abstention, la variable la plus significative du modèle.

Autre effet très significatif, le niveau de revenu, rapporté au nombre de personnes du foyer. Un revenu annuel médian augmenté de 5000 euros diminue le score du FN de 1%, sauf dans les petites communes où l’effet est un peu plus faible. Cet effet se cumule avec l’effet du chômage.

Le niveau de diplôme a aussi un impact, mais plus complexe, et en interaction avec la structure par âge et sexe des populations concernées. Le segment de population le plus tenté par le vote FN est celui des hommes de 24 à 64 ans, avec un diplôme en-dessous du baccalauréat. Pour tous les autres segments (non diplômés, femmes, moins de 24 ans ou plus de 65 ans), l’effet sur le vote FN est inférieur, ou équivalent. L’âge n’a pas un impact univoque, pas plus que l’absence totale de diplôme. Une surreprésentation des diplômés niveau bac ou plus fait diminuer le score du FN, sauf pour les hommes de plus de 65 ans et les femmes de moins de 24.

Un effet sans ambiguïté celui-là, celui du nombre d’immigrés. Toutes choses égales par ailleurs, 1% d’immigrés en plus fait diminuer le score du FN de 0,15%. Cela pourra sembler étrange : toutes les communes gagnées en 2014 par le FN se situent dans le dernier décile de leur département en termes de proportion d’immigrés. Mais c’est justement là l’intérêt d’une analyse de modélisation, qui tient compte simultanément de toute une série de variables. L’implantation du Front National dans des communes à forte densité d’immigrés est due à un taux de chômage important et à la faiblesse du revenu moyen, pas à la présence de ces populations.

La proximité entre lieu de travail et lieu de résidence a aussi un effet sans ambiguïté. Dans les communes où les actifs travaillent plus près de chez eux, le FN est moins présent, particulièrement si ces actifs utilisent les transports collectifs.

Autre effet significatif, celui de la composition du foyer. Quand les foyers où les deux parents sont actifs sont surreprésentés, le FN est moins fort. Et un nombre significatif de familles monoparentales diminue aussi le score du FN, mais uniquement dans les plus grandes communes.

Au final, les enseignements de la modélisation permettent de mieux comprendre les déterminants réels et objectifs du vote FN, qu’une simple analyse de corrélation aurait mal évalués. La prise en compte de l’endogénéité et la diversité des données en entrée de notre modélisation apportent une réponse claire et dépourvue de biais. Nous encourageons les analystes, les spécialistes du marketing et plus largement les décideurs, à mieux saisir le rôle capital que la non prise en compte de l’endogénéité peut avoir dans un modèle de décision. N’hésitez pas à nous contacter pour nous parler de vos problématiques. Nous nous en doutons, elles s’éloignent certainement de la compréhension du vote FN. Mais leur apporter des réponses reposent sur l’utilisation des mêmes modèles statistiques d’aide à la décision.