Article

« Le big data permet une analyse beaucoup plus fine qu’un sondage classique »

Entretien

« La technologie des sondages a peu évolué depuis les années 1930. Elle n’est pas complètement dépassée, mais elle est concurrencée par des approches nouvelles. Notre entreprise en propose trois différentes. La première, qui s’appuie sur le big data, permet une analyse beaucoup plus fine qu’un sondage classique. Grâce aux gigantesques bases de données rendues libres d’accès par le gouvernement et l’INSEE – comme les données du recensement, les résultats des élections passées à l’échelle du bureau de vote, les chiffres du chômage, le nombre d’enfants, les origines –, on est capable de découper la France en 65 000 petits carrés d’environ 1 000 habitants et de faire, à une échelle géographique très fine, des prédictions électorales. Si un sondage peut dire qui va gagner à la présidentielle, il ne peut prédire le score d’un candidat dans un arrondissement précis. Paris, par exemple, est découpé en 891 carrés qui correspondent à des bureaux de vote. En 2014, nous avons pu identifier pour Anne Hidalgo, grâce à notre logiciel 50+1, les quartiers où il existait le plus de volatilité au niveau des votes. Ces quartiers correspondaient aux zones où elle avait le plus de voix à gagner. 

La deuxième approche est celle à laquelle a recouru Emmanuel Macron pour établir un diagnostic du pays. Il s’agit d’un grand sondage en porte-à-porte, « la Grande Marche », réalisé par des bénévoles auprès de 100 000 personnes. 25 000 Français ont accepté de répondre en une dizaine de minutes à des questions ouvertes telles que « Qu’est-ce qui va bien en France ? » ou « Qu’attendez-vous de la politique ? ». Ce sondage a été possible uniquement grâce à la technologie : les bénévoles tapaient directement les réponses sur une application mobile, créant une base de données de plusieurs millions de mots. Des algorithmes de traitement automatique du langage ont fait un premier tri, identifiant les thèmes récurrents et les tonalités par exemple. C’est dans un second temps que l’équipe d’En marche ! a lu les commentaires pour en tirer des conclusions. En amont du porte-à-porte, on avait identifié grâce à la première méthode les territoires où il était intéressant de sonder pour avoir une représentation fidèle de la France. Il s’agit d’une démarche d’enquête totalement inédite qui n’existe pas aux États-Unis. 

Enfin, nous avons lancé un projet de recherche inspiré du site américain FiveThirtyEight pour prédire les chances de victoire des candidats à la prochaine élection présidentielle. En faisant une moyenne intelligente de tous les sondages disponibles, on arrive à évaluer à quel moment ceux-ci sont fiables ou ne le sont pas. Car il existe une marge d’erreur aussi en fonction du temps qui sépare le sondage de l’élection. À un an de l’échéance, par exemple, les sondages se trompent de 7 points. Plus on se rapproche de l’élection, moins ils se trompent. On sait aujourd’hui que Marine Le Pen a 96 % de chances d’être au second tour de l’élection présidentielle de 2017. Quant aux autres candidats, nous avons aujourd’hui les résultats. Reste à décider si nous les rendons publics ou pas. »  

Propos recueillis par MANON PAULIC

[…]
Haut de page

Tous les numéros du 1

Sommaire