Oorsqu’un trou noir fiscal de 50 milliards de livres sterling n’est-il pas un trou noir fiscal de 50 milliards de livres sterling ? Plus souvent que vous ne le pensez, selon un nouveau livre sur les données gouvernementales qui laissera les lecteurs avec un cynisme renouvelé à propos de chaque statistique qui sort de la bouche d’un politicien.
Son auteur, Georgina Sturge, est statisticienne à la bibliothèque de la Chambre des communes. Elle n’a pas cherché ici à exposer les tentatives d’acteurs voyous de nous embobiner délibérément avec des chiffres – bien qu’il y en ait beaucoup. Au lieu de cela, encore plus alarmant, Bad Data explique comment les façons dont nous comptons, mesurons et enregistrons les choses sont très souvent tout simplement inappropriées. Comment, par exemple, Keir Starmer a-t-il pu prétendre, en 2020, qu’il y avait 600 000 enfants de plus vivant dans la pauvreté qu’à la fin du dernier gouvernement travailliste alors que Boris Johnson disait qu’il y en avait 100 000 ? moins? « Ces affirmations étaient toutes deux étayées par les chiffres officiels du gouvernement », a déclaré Sturge.
En tant que membre de l’équipe de recherche parlementaire, chargée par les députés de trouver des preuves pour éclairer leurs politiques ou renforcer leurs préjugés, Sturge sait ce que nous ne le faites pas connaître la population. « Nous ne savons pas combien d’enfants sont scolarisés à la maison car ils ne sont pas comptés. » Nous ne savons pas combien de ressortissants étrangers ont dépassé la durée de leur visa étudiant. Nous n’avions pas de chiffres précis sur le chômage dans les années 1980, ni sur les chiffres de la criminalité dans les années 1990 et 2000. « Et parce que nous ne comptons pas certaines choses ou ne les comptons pas de manière cohérente, nous ne pouvons pas dire si elles s’améliorent ou empirent. » Que s’est-il passé, par exemple, après que Tony Blair s’est engagé à mettre fin à la pauvreté des enfants en 1999 ? « Vous pouvez faire votre choix de réponses: soit » Nous ne savons pas « , soit » Cela dépend « . »
Il existe de nombreuses raisons pour lesquelles les données peuvent ne pas être fiables même si elles peuvent être strictement exactes. Avec la pauvreté, c’est souvent à cause de désaccords sur sa définition (ce qui est en partie ce qui donne lieu à la différence entre les décomptes de Starmer et de Johnson). Avec les statistiques sur la criminalité ou le NHS, nous voyons des anomalies lorsque les mêmes personnes sont responsables de la réduction des chiffres et en les enregistrant : un corps de police a montré une diminution de 27 % des « vols dans un véhicule à moteur », qui avaient un objectif, mais une augmentation de 407 % des « interférences avec un véhicule », qui n’en avaient pas.
Parfois, un ensemble de données est trop petit, ce qui conduit à des informations peu significatives selon lesquelles 9 000 ressortissants étrangers vivent à Lincoln, plus ou moins 6 000 ; ou le délai trop court, montrant que les crimes de haine (un crime relativement nouveau dans la législation britannique) « ont doublé en cinq ans » ; ou trop longtemps, suggérant que le Royaume-Uni connaît la « plus grande vague d’immigration depuis près de 1 000 ans ». Souvent, des hypothèses raisonnables sont émises, telles que le fait que la plupart des personnes venant vivre et travailler au Royaume-Uni prennent l’avion pour Heathrow, Gatwick ou Manchester, où l’enquête internationale sur les passagers est effectuée. Lorsque huit nouveaux pays ont rejoint l’UE en 2004, personne n’avait prévu que Wizz Air ouvrirait des liaisons bon marché vers Luton, Stansted, Birmingham et Sheffield Doncaster. Sturge estime que des centaines de milliers de personnes n’ont pas été comptées à leur arrivée.
Bien que tout cela soit ridicule au point de paraître risible, Sturge est très efficace pour expliquer, avec des exemples humains, comment de mauvaises données affectent des vies. Les lecteurs de Hello World d’Hannah Fry ou Invisible Women de Caroline Criado Perez seront familiers avec l’idée que des humains biaisés créent des programmes d’intelligence artificielle biaisés. Ici, nous voyons leurs effets directs. Jusqu’en 2020, il y avait une boucle de rétroaction dans l’algorithme utilisé par le ministère de l’Intérieur pour refuser les visas aux personnes risquant de dépasser la durée de séjour : « L’un des facteurs déterminant si un pays figurait sur la liste des « suspects » était la fréquence à laquelle les demandes de visa de ce pays refusé. Il a continué à refuser des Nigérians au motif qu’il s’agissait d’une nationalité « suspecte », mais chaque fois qu’un Nigérian était refusé… cela alimentait les soupçons existants du système.
Sturge est admirablement pragmatique quant aux difficultés de garder un œil sur les populations. « C’est une entreprise désordonnée que de compter les gens », dit-elle. Elle semble fantasmer sur les « énormes avantages d’avoir un registre complet de la population » comme première étape vers la collecte et la consolidation des données, mais elle est également claire sur les dangers potentiels :
«En 2018 et 2019, une politique obligeant les électeurs à présenter une pièce d’identité dans les bureaux de vote a été testée dans des zones sélectionnées lors des élections locales anglaises. Par la suite, lorsqu’on a demandé au gouvernement sa réponse à la théorie selon laquelle les personnes issues de minorités ethniques auraient plus de mal à produire la pièce d’identité nécessaire et donc à ne pas voter, il a affirmé que les pilotes n’avaient montré « aucun impact sur un groupe démographique particulier ». Mais ce n’était pas strictement vrai. Les pilotes n’avaient pas collecté de données sur l’origine ethnique des personnes, il n’était donc même pas possible de tester cette théorie.
Bien que certaines personnes craignent naturellement de divulguer des informations privées au gouvernement, c’est généralement la manquer de de documentation qui désavantage les gens. Dans les années 1950 et 1960, le gouvernement n’a donné aux nouveaux arrivants des pays du Commonwealth aucun document prouvant leur statut, tendant un « piège » à une génération d’immigrants et menant au scandale Windrush. Sturge considère cela comme « une leçon sur l’importance de conserver… de bonnes données ».
Pour un employé de la Chambre des communes, Sturge est étonnamment et souvent d’une manière rafraîchissante politique. Se référant à la preuve que la population carcérale devrait augmenter de 15 % pour entraîner une réduction de la criminalité de 1 %, elle dit sans ambages : « La prison ne ‘fonctionne’ clairement pas sur cette métrique. Elle est en colère contre les universitaires qui permettent à de mauvaises données de passer à travers le processus d’examen par les pairs, considérant parfois le milieu universitaire comme «une sorte de conspiration de personnes se grattant le dos pour un coup de pouce de carrière». Se référant à la débâcle de Wizz Air, elle se souvient : « Nous ne semblions pas pouvoir compter les personnes entrant et cela, pour beaucoup de gens, semblait être un signe que l’immigration elle-même était hors de contrôle… Reprendre le contrôle était finalement ce qu’était le référendum européen. tout sur. » Mais elle n’est pas politique partisane ni manifestement partisane. « L’affirmation selon laquelle nous envoyions à l’UE 350 millions de livres sterling par semaine était manifestement fausse… [but the] La campagne Reste a également produit des affirmations chiffrées sommaires.
Le livre est tellement plein d’exemples, d’anecdotes et de chiffres, allant des lycées à la police en passant par les réfugiés climatiques et vice-versa, qu’il a tendance à être écrasant. Et il y a un manque frustrant de solutions. Décidément, nous sommes dans une énorme embrouille, mais que faire pour en sortir ? Dépenser beaucoup d’argent serait un moyen. Sturge est jaloux de l’abondance de données disponibles dans les paris sur le football et déclare: « Là où il y a de la volonté – et beaucoup d’argent – la qualité des données que nous pouvons obtenir est vraiment assez étonnante… et pourtant nous ne savons pas combien de personnes sont éligibles pour voter, combien de personnes sont mortes de Covid-19, ou si la criminalité augmente ou diminue. Mais jeter de l’argent au niveau du premier ministre sur le problème ne semble pas une priorité pour un pays actuellement confronté à une baisse de 7% de son niveau de vie.
D’un autre côté, quiconque lit ce livre passera par la suite sa vie à considérer des phrases telles que « une baisse de 7% du niveau de vie » comme absurde et nécessitant un défi solide, et Sturge devrait considérer cela comme une victoire – parce que le public et les médias ont aussi notre rôle à jouer. Nous avons raison d’exiger de nos politiciens des informations honnêtes, précises et bien documentées, mais il est injuste de s’attendre à ce qu’ils aient toutes les réponses, tout le temps. Cela ne fait qu’encourager l’utilisation de mauvaises données. « Il ne s’agit pas que nous devenions tous de petits experts », dit-elle. « Il s’agit de nous d’être curieux et d’exiger des explications. »
Il est difficile de critiquer le livre pour être léger sur les réponses, alors, alors qu’il est si bon pour inspirer la curiosité et l’envie de défier. Comme tous les bons politiciens le savent, la première étape vers la résolution d’un problème est de l’identifier, de le définir et de le quantifier. Et qui de mieux pour faire cela qu’un statisticien de la Chambre des communes avec une hache à moudre pour améliorer les données pour tout le monde?