serenovia_statistique2

Gare aux statistiques!

La statistique est toujours la troisième forme du mensonge.

En 1980, Jacques Chirac alors candidat à l’élection présidentielle pour le Rassemblement pour la République déclarait dans un entretien donné au mensuel Le Nouvel Observateur :

« Faites attention, la statistique est toujours la troisième forme du mensonge. »

Dans la bouche d’un homme politique de ce niveau habitué à toutes les roueries et toutes les manipulations, la réflexion doit être prise au sérieux.

La statistique est une branche des mathématiques. Elle concerne l’étude des systèmes où interviennent des données en grand nombre. Elle vise à la collecte, l’analyse mathématique et l’interprétation de grandes quantités de variables. De fait, c’est une science typiquement moderne liée à la massification des sociétés et à l’anonymisation des individus. La statistique n’aurait pu naître dans des petites sociétés de type médiévales. Bien au contraire, elle prend son essor durant la montée en puissances des États-nations. Les grandes armées modernes et les administrations gouvernementales en sont particulièrement friandes.

Les études statistiques inondent littéralement les médias, que ce soit sur support papier, audiovisuel ou sur les sites d’informations présents sur Internet. Dans les domaines de la recherche clinique, l’usage des méthodes statistiques est omniprésent et sert à valider des protocoles médicaux (essai clinique en double aveugle). Le domaine connexe des études en diététique y a recours tout autant. Les compagnies d’assurances s’en servent comme outils pour leurs calculs de primes d’assurance. Les démographes ont pour principal outil quantitatif la statistique (calcul de mortalité et d’espérance de vie). Les économistes les emploient pour mesurer le niveau de développement des sociétés (PIB/habitant, répartition des classes sociales). La profusion d’études d’opinions dans le champ politique s’appuie enfin et encore sur l’utilisation de méthodes statistiques.

Les études statistiques sont souvent au cœur des conversations du quotidien et sont prises comme arguments d’autorité dans de nombreuses joutes verbales. Que l’on songe par exemple à ces insipides batailles de chiffres entre experts invités sur des plateaux de télévision. Les statistiques semblent par ailleurs relativement simples à comprendre pour le simple citoyen. En réalité, les méthodes statistiques nécessitent extrême rigueur et subtilité dans l’analyse, que seuls des professionnels avertis peuvent réellement maîtriser. Une fois tordus, les chiffres peuvent dire en effet n’importe quoi.

Pour bien saisir le pouvoir de manipulation par les chiffres, le plus simple est de raisonner sur une singularité statistique connue sous le nom de paradoxe de Simpson. Le britannique Edward Simpson ne découvrit ce paradoxe, pourtant relativement simple à présenter, qu’en 1951, preuve s’il en est de la grande modernité du concept de statistique.

Considérons deux boites A et B et deux types de boules de différentes couleurs : rouges et blanches. Supposons maintenant que la boite A contienne 1 boule rouge et 2 boules blanches et que la boite B en contienne quant à elle 5 rouges et 5 blanches (cf. fig. 1).

Il est clair que la probabilité de tirer une boule rouge dans la boite A est de 33% (1 boule rouge sur 3 boules au total). De même, la probabilité de tirer une boule rouge dans la boite B est de 50% (5 boules rouge sur 10 boules au total). Clairement, la proportion de boules rouge est supérieure dans la boite B (50%) à celle de la boite A (33%). Répétons l’expérience avec deux nouvelles autres boites notées A’ et B’, contenant 8 rouges et 3 blanches pour A’ et 6 rouges et 2 blanches pour B’ (cf. fig. 2).

Pour cette deuxième expérience, la proportion de boules rouges dans B’ est de 6/(6+2)=6/8=75% et celle de boules rouges dans A’ est de 8/(8+3)=8/11=73%. Dans les deux expériences, les boites B contiennent plus de boules rouges en proportion que les boites A.

Le paradoxe de Simpson intervient lorsque l’on regroupe les deux boites B et B’ dans une seule même boite B’’ et les deux boites A et A’ dans une seule boite A’’ (cf. tableau 1 et fig. 3).

Puisque dans les deux cas, les boites B contiennent plus en proportion de boules rouges que les boites A, on s’attend intuitivement à ce qu’après regroupement, ce soit la boite B’’ qui en contienne le plus (par rapport à A’’). Eh bien non !

En effet, après regroupement la boite A’’ contient 9 rouges sur 14 boules, soit 64% de boules rouges. La boite B’’ contient quant à elle 11 rouges sur 18 boules, soit 61% de boules rouges. Autrement dit, lors de l’opération de regroupement les proportions se sont inversées. Même si, prises séparément, les boites A et A’ contiennent proportionnellement moins de boules rouges que de boules blanches que les boites B et B’, le simple fait de les regrouper inverse les proportions. On imagine facilement les conséquences que cela peut avoir dans le domaine politique lorsque des coalitions se forment lors d’élections. En fait, on confond comparaison de deux proportions avec comparaison de deux probabilités.

Source : wmbx

Leave a Reply

Your email address will not be published.


*