|
Les
chiffres sont aux
analystes ce que les lampadaires sont aux ivrognes : ils fournissent bien plus
un appui qu'un éclairage. Jean Dion Dans
toute statistique, l’inexactitude du
nombre est compensée par la précision des décimales. Alfred Sauvy Il
y a trois degrés dans le
mensonge : le mensonge simple, le fieffé mensonge et la statistique; pourtant les statistiques sont
souvent utiles, alors que faire ? Les
statistiques, c'est comme le Bikini, ça
donne des idées, mais ça cache l'essentiel. Jacques Duhamel, repris par Coluche Je
ne crois aux statistiques que lorsque je
les ai moi-même falsifiées. Winston Churchill |
Voir Pensées & humour
Statistiques – Introduction Quelques bases sur une
science mystérieuse et subtile. Une science mathématique qui
mouline de grandes quantités de nombres pour en extraire un jus substantifique. Quel est l'état d'esprit des
statisticiens? Que cherchent-ils? Quelles sont les
difficultés, les pièges. |
|
|
Vous connaissez les sondages; vous avez-vous même été
sondé; alors, vous êtes familier avec les statistiques.
Vous avez soudain envie de connaître la composition des
familles autour de chez-vous. Vous comptez deux enfants chez l'un, quatre
chez l'autre, puis aucun un peu plus loin. Tiens, au nord de chez moi, les
familles sont plus nombreuses. Ils ont plutôt trois enfants, alors qu'au sud
c'est un tout au plus un seul. En procédant à
cette analyse vous commencez à faire des statistiques.
Comment dégager des règles générales dans une
collection d'individus, d'objets, de faits? Voilà l'objet des statistiques.
Les choses étant données, comment les caractériser dans leur ensemble. |
|
|
Statistique désigne à la fois
un ensemble de données d'observation, et
l'activité qui consiste dans leur recueil, leur
traitement et leur interprétation. D'un coté le
recueil d'informations; de l'autre, la
méthodologie pour les traiter.
Ce terme aurait été crée en 1746 par G. Achenvall
(Statistik) dérivé de Staatskunde, sciences politiques, sciences sociales.
La statistique ou recueil d'informations est
fondamentale dans la vie politique, économique ou sociale sur la planète.
Les ordinateurs, avaleurs de données par nature, ont
donné son essor à cette science. Les outils mathématiques se sont développés
à l'envie pour faire "parler" ces chiffres: tris de toutes sortes,
lois de régressions, lois de probabilité, inférences statistiques.
Le calcul
de probabilité est utilisé en statistique, par exemple, pour |
|
|
Appliquées à des systèmes comportant un grand nombre de
particules: gaz, électrons de
conduction, photons …
Face à de l'ordre
de 1023 particules, les calculateurs
les plus puissants ne sauraient calculer les équations modélisant leur comportement.
Sans compter avec les lois de la mécanique quantique d'Heisenberg qui ajoutent une
imprécision sur la position ou la vitesse des particules.
La mécanique statistique permet de caractériser l'état
global des particules, leur état macroscopique.
Par exemple, calcul de la fonction de distribution
associée à un nombre donné de particules pour chaque valeur de l'énergie. |
|
|
Statistic A function of a sample; in other words, a quantity
calculated from a set of observations. Often a statistic is an estimator
for a population parameter. For example, the sample mean,
sample variance and sample median are each a statistic The sum of observations in a sample is also a
statistic but this is not an estimator. Statistic model A statistical description of an underlying system,
intended to match a real situation as nearly as possible. The model for a population is fitted to a sample by
estimating the parameters in the model. It is the possible to perform hypothesis testing, construct confidence intervals (intervalles de confiance) and draw inferences about
the population. |
Oxford concise
dictionary of mathematics
|
|
Pièges
pour le choix de ce qui va être collecté, compté, mesuré.
Naïveté, simplification trop grossière.
Manque de culture dans une discipline subtile.
Intention (consciente ou non) de tromper par choix
idéologique.
But
de l'échantillon représentatif
Faire émerger l'essentiel à partir d'une masse de
chiffres.
Nécessité de respecter les proportions dans la
diversité des populations
concernées.
Passage du quantitatif au qualitatif.
Pourcentages
ou moyennes seulement
C'est suffisant si le phénomène suit un modèle
probabiliste clair; mais
Écrasent la diversité et ne disent pas grand-chose sur
les causes.
Causalité et
corrélation
Leur confusion est une des plaies de la statistique
hâtive.
Des variables peuvent être corrélées, c'est-à-dire se
comporter de façon semblable, sans que pour autant la variation de l'une soit
cause de la variation de l'autre.
S'il y a une corrélation,
il faut poursuivre l'étude pour aboutir aux causes.
D'autant plus s'il y a des intérêts économiques et politiques en jeu.
Paradoxes,
pièges
Voici la situation constatée: exemple typique issu
d'une enquête d'après-guerre:
Dans chaque région de France (ici A et B), les agriculteurs consommaient
plus de pommes de terre que les non-agriculteurs et, pour l'ensemble de la
France, c'était le contraire.
Expérimentation
impossible
Pour tester un facteur en physique, on fixe tous les autres et on
ne fait varier que celui-là. Dans le monde concret où s'exerce la
statistique, tous varient en même temps.
Au XIXe siècle avec Laplace, Poisson … la statistique mathématique
était désarmée face à ces problèmes.
Au XXe siècle, progrès considérables:
avancées mathématiques (analyse multivariée, les plans d'expérience, la
statistique des processus…) et nouveaux moyens de calcul.
La science des statistiques devient très technique.
Petits
échantillons
Une théorie statistique des petits échantillons a été
construite par les Britanniques au début du XXe siècle: théories
des intervalles de confiance et des tests.
Il faut bien préciser et contrôler les probabilités
d'erreurs.
Attention, même un grand échantillon peut être biaisé
ou en évolution, les épreuves peuvent ne pas être indépendantes
Pertinence
économique: quand s'arrêter face au coût de l'étude
La théorie statistique des décisions d'Abraham Wald
peut aider à la prise de décision.
Mais il faut s'en remettre au jugement des spécialistes
et des personnes impliquées.
Évolution
La statistique classique cherche à remonter des effets
aux causes dans un cadre aléatoire, mais en supposant l'existence d'un modèle
probabiliste sous-jacent. Les statisticiens travaillent aussi sur des
phénomènes moins structurés.
Aujourd'hui on sait traiter assez bien des ensembles de
données variées, voire partiellement manquantes, y compris des statistiques
d'événements rares, de phénomènes extrêmes.
Les progrès mathématique sont nécessaires pour tirer
profit de la puissance de calcul croissante (structure des espaces de grande
dimension).
En
conclusion, le pire danger serait de
faire trop confiance aux statistiques ou
de les ignorer. |
Librement interprété d'après: Les
statistiques mathématiques, leurs pièges, leurs succès - Nicolas DUTENT –
21 janvier 2014 - Médiapart
Impliquant:
Pierre Crépel, historien des
statistiques, Thibaut Espinasse,
mathématicien (Université Lyon 1),
Colin Faverjon,
élève de l'ENS de Lyon, et Bastien
Marchina, mathématicien (Université Montpellier 2)
Suite |
Statistiques
– Débutant
Statistiques – Glossaire |
Voir |
Probabilités – Calculs |
Cette page |