Etude de la normalité d'une distribution

Utilisation du test de Kolmogorov-Smirnov

Utilisation du test de Kolmogorov-Smirnov

Ce test étudie l'écart entre :
la fonction des probabilités cumulées de l'échantillon
la fonction des probabilités cumulées de la loi théorique

On regarde pour tous les points cet écart. Et on garde la valeur la plus élevée en valeur absolue.
Pour valider un ajustement à une valeur théorique on compare à une valeur théorique dans une table. On choisit les valeurs suivant un critère bilatéral car on ne cherche pas à rejeter uniquement si la courbe est en dessous ou au dessus mais dès qu'elle ne suit plus la loi normale.

Cas de la loi normale :
1 trier les valeurs dans l'ordre croissant
2 calculer la moyenne et l'écart-type
3 faire le tableau pour le calcul des écarts :

Utilisation d'excel :
la première colonne contient les indices des valeurs de 1 à N
une colonne contient les valeurs triées
la suivante contient la fréquence cumulée qui pour l'individu i = i/N
la suivante contient la fréquence théorique d'une loi normale de moyenne m et d'écart-type s pour chaque valeur x :
=loi.normale(x,m,s,VRAI)
puis on fait la différence entre les deux colonnes précédentes =abs(fc-ft)
la valeur retenue pour le test est la plus grande =max(diff)
On lit la valeur dans la table des valeurs limites dans les colonnes bilatéral.

Table des valeurs critiques du test de Kolmogorov-Smirnov pour un échantillon

N

Taille de l'échantillon
Niveau de signification de D   N

Taille de l'échantillon
Niveau de signification de D
  bilatéral   unilatéral     bilatéral   unilatéral
  0,05 0,01   0,05 0,01     0,05 0,01   0,05 0,01
5 0,565 0,669   0,509 0,627   24 0,269 0,323   0,242 0,301
6 0,521 0,618   0,468 0,577   25 0,264 0,317   0,238 0,295
7 0,486 0,577   0,436 0,538   26 0,259 0,311   0,233 0,290
8 0,457 0,543   0,410 0,507   27 0,254 0,305   0,229 0,284
9 0,432 0,514   0,388 0,480   28 0,250 0,300   0,225 0,279
10 0,410 0,490   0,369 0,457   29 0,246 0,295   0,221 0,275
11 0,391 0,468   0,352 0,437   30 0,242 0,290   0,18 0,270
12 0,375 0450   0,338 0,419   31 0,238 0,285   0,214 0,266
13 0,361 0,433   0,326 0,404   32 0,234 0,281   0,211 0,262
14 0,349 0,418   0,314 0,390   33 0,231 0,277   0,208 0,258
15 0,338 0,404   0,304 0,377   34 0,227 0,273   0,205 0,254
16 0,328 0,392   0,295 0,366   35 0,224 0,269   0,202 0,251
17 0,318 0,381   0,286 0,355   36 0,221 0,265   0,199 0,247
18 0,309 0,371   0,279 0,346   37 0,218 0,62   0,197 0,244
19 0,301 0,363   0,271 0,337   38 0,215 0,258   0,194 0,241
20 0,294 0,356   0,265 0,329   39 0,213 0,255   0,192 0,238
21 0,287 0,344   0,259 0,312   40 0,210 0,252   0,189 0,235
22 0,281 0,337   0,253 0,314   >40 1,36/
racine(N)
1,63/
racine(N)
  1,22/
racine(N)
1,52/
racine(N)
23 0,275 0,330   0,248 0,307      

Modifiée d'après Siegel 1956.


pour N>40 critère test Kolmogorov-Smirnov
unilatéral
risque 5% : 1,36/racine(N)
risque 10% : 1,63/racine(N)
bilatéral
risque 5% : 1,22/racine(N)
risque 10% : 1,52/racine(N)

Si la valeur calculée est supérieure à la valeur lue dans la table on peut rejeter la normalité au risque de se tromper alpha choisi.

Le classeur colorisation et segmentation fait aussi une vérification de la normalité en utilisant ces méthodes.

droite de Henry test du khi ² test de Shapiro-Wilk test de Kolmogorov Smirnov

gestion de production et qualité