J'ai zappé l'autre ref que j'avais hier sur tester la normalité:
c'est issu du site qui fait le Student en ligne
http://www.sthda.com/french/wiki/wiki.p ... s-moyennes"
Comment tester la normalité des données?
Lorsque la taille des échantillons est suffisamment grande (n >30), on peut ignorer le test de normalité sans problème majeur.
Le théorème central limite nous dit que, la distribution de l’échantillonnage tend à suivre la loi normale lorsque la taille est grande ( n > 30).
En revanche, pour être rigoureux, la normalité peut être vérifier par une inspection visuelle [Histogramme, Q-Q plot (quantile-quantile plot)] ou par des tests de significativité.
L’histogramme permet un jugement visuel à savoir si la distribution est une courbe en cloche (courbe de Gauss).
Le test de significativité compare la distribution d’un échantillon donné à celle de la loi normale et renvoie une p-value.
Plusieurs méthodes existent pour le test de normalité, notamment le test de Kolmogorov-Smirnov (K-S) et le test de Shapiro-Wilk.
L’hypothèse nulle (H0) de ces tests est : " L’échantillon suit une loi normale“. Si le test est significatif, la distribution ne suit pas une loi normale.
La méthode de Shapiro-Wilk est le plus largement recommendé pour le test de normalité et il plus puissant que le test de K-S. Il est basé sur la corrélation entre les données et les scores théoriques de la loi normale.
Notez que le test de normalité est sensible à la taille des échantillons. Les échantillons de petite taille passe très souvent le test de normalité. Par conséquent, il est important de combiner une inspection visuelle et un test de significativité pour prendre la bonne décision.
Question : Faire ou ne pas faire le test de normalité?
Le test de normalité et les autres hypothèses faites par les tests paramétriques devraient être pré-testés avant de continuer avec le test principal de comparaison de moyennes. Par exemple, dans le domaine de la recherche médicale, la distribution normale des données est une exception plutôt qu’une règle. Dans de telles situations, l’utilisation des tests paramétriques n’est pas encouragée. Les tests non-paramétriques, tel que le test de Wilcoxon, sont recommandés.
Dans la fonction rquery.t.test(), le test de normalité de Shapiro-Wilk est utilisé et, une histogramme et un Q-Q plot sont automatiquement dessinés pour une inspection visuelle."
L'important est de savoir quoi faire lorsqu'il n' y a rien à faire.