Bonjour,
Je suis étudiant en M1 de Statistique et je dois étudier des données en utilisant le logiciel SAS. Cet exercice fait partie de mes examens, donc je tiens à préciser que je cherche seulement de l'aide dans ma compréhension, et aucunement une résolution de l'exercice.
Je dispose d'environ 300 données avec une variable explicative et 8 régresseurs. J'ai d'abord réalisé une PROC REG de manière classique. J'ai vérifié les hypothèses d'homoscédasticité (à l'aide de l'option SPEC) et de normalité des résidus (à l'aide d'une PROC UNIVARIATE NORMAL).
Dans la suite de l'exercice, on me demande de faire une transformation Box-Cox en y -> ln(y). Je n'ai pas vu la transformation Box-Cox en cours mais je suis allé m'instruire sur internet. Ensuite, on me demande de refaire la régression et de retester les hypothèses. La p-value associé au test d'homoscédasticité augmente, elle passe de 0.055 (c'était un peu limite avant) à 0.09 environ. En revanche, pour la normalité, alors que j'avais avant une p-value de 0.5, elle vaut maintenant 0.0001. Donc, après la transformation, j'ai complètement perdu la normalité de mes données.
Je trouve que c'est évidemment très étrange, parce que si on me demande ça dans l'exercice, c'est pour améliorer le modèle (notamment à cause, à mon avis, de la faible p-value du test d'homoscédasticité).
J'ai réalisé une PROC TRANSREG pour faire le Box-Cox avec SAS qui me dit d'utiliser un lambda de 0,25. J'ai aussi transformé les données de cette façon mais j'obtiens aussi un test de normalité significatif.
Est-ce qu'il y a une explication à cela ?
Les données sont accessibles ici : http://huitzi.fr/Ozone.TXT
Je le répète, c'est un travail qui comptera dans mes examens, donc je ne cherche pas une solution, simplement de l'aide pour m'aiguiller.
Merci !
