MaximeRouche a écrit:Bonjour,
Dans mon cours de statistiques descriptives de première année d'éco-gestion, on nous a enseigné la régression linéaire par la méthode des moindres carrés. J'ai bien saisi comment calculer les différents parètres pour obtenir l'équation de y en x (ou de x en y).
Mais on nous parle aussi des "résidus de la régression", que l'on calcule avec cette formule:
Ei=ei-êi
Pourriez-vous m'expliquer à quoi correspondent ces résidus, et ce que représente cette formule, à quelles données doit-on appliquer cette formule?
Merci d'avance!
Bonjour,
Il s'agit tout simplement de l'écart entre l'estimation de la régression avec la vraie valeur. C'est à dire pour chaque point, l'écart en ordonnée entre la vraie valeur et la droite de régression.
Pour le formuler, si les (xi,yi) sont les vrais points, ta régression t'a fourni pour chaque yi une estimation zi=a.xi+b (a et b étant les coefficients de la régression)
Alors les résidus sont les valeurs Ei = yi-zi. (ou dans ta notation tu avais ei=yi et êi=zi je suppose).
C'est l'erreur commise par la régression donc (d'où le 'E' comme erreur, écart...)
Et formellement le résidu devrait être défini avant la régression, puisque effectuer la régression (ie trouver a et b) consiste à minimiser la somme des carrés des résidus... C'est en ce sens que la droite de régression est la "meilleure" droite passant "au plus près" des points (xi,yi).
Est-ce plus clair ?
Damien