par LB2 » 23 Mai 2020, 09:35
Bonjour Alex,
Ce qui te permet de savoir quelle est la (ou les) variables dépendante(s) et quelle est la variable indépendante du modèle, c'est l'objectif de l'étude.
Ici, on étudie l'influence du polluant NO2 (variable de la colonne NO2) sur la santé (variable de la colonne Mortalité). On étudie aussi l'influence de l'éducation (variable de la colonne Education) sur la santé.
C'est parce que l'on a fait ce choix que dans ce modèle, Mortalité est la variable dépendante, et NO2 et Education sont les deux variables indépendantes.
Dans une première approche, on utilise le modèle de régression linéaire :
y = ax + b
ou, si l'on considère deux variables indépendantes,
y = a1x1 + a2x2 + b
On pourrait également utiliser d'autres formes de régression, comme les régressions log linéaires ou log log.
Ici, l'énoncé (première phrase) semble indiquer qu'on utilise
y = a1x1 + a2x2 + b, avec y la mortalité, x1 le NO2 et x2 l'éducation.
Dans le cadre de ce modèle, la valeur de a1 représente l'influence spécifique de x1 sur y, toutes choses égales par ailleurs.
On pourrait également, et plus simplement, utiliser y = ax+b avec y la mortalité et x le NO2, en ignorant la variable éducation. La contrepartie est qu'on perdrait de l'information.