Bonjour,
je n'arrive pas du tout à résoudre ces 2 exercices suivants. J'aimerai avoir
un petit peu d'aide. Merci beaucoup d'avance:
(agrandir la fenêtre pour lire les tableaux)
Exercice 1: régression multi-linéaire.
Y X1 X2
20 7 10
21 4 15
19 6 3
15 3 0
9 3 1
19 4 9
4 1 0
21 3 17
Au cours d'une expérience on a obtenu 8 mesures d'une grandeur Y en fonction
de deux variables explicatives X1 et X2
a) Etablir le tableau de corrélation de Y, X1 et X2. Peut-on affirmer que Y
est corrélé avec X1 et X2 et, par contre, que X1 et X2 sont indépendants ?
(faire les tests adéquats au seuil de risque de 5%)
b) Calculer les coefficients de régression linéaire (modèle Y = A1X1 +
A2X2) avec leur intervalle de confiance à 95%
c) Prouver la validité du modèle et montrer que les coefficients sont
significativement différents de 0 (prendre un risque a de 5% et de 1%)
Exercice 19: Prix des voitures.
On a étudié le prix de 20 voitures en fonction de certains critères (taille,
puissance, finition etc)
Marque prix (?) cylindrée puissance longueur largeur
poids vitesse finition
A 15280 1350 79 393
161 870 165 B
B 20000 1588 85 468
177 1110 160 TB
C 14800 1294 68 424
168 1050 152 M
D 14100 1222 59 412
161 930 151 M
E 17450 1585 98 439
164 1105 165 B
F 17740 1297 82 429
169 1080 160 TB
G 16150 1796 79 449
169 1160 154 B
H 16000 1565 55 424
163 1010 140 B
I 23800 2664 128 452
173 1320 180 TB
J 13270 1166 55 399
157 815 140 M
K 21200 1570 109 428 162
1060 175 TB
L 17000 1798 82 445
172 1160 158 B
M 22000 1998 115 469 169
1370 160 TB
N 17500 1993 98 438
170 1080 167 B
O 19700 1442 80 431
166 1129 144 TB
P 14000 1769 83 440
165 1095 165 M
Q 16350 1979 100 459
173 1120 173 B
R 11050 1294 68 404
161 955 140 M
1) Calculer les coefficients du modèle multilinéaire du prix en
fonction de tous les autres paramètres sauf la finition. Tester la
signification de la corrélation et tester si tous les coefficients du modèle
sont significativement différents de 0. (a = 5%)
2) Les résultats du calcul précédent sont décevants. Etablir la matrice
de corrélation de toutes les variables explicatives. (toutes les variables
excepté le prix). Quelles sont les corrélations significatives ? Trouver des
explications évidentes pour interpréter les corrélations les plus élevées.
Quelles sont les variables que l'on pourrait supprimer ?
3) Effectuer la même étude en rajoutant la variable finition (associer
à M la note 5, à B la note 10 et à TB la note 15)
4) Effectuer une régression pas à pas dans le sens de la suppression
des variables les plus corrélées. Combien faut-il garder raisonnablement de
variables dans le modèle ?
5) Effectuer une régression pas à pas dans le sens de la suppression en
imposant de garder la puissance et la finition comme variables.
6) Créer de nouvelles variables explicatives en effectuant des
combinaisons non linéaires raisonnables entre les variables explicatives
(par exemple le produit poids puissance) Tester par régression pas à pas si
ces variables sont éliminées.
7) Faire une Analyse en composantes principales du problème. Combien
faut-il retenir de composantes pour expliquer 90% de la variabilité du prix
?. Faire un calcul de régression linéaire en fonction des composantes
retenues et comparer le coefficient de corrélation multiple à celui trouvé à
la question 4.
8) Quels sont les critères que vous mettriez en avant si vous aviez à
éditer une plaquette publicitaire pour vendre des voitures. Est-ce que cela
correspond à ce que l'on observe en pratique ?
MERCI D'AVANCE POUR VOTRE AIDE
