Modèle économétrique pour expliquer une variable

Réponses à toutes vos questions après le Bac (Fac, Prépa, etc.)
Titahn
Membre Relatif
Messages: 282
Enregistré le: 06 Mar 2013, 15:51

Modèle économétrique pour expliquer une variable

par Titahn » 06 Mar 2013, 16:32

Bonjour,

Nouveau dans le coin (mais je suis quand même passer "sauver" une âme en peine avant, histoire d'équilibrer mon karma sur ce forum ^^), j'apprécierais fortement un coup de main sur un problème économétrique.

J'ai une assez grosse base de données (plusieurs centaines d'individus, et une vingtaine de paramètres). Pour simplifier on dira que j'ai comme variable à prédire y, et comme variables prédictives x0, x1... x20.

Le but de l'exercice est donc d'expliquer y en utilisant le modèle le plus adapté.

Je suis globalement hum... Très mauvais en économétrie, et la joie de la fac fait que je n'ai pas vraiment de support de cours (heureusement notre ami google est là). Du coup mes questions sont les suivantes :

-Dans les données, j'ai une variable qui de temps en temps a un champ vide. Comment gérer ça ? Dans un premier temps j'ai utilisé les MCO sans les individus avec ces variables, et je me demandais ensuite s'il serait judicieux de remplir artificiellement les champs vide à partir du modèle généré sans ces individus, puis d'à nouveau faire un modèle global qui prendra en compte tout le monde. Ça me semble dommage d'ignorer 19 variables prédictives parce que la 20ème est vide. Pour info il y a en gros 3% de personnes avec un champ vide.

-J'ai pas mal de variable binaires, dont une, x3 qui est égale à 1-x2+x1 (un truc classique du genre 1 pour x1 si moins d'1m50, 0 sinon. 1 pour x2 si entre 1m50 et 1m80, 0 sinon. Et 1 pour x3 si plus d'1m80, donc forcément la somme des trois vaut 1). Dans ce cas il y a une multicolinéarité parfaite, et je peux donc supprimer x3 (ou x2 ou x1) du modèle donc ? Quelle que soit la méthode utilisée ?

-Comment déterminer quel est le meilleur modèle ? En appliquant les MCO (sur Gretl) j'ai un R² de 0.116, et seulement 5 variables avec un p-value en dessous de 0.1. Du coup j'suis preneur de tout conseil à ce niveau là : quels autres paramètres sont importants pour déterminer si ce modèle est bon, quels autres modèles utiliser, comment déterminer s'ils sont meilleurs, etc.

Merci d'avance infiniment pour votre aide !

En attendant j'retourne "sauver" mon prochain =D



 

Retourner vers ✯✎ Supérieur

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 39 invités

Tu pars déja ?



Fais toi aider gratuitement sur Maths-forum !

Créé un compte en 1 minute et pose ta question dans le forum ;-)
Inscription gratuite

Identification

Pas encore inscrit ?

Ou identifiez-vous :

Inscription gratuite