Bonjour à tous,
Je dispose de base de données suivante, il s'agit de données de candidature MonMaster dans une Université:
ident = identifiant (aucune signification particulière)
annee_naissance = année de naissance
date_bac= année d'obtention du bac ou du diplôme équivalent
distance = distance approximative entre la localisation et l'Université
venu = 1 si la personne a payé les droits d'inscription (0 sinon)
classement = place dans le classement soumis par l'équipe pédagogique du master (0 = Non classé)
Type_bac=type de baccalauréat
parcours_vis_aucun= 1 si la personne n'a mentionné aucun parcours particulier pour la poursuite d'études en
parcours_vis=parcours visé en M2
Civil= 1 pour un homme 2 pour une femme (convention numéro INSEE)
dernier_semestre_connu = note mentionnée par la personne pour le dernier semestre validé connu à la date de candidature
Je dois choisir un modèle et l'expliquer. Je pensais prendre comme variable à expliquer "Classement", en revanche, pour les variables explicatives, je ne sais pas comment les définir et expliquer pourquoi. Sinon, je pensais choisir comme modèle E[class / dernier_semestre, distance] et éventuellement les types de bacs (stmg et L n'étant pas significatifs).