je suis actuellement en train de coder sous python une foret aléatoire. Cependant, je souhaite appliquer des poids spécifiques à mes données.
mon code, après avoir séparé en échantillon d'entrainement et de test:
Sur l'échantillon X_train (qui contenait entre autres les poids) j'ai créé un vecteur de poids Vect_Poids
- Code: Tout sélectionner
RF_reg= RandomForestRegressor(criterion='poisson', max_depth=9, min_samples_leaf=6, min_samples_split=5, n_estimators=12)
RF_reg.fit(X_train,y_train,sample_weight=Vect_Poids)
J'ai un doute sur ma méthode, n'étant pas très à l'aise avec python. Je voudrais savoir si ces poids sont bien appliqués aux bonnes données de mon data frame . En gros si l'ordre de départ est bien respecté...
Pour un peu de contexte, il s'agit de poids IPCW calculés à partir de la fonction de survie de Kaplan Meier, pour régler le problème de censure à droite dans mes données.
Merci beaucoup pour votre aide,