Matrice de corrélations et valeurs aberrantes sous R
Discutez d'informatique ici !
-
jeje56
- Membre Irrationnel
- Messages: 1184
- Enregistré le: 16 Jan 2007, 21:10
-
par jeje56 » 01 Fév 2022, 23:44
Bonjour à tous,
Je cherche à ne pas tenir compte de certaines valeurs aberrantes lors du calcul d'une matrice de corrélations sous R sans retirer d'individu à part entière. Plus précisément, je souhaite retirer seulement certaines valeurs du profil d'un ou plusieurs individus. Est-ce possible ? Auriez-vous une procédure pour y parvenir ?
Je vous remercie de votre aide précieuse !
-
phyelec
- Membre Rationnel
- Messages: 948
- Enregistré le: 06 Mar 2020, 17:47
-
par phyelec » 02 Fév 2022, 14:52
Bonjour,
Vous pourriez peut-être faire une étude statistique (moyenne ,écart-type) et ne retenir que les valeurs à 1 ou 2
par exemple.
-
Sylviel
- Modérateur
- Messages: 6466
- Enregistré le: 20 Jan 2010, 13:00
-
par Sylviel » 02 Fév 2022, 19:56
Bonjour,
je ne suis pas sûr que ce soit si simple.
@phyelec : tu ne peux pas "supprimer les valeurs a plus de 2\sigma" si tu veux faire du calcul de corrélation.
En effet "supprimer la valeur" voudrait dire supprimer l'individu complet, ce que ne veut pas faire le demandeur.
Ou alors il faut considérer la valeur "abhérrante" comme une valeur manquante et chercher par exemple à maximiser la vraisemblance typiquement avec un algorithme EM (voir par exemple :
https://www.jstor.org/stable/2347491)
Personnellement j'aurais plutôt tendance à faire de l'estimation de "shrunk covariance" (
https://scikit-learn.org/stable/modules/covariance.html). Mais je ne suis pas expert du sujet.
Merci de répondre aux questions posées, ce sont des indications pour vous aider à résoudre vos exercices.
-
jeje56
- Membre Irrationnel
- Messages: 1184
- Enregistré le: 16 Jan 2007, 21:10
-
par jeje56 » 02 Fév 2022, 22:34
Merci phyelec et Sylviel pour les conseils. Sylviel, je vais étudier de plus près les liens fournis
Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 5 invités