Statistique / Stratification / Homogénéité
Réponses à toutes vos questions après le Bac (Fac, Prépa, etc.)
-
Ineedi2
- Membre Naturel
- Messages: 60
- Enregistré le: 09 Jan 2008, 17:31
-
par Ineedi2 » 02 Juil 2014, 14:44
Bonjour à tous,
Pour faire simple voici le topo:
C'est une enquête dont le sondage est stratifié. C'est à dire qu'avant de prendre un échantillon aléatoire on va "ranger" nos individus dans des strates (selon certains critères) où l'on fait ensuite notre tirage aléatoire.
Ce que je veux faire dans un premier temps est, avec les données, vérifier en quelque sort l'homogénéité de mes résultats dans chaque strate pour donner une certaine précision à mes estimateurs. Je pense pour montrer ceci faire un test de normalité, moyenne, variance, coefficient de variation.
Je voulais tout simplement savoir si je pouvais ajouter d'autres tests ou analyses pour répondre au mieux à cette question homogénéité.
Merci d'avance
I need i²
-
adrien69
- Membre Irrationnel
- Messages: 1899
- Enregistré le: 20 Déc 2012, 12:14
-
par adrien69 » 03 Juil 2014, 13:28
En gros tu veux vérifier que dans chaque strate tu as plus ou moins une gaussienne, et récupérer moyenne-variance dans chaque strate ?
-
Ineedi2
- Membre Naturel
- Messages: 60
- Enregistré le: 09 Jan 2008, 17:31
-
par Ineedi2 » 07 Juil 2014, 14:27
adrien69 a écrit:En gros tu veux vérifier que dans chaque strate tu as plus ou moins une gaussienne, et récupérer moyenne-variance dans chaque strate ?
Voilà, c'est ça, le problème est que je trouve des coeff de variations relativement élevé dans les strates (écart type relativement grand par rapport a la moyenne). Cela est souvent du à des individus qui ont des valeurs extrêmes pour ma variable en question. Dans ce cas que dois-je en conclure ? Refaire une analyse sans ces extrêmes ? Le fait d'avoir des extrêmes de manière très courante implique que la stratification est mal faite ?
-
adrien69
- Membre Irrationnel
- Messages: 1899
- Enregistré le: 20 Déc 2012, 12:14
-
par adrien69 » 07 Juil 2014, 14:31
En fait ça dépend du problème que tu traites. Est-ce que tu t'attendais à ces extrêmes ?
Quelle est l'hypothèse testée par ton sondage si ce n'est pas indiscret ?
-
Ineedi2
- Membre Naturel
- Messages: 60
- Enregistré le: 09 Jan 2008, 17:31
-
par Ineedi2 » 07 Juil 2014, 14:56
adrien69 a écrit:En fait ça dépend du problème que tu traites. Est-ce que tu t'attendais à ces extrêmes ?
Quelle est l'hypothèse testée par ton sondage si ce n'est pas indiscret ?
En voulant répondre à ta question, cela m'a mis sur certaines pistes. Je reviendrai si besoin est. Ceci dit, non je ne m'attendais pas à ces extrêmes qui normalement auraient dues être filtrées.
Ceci étant dit, je me pose quand même la question: "Est-ce qu'un échantillonnage peut-être bien représentatif la population si l'on retrouve des écart types importants par rapport à la moyenne sur la principale variable de l'enquête ?"
-
adrien69
- Membre Irrationnel
- Messages: 1899
- Enregistré le: 20 Déc 2012, 12:14
-
par adrien69 » 07 Juil 2014, 14:58
Eh bien si tu t'attends à une "heavy-tailed" distribution, dans ce cas là oui.
Par exemple : le revenu annuel.
(et tu stratifies selon l'origine sociale ou un truc qui mesure ça)
-
Ineedi2
- Membre Naturel
- Messages: 60
- Enregistré le: 09 Jan 2008, 17:31
-
par Ineedi2 » 07 Juil 2014, 15:21
adrien69 a écrit:Eh bien si tu t'attends à une "heavy-tailed" distribution, dans ce cas là oui.
Par exemple : le revenu annuel.
(et tu stratifies selon l'origine sociale ou un truc qui mesure ça)
Intéressant, dans mon cas les unités sont pondérées par l'inverse du taux de sondage de chaque strate. ( exemple: Une strate contient 50 unités, on tire 5 unités pour notre échantillon (10%). Donc chaque unité échantillonnée aura un poids de 10 ou représentera 10 unités à l'échelle de l'univers). Est-ce qu' une telle pondération se justifie lorsqu'on a une heavy-tailed distribution par exemple ?
-
adrien69
- Membre Irrationnel
- Messages: 1899
- Enregistré le: 20 Déc 2012, 12:14
-
par adrien69 » 07 Juil 2014, 15:46
De ce que je sais c'est toujours justifié de pondérer par le taux de réponses.
Mais quand tu as des strates si réduites, il est vraiment déconseillé de les réduire encore plus, parce que justement, ça te rend sensible à des phénomènes qui pourraient être en fait de mesure quasi nulle.
-
Ineedi2
- Membre Naturel
- Messages: 60
- Enregistré le: 09 Jan 2008, 17:31
-
par Ineedi2 » 07 Juil 2014, 16:10
adrien69 a écrit:De ce que je sais c'est toujours justifié de pondérer par le taux de réponses.
Mais quand tu as des strates si réduites, il est vraiment déconseillé de les réduire encore plus, parce que justement, ça te rend sensible à des phénomènes qui pourraient être en fait de mesure quasi nulle.
Les quelques distributions que j'ai regardé semblent ressembler à des distribution heavy trailed. Dans ce cas de distribution, est-il faux de daffirmer que l'écart type ou le coefficient de variation n'est pas forcément un bon indicateur sur la représentativité de mon échantillon sur la population (qu'on a usuellement envie d'utiliser pour des distributions souvent normales) ?
En effet le coefficient de variation sera toujours élevé ...
Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 70 invités