Représentativité d'un échantillon
Réponses à toutes vos questions après le Bac (Fac, Prépa, etc.)
-
Stats-stress
- Membre Naturel
- Messages: 12
- Enregistré le: 27 Fév 2007, 14:19
-
par Stats-stress » 14 Avr 2007, 18:07
Bonjour , dans le cadre d'un étude statitistique j'ai poser une question ( oui une :p) à 10 réponse possible, je possède un échantillon de taille E sur une population totale de taille E', à un échantillon donné j'ai assoscié un nombre A ( compris entre 1 et 10) d'ou A=f(E). J'aimerais savoir à quel poin mon échantillon est représentatif de la population, c'est à dire déterminer le pourcentage de chance P pour que :
[f(E)-f(E')]/[f(E')]*100<5%
Le problème est que je n'ais asbolument aucune idée de comment trouver cette probabilité P.
Je suppose qu'il doit manquer des hypothèses à mon problème ( nature de l'échantillon ? ...) et je serait heureux d'apporter les précisions necéssaire mais pour l'instant je suis vraiment bloqué :( .
Merci d'avance à qui pourra me mettre sur la voie.
-
nuage
- Membre Complexe
- Messages: 2214
- Enregistré le: 09 Fév 2006, 22:39
-
par nuage » 14 Avr 2007, 21:09
Salut,
je ne suis pas sûr de bien comprendre ton problème.
Je vais essayer de le réécrire :
On a une question avec 10 réponses possibles (disons un entier de 0 à 9)
On pose la question à un échantillon E de taille n extrait de la population E' de taille N.
On applique ensuite une fonction f à l'ensemble des n réponses.
A partir de ce point il n'y a plus de probabilité.
La question que l'on peut se poser est : avant de tirer l'échantillon qu'elle est la proba d'avoir |f(E)-f(E')|/f(E')<5%.
Mais ceci suppose que E soit aléatoire.
Répondre à cette question suppose au minimum de connaître f.
-
Stats-stress
- Membre Naturel
- Messages: 12
- Enregistré le: 27 Fév 2007, 14:19
-
par Stats-stress » 16 Avr 2007, 13:20
En effet E est aléatoire quand à f la fonction est la suivante :
Quand on pose la question à un échantillon E on obtient E réponses réparties dans les 10 catégories 1,.... ,10. A chaque catégorie on associe l'entier naturel qui lui correspond.
Et a chaque échantillon on associe le nombre NA = somme ( (k/10)*N(k))/E
1ou N(k) est le nombre de réponses dans la catégorie choisie.
a priori ça n'a pas l'air très dur mais je ne sais vraiment pas par ou commencer toute indication serait la bienvenue !
-
nuage
- Membre Complexe
- Messages: 2214
- Enregistré le: 09 Fév 2006, 22:39
-
par nuage » 16 Avr 2007, 18:36
Salut,
donc, si j'ai bien compris f(E) est la moyenne des réponses divisée par 10.
Si la taille n de E (que je t'invite à ne pas confondre avec E) est supérieure à 30 on peut sans trop de problème admettre que f(E) suit une loi normale d'espérance f(E'). En tout état de cause son écart-type est inférieur à 0,45. Cette valeur correspond à une répartion de E' en deux groupes égaux de valeurs respectives 1 et 10.
Il est alors facile de calculer un majorant (avant le tirage) de
P(|f(E)-f(E')|<0,05)
à l'aide de la loi normale d'écart-type 0,45/racine(n).
Une taille d'échantillon de l'odre de 400 doit donner une proba du genre 0.95 au pire.
Pour l'erreur relative je ne me souviens plus de la technique à utiliser, et je suis loin de ma bibliothèque.
Désolé :triste:
Peut-être quelqu'un d'autre ...
-
Stats-stress
- Membre Naturel
- Messages: 12
- Enregistré le: 27 Fév 2007, 14:19
-
par Stats-stress » 16 Avr 2007, 19:14
Oups doublet :(
-
Stats-stress
- Membre Naturel
- Messages: 12
- Enregistré le: 27 Fév 2007, 14:19
-
par Stats-stress » 16 Avr 2007, 19:18
Enfin moyenne pondérée , cela change-t-il quelque chose ?
En tout cas merci de m'avoir mis sur la piste au moins je sais où chercher.
-
buzard
- Membre Relatif
- Messages: 274
- Enregistré le: 22 Mai 2006, 14:29
-
par buzard » 16 Avr 2007, 21:50
Bonjour,
Déterminer la représentativité d'un échantillon est un exercice difficile à priori. En faite seule la population entière est vraiment représentatif d'elle même, c'est le principe d'identité.
Le faite de prélever un échantillon a pour effet de réduire la quantité d'information, on se retrouve forcément avec condensé moins précis, mais lorsque les échantillons sont suffisamment grand on réduit le risque de se tromper.
Pour que ton échantillon soit vraiment représentatif il faudrait que t'ai choisi exactement la même proportion d'individu dans chaque classe (1 à 10) qu'il y en a dans la population. Seulement tu ne connais pas cette proportion à priori.
en générale, on utilise une classification suivant un autre caractère (connu celui-là) dont on peut légitimement supposer l'indépendance (covariance nulle) avec le caractère que tu cherche à évaluer. Ainsi on aura un échantillon représentatif pour l'estimation du caractère.
Le gros problème c'est de savoir si l'hypothèse d'indépendance des deux caractère est valide ou non.
On pourrait penser qu'un tirage au sort de l'échantillon est un bon représentant. Eh bien, pas tellement! le tirage au sort (surtout s'il est peu dense) à tendance à effacer les petites catégories. Et pour qu'un test soit efficace il faut que la fréquence des petites catégories soit la plus grande possible.
Voilà, sinon juste une remarque, un test sur la moyenne à variance inconnue, c'est du student tout craché.
Biblio: un numéro dont je me souvient plus bien le nom de la revue "La Recherche", cherche sur leur site avec tes mots-clefs tu trouvera sûrement.
-
nuage
- Membre Complexe
- Messages: 2214
- Enregistré le: 09 Fév 2006, 22:39
-
par nuage » 16 Avr 2007, 22:40
Salut,
buzard a écrit:....
On pourrait penser qu'un tirage au sort de l'échantillon est un bon représentant. Eh bien, pas tellement!
Mais faire mieux n'est pas facile, et entraine souvent des erreurs importantes, et surtout non maitrisables.
buzard a écrit:le tirage au sort (surtout s'il est peu dense) à tendance à effacer les petites catégories. Et pour qu'un test soit efficace il faut que la fréquence des petites catégories soit la plus grande possible.
Pour ça il faut changer la population, ce qui est assez difficile.
buzard a écrit:Voilà, sinon juste une remarque, un test sur la moyenne à variance inconnue, c'est du student tout craché...
ça c'est bien vrai. Mais, d'une part on a un majorant de la variance, ce qui n'est pas optimal mais rassurant, et d'autre part la question porte sur l'erreur relative, ce qui trés différent.
A+
nuage :
-
Stats-stress
- Membre Naturel
- Messages: 12
- Enregistré le: 27 Fév 2007, 14:19
-
par Stats-stress » 18 Avr 2007, 08:10
Donc si j'ai bien compris, il faut que je trouve une question équivalente dont je connais la réponse sur toute la population , mais qui n'a rien à voir avec la question initiale pour avoir une chance de trouver la représentativité de mon échantillon ? Je dois avouer que je suis assez confus :p.
Merci pour la référence malheureusement je n'ai pas trouvé d'article sur mon problème, connaitrais-tu d'autre revue scientifiques susceptibles de m'éclairer ?
-
Stats-stress
- Membre Naturel
- Messages: 12
- Enregistré le: 27 Fév 2007, 14:19
-
par Stats-stress » 18 Avr 2007, 19:59
never mind :p
-
Stats-stress
- Membre Naturel
- Messages: 12
- Enregistré le: 27 Fév 2007, 14:19
-
par Stats-stress » 20 Avr 2007, 06:18
petit up :p
Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 74 invités