Estimation ponctuelle d'un écart type à partir d'un échantil

Réponses à toutes vos questions après le Bac (Fac, Prépa, etc.)
Anonyme

Estimation ponctuelle d'un écart type à partir d'un échantil

par Anonyme » 17 Déc 2012, 17:26

Bonjour

A partir d'un échantillon de taille n conséquent ( ) : par exemple un sondage de type "oui" ou "non"

je cherche à estimer sur la population totale :

1) une estimation du nombre de "oui" (ou de "non") sur la population totale ?

2) une estimation de l'écart type de cette estimation ponctuelle de "oui" (ou de "non") sur la population totale

Je connais la formule pour calculer 1) à partir de l'analyse des données de l'échantillon de taille n

mais je ne connais pas la formule qui permet de calculer 2)



Anneauprincipal
Membre Relatif
Messages: 147
Enregistré le: 10 Jan 2009, 14:36

par Anneauprincipal » 17 Déc 2012, 18:46

Salut,

Je crois que ce que tu cherches est là dedans :
http://gilles.costantini.pagesperso-orange.fr/prepas_fichiers/estimation.pdf

Page 5, B1 :

Anonyme

par Anonyme » 17 Déc 2012, 21:54

@Anneauprincipal

Merci

Je vais étudier la notion d'estimateur "biaisé" et "non biaisé"
et je reviens vers toi si j'ai des questions

Anonyme

par Anonyme » 18 Déc 2012, 00:07

@Anneauprincipal :

D'OU VIENT CETTE FORMULE

Voici une démo , pour expliquer d'où vient "ce correcteur de biais" :

Pour obtenir cette formule à partir d'une échantillon de taille n c'est à dire de V.A. avec

1)
il faut partir d'un estimateur qui est :


2)
Mais comme on ne connait pas , on prend un estimateur de la "moyenne vraie"
c'est à dire

EDIT ( début explications supplémentaires )

ET si les V.A. sont indépendantes et uniformément distribuées on a :
(estimateur sans biais) et

EDIT ( fin explications supplémentaires )


ET donc on prend comme estimateur

ET en développant cette identité remarquable , on trouve que


3)
Montrons que : cet estimateur est biaisé , c'est à dire que :

Après quelques lignes de calculs (voir ci dessous)
Image


Conclusion :

( et non pas et c'est pourquoi on dit que c'est un estimateur "avec un biais"...)


et DONC on trouve "ta superbe formule magique" (qui intègre le correcteur de biais)
:


ouf !

Dlzlogic
Membre Transcendant
Messages: 5273
Enregistré le: 14 Avr 2009, 13:39

par Dlzlogic » 19 Déc 2012, 15:34

Bonjour,
Petite réponse très timide. Etant donné qu'il y a eu 1 sondage, le dénominateur du correcteur de biais est nul, il n'est donc pas possible de connaitre l'écart-type cherché.

Anonyme

par Anonyme » 19 Déc 2012, 18:12

@Dlzlogic

Je te rappelle que pour faire un sondage forcément ( étant le nombre d'individus sondés appartenant à une population donnée )

et donc on a bien et également

Pour info :
"asymptotiquement" : comme limite de est 1 quand n tend vers +infini :

on dit que cet estimateur est "asymptotiquement" sans biais
car la limite de sa MOYENNE , quand n tend vers +infini , est égale à

Dlzlogic
Membre Transcendant
Messages: 5273
Enregistré le: 14 Avr 2009, 13:39

par Dlzlogic » 19 Déc 2012, 18:30

Peut-être problème de langage, pour moi, 1 expérience = 1 sondage = n.
Le nombre d'individus interrogés pourra intervenir, éventuellement, en tant que poids, s'il y a plusieurs sondages.
La notion d'écart-type "vrai" m'est inconnue, par contre la notion de "valeur vraie" ou "moyenne vraie" est parfaitement claire dans mon esprit.
Mais concernant ce sujet, mon ignorance est bien connue. Donc, ne perdons pas notre temps.

Avatar de l’utilisateur
leon1789
Membre Transcendant
Messages: 5475
Enregistré le: 27 Nov 2007, 16:25

par leon1789 » 19 Déc 2012, 18:30

Dlzlogic a écrit:Bonjour,
Petite réponse très timide. Etant donné qu'il y a eu 1 sondage, le dénominateur du correcteur de biais est nul, il n'est donc pas possible de connaitre l'écart-type cherché.

Timidement, tu devrais d'abord essayer de comprendre ce qu'a expliqué ptitnoir avant de dire un peu n'importe quoi. :mur:

Dlzlogic a écrit:
Mais concernant ce sujet, mon ignorance est bien connue. Donc, ne perdons pas notre temps.

Sur cela, je suis absolument d'accord avec toi, et te conseille de ne plus en (faire) perdre.

Avatar de l’utilisateur
leon1789
Membre Transcendant
Messages: 5475
Enregistré le: 27 Nov 2007, 16:25

par leon1789 » 19 Déc 2012, 18:31

Dlzlogic a écrit:
Mais concernant ce sujet, mon ignorance est bien connue. Donc, ne perdons pas notre temps.

Sur cela, je suis absolument d'accord avec toi, et te conseille de ne plus en (faire) perdre.

Avatar de l’utilisateur
leon1789
Membre Transcendant
Messages: 5475
Enregistré le: 27 Nov 2007, 16:25

par leon1789 » 19 Déc 2012, 18:40

@ptitnoir,

Je suis d'accord avec ce que tu as écrit sur les estimateurs.

Pour un entier n, l'estimateur de l'écart-type est quand même biaisé malgré la correction. En effet, comme tu l'as montré, l'estimateur de la variance est corrigé de manière non biaisée par n/(n-1), mais l'estimateur d'écart-type reste quand même biaisé via car la racine carrée se comporte mal. Tu as dit que l'estimateur est asymptotiquement non biaisé, ok.

La question suivante serait de savoir quelle incertitude on a sur l'estimation.

En ce qui concerne la proportion dans une population, on fait appel à des intervalles de confiance (avec un certain seuil) : cela répond à ta première question de manière plus précise que l'estimateur.

Et pour les écart-types (ou disons la variance, ce sera plus simple), a-t-on facilement des intervalles de confiances ?

Avatar de l’utilisateur
leon1789
Membre Transcendant
Messages: 5475
Enregistré le: 27 Nov 2007, 16:25

par leon1789 » 19 Déc 2012, 18:42

ptitnoir a écrit:Pour info :
"asymptotiquement" : comme limite de est 1 quand n tend vers +infini :

on dit que cet estimateur est "asymptotiquement" sans biais
car la limite de sa MOYENNE , quand n tend vers +infini , est égale à


L'estimateur de la variance est sans biais pour tout n>1 (sans le mot "asymptotiquement")

Avatar de l’utilisateur
leon1789
Membre Transcendant
Messages: 5475
Enregistré le: 27 Nov 2007, 16:25

par leon1789 » 19 Déc 2012, 18:46

@ptitnoir,

Je suis d'accord avec ce que tu as écrit sur les estimateurs.

Pour un entier n, l'estimateur de l'écart-type est quand même biaisé malgré la correction. En effet, comme tu l'as montré, l'estimateur de la variance est corrigé de manière non biaisée par n/(n-1), mais l'estimateur d'écart-type reste quand même biaisé via car la racine carrée se comporte mal. Tu as dit que l'estimateur est asymptotiquement non biaisé, ok.

La question suivante serait de savoir quelle incertitude on a sur l'estimation.

En ce qui concerne la recherche d'une proportion dans une population, on fait appel à des intervalles de confiance (avec un certain seuil) : cela répond à ta première question de manière plus précise que l'estimateur.
En particulier, on voit qu'un échantillon de taille 35 est trop faible pour avoir une précision correcte (sauf si la proportion cherchée est très proche de 0 ou de 1...).

Et pour les écart-types (ou disons la variance, ce sera plus simple), a-t-on facilement des intervalles de confiances ?

Avatar de l’utilisateur
leon1789
Membre Transcendant
Messages: 5475
Enregistré le: 27 Nov 2007, 16:25

par leon1789 » 19 Déc 2012, 20:14

ptitnoir a écrit:Pour obtenir cette formule à partir d'une échantillon de taille n c'est à dire de V.A avec
(...)

Cette preuve est correcte lorsque les variables aléatoires sont indépendantes, c'est-à-dire que l'on réalise successivement n tirages d'une personne dans la population "avec remise".

ptitnoir a écrit:Bonjour

A partir d'un échantillon de taille n conséquent ( ) : par exemple un sondage de type "oui" ou "non"

je cherche à estimer sur la population totale :

1) une estimation du nombre de "oui" (ou de "non") sur la population totale ?

2) une estimation de l'écart type de cette estimation ponctuelle de "oui" (ou de "non") sur la population totale

Je connais la formule pour calculer 1) à partir de l'analyse des données de l'échantillon de taille n

mais je ne connais pas la formule qui permet de calculer 2)


Je reviens sur le problème car il me semble qu'il y a peut-être de quoi préciser les choses...

C'est un sondage ( :!: ) sur un échantillon de taille n dans une population de taille N.

Pour estimer l'écart-type de la population, on va considérer la racine carrée d'un estimateur de la variance de la population.
Or on sait que l'estimateur de la variance de la population consistant à prendre la variance de l'échantillon est un estimateur biaisé.
Il convient donc de rectifier cet estimateur de variance par le bon coefficient.
Et c'est ici qu'on se demande ce qu'est un sondage...

- Normalement, un sondage c'est un "test" sur des individus différents : on ne teste pas deux à la même personne (c'est un tirage "simultané" de n personnes, tirage "sans remise"). Du coup, le facteur correctif de l'estimateur de variance est ,
d'où l'estimateur de variance

- Si on laisse l'éventualité de demander plusieurs fois à la même personne (tirages "successifs" de n personnes "avec remise"), alors le facteur correctif de l'estimateur de variance est ,
d'où l'estimateur de variance

- Si la population totale est infinie, alors le facteur correctif de l'estimateur de variance est du fait que ,
d'où l'estimateur de variance

Avatar de l’utilisateur
leon1789
Membre Transcendant
Messages: 5475
Enregistré le: 27 Nov 2007, 16:25

par leon1789 » 19 Déc 2012, 20:26

ptitnoir a écrit:Pour obtenir cette formule à partir d'une échantillon de taille n c'est à dire de V.A avec
(...)

Cette preuve est correcte lorsque les variables aléatoires sont indépendantes, c'est-à-dire que l'on réalise successivement n tirages d'une personne dans la population "avec remise".

Avatar de l’utilisateur
leon1789
Membre Transcendant
Messages: 5475
Enregistré le: 27 Nov 2007, 16:25

par leon1789 » 19 Déc 2012, 20:28

ptitnoir a écrit:Voici une démo , pour expliquer d'où vient "ce correcteur de biais" :

Pour obtenir cette formule à partir d'une échantillon de taille n c'est à dire de V.A avec
(...)

Cette preuve est correcte lorsque les variables aléatoires sont indépendantes, c'est-à-dire que l'on réalise successivement n tirages d'une personne dans la population "avec remise", ce qui ne correspond pas totalement à ce qu'est en réalité un sondage. Je m'explique...

ptitnoir a écrit:Bonjour

A partir d'un échantillon de taille n conséquent ( ) : par exemple un sondage de type "oui" ou "non"

je cherche à estimer sur la population totale :

1) une estimation du nombre de "oui" (ou de "non") sur la population totale ?

2) une estimation de l'écart type de cette estimation ponctuelle de "oui" (ou de "non") sur la population totale

Je connais la formule pour calculer 1) à partir de l'analyse des données de l'échantillon de taille n

mais je ne connais pas la formule qui permet de calculer 2)


Je reviens sur le problème car il me semble qu'il y a peut-être de quoi préciser les choses...

C'est un sondage ( :!: ) sur un échantillon de taille n dans une population de taille N.

Pour estimer l'écart-type de la population, on va considérer la racine carrée d'un estimateur de la variance de la population.
Or on sait que l'estimateur de la variance de la population consistant à prendre la variance de l'échantillon est un estimateur biaisé.
Il convient donc de rectifier cet estimateur de variance par le bon coefficient.
Et c'est ici qu'on se demande ce qu'est un sondage...

- Normalement, un sondage c'est un "test" sur des individus différents : on ne teste pas deux fois la même personne (c'est un tirage "simultané" de n personnes, tirage "sans remise"). Du coup, le facteur correctif de l'estimateur de variance est ,
d'où l'estimateur de variance sans biais.

- Si on laisse l'éventualité de demander plusieurs fois à la même personne (tirages "successifs" de n personnes "avec remise"), alors le facteur correctif de l'estimateur de variance est (voir la preuve donnée par ptitnoir),
d'où l'estimateur de variance sans biais.

- Si la population totale est infinie, alors le facteur correctif de l'estimateur de variance est du fait que ,
d'où l'estimateur de variance sans biais.

Anonyme

par Anonyme » 19 Déc 2012, 21:46

@leon1789

"Oh la vache ! dans quoi ai-je mis les pieds ?"

Merci , en tous cas pour tes explications

Je connais la notion de tirage : c'est à dire
- soit de n tirages successifs sans remise
- soit d'un seul tirage simultané de n boules (ou n tirages successifs avec remise)...

Et je pensais que la notion de sondage était modélisée par n tirages successifs avec remise
(et donc logiquement dans cette modélisation : on peut dans un échantillon de taille n sonder 2 fois la même personne...)



Je vais devoir relire à plusieurs fois tes explications puis je vais essayer de les digérer... ( avec )

"Peut être qu'avec un bon verre de vin cela devrait passer ??"
:-)



ps)
Je pense que j'en ai pour un moment avant de poser la question qui me turlupine sur ce sujet et qui est :

Le calcul pour cet estimateur d'un intervalle de fluctuation et d'un intervalle de confiance à

A+

Anonyme

par Anonyme » 19 Déc 2012, 22:26

@Léon

J'ai une question concernant ma "démo" ( voir mon dernier message de hier )

Où utilise-t-on le fait que les variables aléatoires sont indépendantes et uniformément distribuées ?

Avatar de l’utilisateur
leon1789
Membre Transcendant
Messages: 5475
Enregistré le: 27 Nov 2007, 16:25

par leon1789 » 19 Déc 2012, 22:33

ptitnoir a écrit:Le calcul pour cet estimateur d'un intervalle de fluctuation et d'un intervalle de confiance à

Je pense que tu parles de l'estimateur de l'écart-type.
Personnellement, je crois que ce sera plus simple sur l'estimateur sans biais de la variance (parce que la racine carrée, ça fait ch... :hum:)

Anonyme

par Anonyme » 19 Déc 2012, 22:46

@leon1789

Je n'ai pas compris pourquoi il y aurait une différence entre l'estimation de la variance de la population mère avec l'estimation de l'écart type

Pour moi on a et ce calcul n'influe pas sur le calcul des estimateurs...

Mais : peut être suis-je très fatigué ?

Avatar de l’utilisateur
leon1789
Membre Transcendant
Messages: 5475
Enregistré le: 27 Nov 2007, 16:25

par leon1789 » 20 Déc 2012, 00:20

ptitnoir a écrit:Où utilise-t-on le fait que les variables aléatoire sont indépendantes et uniformément distribuées ?

C'est précisément dans la simplification de en

 

Retourner vers ✯✎ Supérieur

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 43 invités

Tu pars déja ?



Fais toi aider gratuitement sur Maths-forum !

Créé un compte en 1 minute et pose ta question dans le forum ;-)
Inscription gratuite

Identification

Pas encore inscrit ?

Ou identifiez-vous :

Inscription gratuite