Probleme de statistique

Réponses à toutes vos questions après le Bac (Fac, Prépa, etc.)
Albundy
Messages: 5
Enregistré le: 16 Mai 2006, 16:20

Probleme de statistique

par Albundy » 16 Mai 2006, 16:31

Bonjour a tous,
Nouveu venu, je decouvre avec plaisir ce forum. J'espere y trouver reponse a mes questions ;)

Si l'on considere une distribution gaussienne avec sa moyenne et son ecart type. L'ecart type sera d'autant plus precis que le nombre d'experiences sera elevé. Cependant, a partir de combien de "tirs" peut on considerer que la valeur donnée par l'ecart type est "coherente"? En d'autre terme, faut il appliquer un facteur correctif sur l'ecart type "mesuré" en fonction du nombre de tir? Si oui, ou peut on trouver cette table de correction?

Si je ne suis pas suffisament clair, n'hesitez pas a me demander des precisions.

D'avance merci!



serge75
Membre Relatif
Messages: 432
Enregistré le: 05 Avr 2006, 22:31

par serge75 » 17 Mai 2006, 00:52

en général on détermine l'écart-type empirique de la distribution en divisant par (n-1) et non par n. Cela répond-t-il à ta question ?

Albundy
Messages: 5
Enregistré le: 16 Mai 2006, 16:20

par Albundy » 17 Mai 2006, 07:50

Merci pour votre reponse mais n correspond a quoi?
Pour resituer, je suis relativement faché avec les maths "theoriques". ;)

Je vais reformuler ma question: Suposons que je mesure un parametre sur 30 echantillons, j'en determine alors une valeur moyenne et un ecart type. Ce meme produit doit etre produit a 20 millions d'exemplaires, comment je peux estimer l'ecart type de la totalite de la production a partir des mesures sur les echantillons? 30 mesures sont suffisantes? ou faut il multiplier le sigma par un certain coefficient du au faible nombre d'experience?
Merci.

serge75
Membre Relatif
Messages: 432
Enregistré le: 05 Avr 2006, 22:31

par serge75 » 17 Mai 2006, 08:36

Bon, reprenons :
On considère une variable aléatoire X, correspondant à UN tirage.
Tu fais ensuite une suite de n tirages (un sondage) indépendants, que tu modelises par une suite (X1,...Xn) de n variables aléatoires indépendantes suivant la même loi que X.
Tu approximes l'écart-type de X par la formule :
avec . (on prend aussi parfois pour approximation de : ). x1,...,xn désignent ici le résultat du tirage de X1,...,Xn.

Ceci étant dit, on fait le sondage pour estimer la vraie valeur de l'espérance de X, qu'on approxime par m. m est donc le résultat obtenu par ton sondage de la variable aléatoire .
On arrive alors au résultat qui t'intéresses : l'écart-type de Y est alors .

En d'autres termes, plus le nombre n de tirages que tu as fait dans ton sondage est élevé, plus l'écart-type de ta moyenne empirique diminue, et donc plus m est une bonne approximation de la vraie moyenne de X.

Ai-je répondu à ta question ?

Albundy
Messages: 5
Enregistré le: 16 Mai 2006, 16:20

par Albundy » 17 Mai 2006, 08:52

Merci pour tes efforts de pedagogie :++:

Je vais etudier ta reponse a tete repose (et surtout la tester sur un cas concret) et je reviens vers toi un peu plus tard.

Encore merci!!

serge75
Membre Relatif
Messages: 432
Enregistré le: 05 Avr 2006, 22:31

par serge75 » 17 Mai 2006, 09:43

tu peux aussi aller voir le post http://www.maths-forum.com/showthread.php?t=15292 qui traite à peu près de la même chose et où j'avais fait une réponse un peu plus complète.

Albundy
Messages: 5
Enregistré le: 16 Mai 2006, 16:20

par Albundy » 17 Mai 2006, 09:49

J'ai tres bien compris ta reponse. Merci!

Cependant, ca ne repond pas completement a ma question car cette derniere est mal formulée (je n'ai pas ton sens pedagogique ;-)).
Ce qui m'interesse en premier lieu est de connaitre la dispersion maximum (+/- 6 sigmas) que peux avoir mon parametre mesure.

Ma question a plus de sens si tu te place dans un contexte industriel ou tu dois fixer des limites de trie sur tes produits de facon a ne livrer a tes clients que des bonnes pieces malgres la variabilité de ta production. Si j'ai une estimation precise du sigma, je pourrais estimer mon rendement et donc optimiser ma prod de facon a obtenir le meilleur rendement possible. Je veux donc estimer par simulation mon rendement previsionnel. Ainsi, la valeur moyenne theorique m'importe peu mais ces surtout les limites de la gaussienne qui m'interesse donc son sigma. Or, ce sigma varie en fonction du nombre de tir, et je ne peux "simuler" qu'un nombre tres limité d'experience. comment donc estimer au plus juste ce sigma malgres un nombre d'experience tres limitées?

J'espere que le contexte de ma demande est plus clair.

Cordialement,

serge75
Membre Relatif
Messages: 432
Enregistré le: 05 Avr 2006, 22:31

par serge75 » 17 Mai 2006, 12:00

Ta demande est de l'ordre de la quadrature du cercle. Peut-être ai-je mal compris ta requête (auquel cas je m'en excuse par avance), mais je vais encore te fournir la même réponse :
Il n'y a pas d'autre méthode que celle ci-dessus pour estimer sigma, et donc si ton nombre d'essais est faible, ton sigma sera élevé, et je ne vois pas comment en sortir.
Je ne sais pas si ça répond à ta question, mais je te propose le modèle suivant :
chaque pièce qui sort de ta production est considérée soit comme valide (en fonction de critères qu'il t'appartient de définir), soit comme infructueuse.
La probabilité qu'une pièce soit valide est p (p étant inconnu : c'est ce qu'on cherche à déterminer).
Tu fais un sondage sur mettons 100 pièces : il s'avère que 92 sont valides.
Ainsi l'écart-type empirique est .
L'évaluation Y de la moyenne suit alors une loi normale (gaussienne si tu préfères) de moyenne p (toujours inconnue) et d'écart-type .
De là, tu peux dire que .
Or suit une loi normale réduite (de moyenne 0 et d'écart type 1) de fonction de répartition G qui est tabulée.
Donc .
Compte-tenu que la valeur obtenue pour Y est ici 0,92, on écrit :
.
Ceci s'écrit finalement :
.
De là, il y a un choix à faire :
soit tu donne une petite valeur à k : ton intervalle sera resserré, mais la probabilité (la fiabilité) sera faible :
exemple, pour k=1, tu obtiens G(1)=0,84, et donc
Pour k=3, tu obtiens G(3)=0,99865, et donc

Donc, tu peux apporter deux réponses :
avec une fiabilité de 68%, la proportion de pièces valides est entre 89,3% et 94,7%
avec une fiabilité de 99,73%, la proportion de pièces valides est entre 86,6% et 97,4%.

Moralité : la taille de ton sondage étant fixée (100 ici), tu peux augmenter la fiabilité de ton résultat en augmantant la taille de l'intervalle que tu fournis, ou réduire ton intervalle, mais en diminuant la fiabilité.
Pour augmenter la fiabilité en diminuant la taille de l'intervalle réponse, une seule solution : augmenter la taille du sondage.

Cela répond-il mieux ?

Albundy
Messages: 5
Enregistré le: 16 Mai 2006, 16:20

par Albundy » 17 Mai 2006, 14:46

Oui, je vais bien finir par me reconcilier avec les math.

Merci beaucoup pour ton aide et ta disponibilite Serge!

Cordialement,

 

Retourner vers ✯✎ Supérieur

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 40 invités

Tu pars déja ?



Fais toi aider gratuitement sur Maths-forum !

Créé un compte en 1 minute et pose ta question dans le forum ;-)
Inscription gratuite

Identification

Pas encore inscrit ?

Ou identifiez-vous :

Inscription gratuite