analyse probas

(Cliquez-ici pour accéder à la version originale de cette discussion avec couleurs et images)







Posted by: jean47

Bonsoir à tous,
Je voudrais savoir si l'on peut calculer une probabilité à postériori, par ex:

Supposons qu'un même nombre (parmi un nombre d'autres numéros, peu importe leur nombre) sorte après 2 tirages successifs, puis 3 tirages, puis 11 tirages et enfin 5 tirages.

la séquence est alors:
T T S T T T S T T T T T T T T T T S T T T T T S
(T=tirage, S= sortie de ce nombre) (bien sûr, un autre nombre est donc tiré quand celui ci n'est pas tiré au sort)

Sachant cela, peut on alors:
-connaître les probabilités qu'AVAIENT ces 4 tirages?
- savoir la probabilité qu' AURA alors ce nombre de sortir après 4 tirages?

Merci de vos reflexions et bonne soirée



Posted by: Yipee

Citation:
Posté par jean47
-connaître les probabilités qu'AVAIENT ces 4 tirages?
- savoir la probabilité qu' AURA alors ce nombre de sortir après 4 tirages?



Je ne comprends pas ce que sont ces quatre tirages.



Posted by: El_Gato

Citation:
Posté par Yipee
Je ne comprends pas ce que sont ces quatre tirages.


C'est évidemment le groupement des "2 tirages successifs, puis 3 tirages, puis 11 tirages et enfin 5 tirages", ce qui fait bien quatre.

Pour répondre au problème de jean47, ça m'a l'air de relever des méthodes d'estimation a priori en Bayésien.

Dans le bouquin de Saporta c'est expliqué au début et il y a un exemple de calcul.

Mais je ne sais pas si cela répondra exactement à ton pb, je n'ai pas le temps de regarder (et je ne me souviens plus très bien comment on fait).



Posted by: nox

la théorie bayesienne c'est l'utilisation des "A sachant B" etc...non?

je ne pense pas que cela s'applique ici...En fait pour moi ici il n'y a aucune différence entre le AVAIT et le AURA de l'énoncé.

On peut calculer la probabilité "tirer k apres 11 tirages sachant que k a été tiré 3X en n tirages" ou un truc du genre. Mais ici je ne vois pas ce que le "posteriori" nous apporte. Ca serait comme dire "calculer la probabilité de ces 4 tirages sachant qu'ils ont eu lieu"...ou un truc de ce genre.
De toute facon en formulant la question : "calculer la probabilité de ces 4 tirages" on évite le problème du temps du verbe :p



Posted by: BancH

Voici les deux derniers résultats d'un joueur de loto pris au hasard parmis tous les joueurs : J P

J=Jackpot P=Pas jackpot

Vous ne connaissez pas le loto donc vous ne savez pas combien il y a de numéros.

Quelle était/est/sera la probabilité de gagner au loto ?

Si une théorie permet de répondre, ça m'interesse...



Posted by: Yipee

Je ne suis pas d'accord. L'idée de la theorie Bayesienne - mais je ne suis pas un expert loin de là - est de voir que la réalisation d'une expérience modifie les probabilités "a priori". Cependant je ne pense pas que l'on puisse l'appliquer ici car il faudrait avoir inititialement une loi de probabilité sur le nombre de chiffre.

Par exemple si on tire un entier N au hasard (loi uniforme) entre 1 et 100 et on considère N jetons numérotés entre 1 et N. On tire un jeton. Si on sait que l'on a tiré, par exemple, le jeton 12 cela modifie la loi "a priori". En effet alors qu'initialement on avait
p(N=10) = 1/100

on a maintenant p(N=10) = 0



Posted by: nox

Citation:
Posté par Yipee
Par exemple si on tire un entier N au hasard (loi uniforme) entre 1 et 100 et on considère N jetons numérotés entre 1 et N. On tire un jeton. Si on sait que l'on a tiré, par exemple, le jeton 12 cela modifie la loi "a priori". En effet alors qu'initialement on avait
p(N=10) = 1/100

on a maintenant p(N=10) = 0


Mais on ne parle plus de probabilités alors non???

Une fois qu'un événement s'est réalisé evidemment la probabilité de sa réalisation est de 100%.
Je suis loin d'être un expert aussi ^^ mais simplement si ce que tu dis est juste je ne comprends plus le but des probabilités. Je ne vois pas en quoi le fait qu'un événement se soit réalisé vient modifier sa probabilité de réalisation!!
Ou alors en considérant comme tu le dis que cette probabilité passe à 1 puisqu'on sait que c'est arrivé...mais alors ca n'a vraiment aucun intérêt non?



Posted by: Yipee

Ce que je veux dire c'est que, dans mon exemple qui était plus simple. Au début, sans information, la loi de N est uniforme, tout nombre a la même probabilité d'être tiré. Sachant que l'on a pris le jeton 12, cela modifie la loi de distribution du chiffre N et de ce fait la probabilité de tirer un nombre donné. Cela peut servir si on continue l'exemple en disant : tire un deuxième jeton. Calculer la probabilité que ce soit le 13.



Posted by: nox

dans le cas de tirages sans remise oui ok...je comprends ton exemple.
Si on modifie l'espace \omega de l'ensemble des possibilités il faut en tenir compte.

Mais la je pense qu'on s'égare c'est plus une question de formulation.

De toute facon je crois qu'on est d'accord pour dire que rien de tel ne s'applique ici puisque le temps n'apporte aucune information supplémentaire.



Posted by: jean47

Bonsoir et merci pour vos reflexions (je ne connais pas l'estimation bayesienne?)

je m'explique certainement mal en employant "probabilité!!

Si on suppose qu'il y a 10 nombres dans le chapeau et que le nombre étudié ici est le 3, il a la même probabilité(constante) que les autres nombres, donc est ce le hasard seul qui fait qu'il soit sorti apres n (variables)tirages successifs, , ou peut on en deduire une probabilité pour le nb de tirages à venir pour tirer encore le 3?

Un simple coup d'oeil à la séquence me fait dire que le 3 a une chance d'être tiré avant 11 tirages car tous les nombres sont inf ou egaux à 5 (sauf le 11)
De même la moyenne des écarts est 4 ?
Ne peut on pas alors uiliser la loi des séries par ex, ou moyenne ou un ecart type?

merci
Bonne soirée



Posted by: jean47

Bonsoir et merci pour vos reflexions (je ne connais pas l'estimation bayesienne?)

je m'explique certainement mal en employant "probabilité!!

Si on suppose qu'il y a 10 nombres dans le chapeau et que le nombre étudié ici est le 3, il a la même probabilité(constante) que les autres nombres, donc est ce le hasard seul qui fait qu'il soit sorti apres n (variables)tirages successifs, , ou peut on en deduire une probabilité pour le nb de tirages à venir pour tirer encore le 3?

Un simple coup d'oeil à la séquence me fait dire que le 3 a une chance d'être tiré avant 11 tirages car tous les nombres sont inf ou egaux à 5 (sauf le 11)
De même la moyenne des écarts est 4 ?
Ne peut on pas alors uiliser la loi des séries par ex, ou moyenne ou un ecart type?

merci
Bonne soirée



Posted by: BancH

Citation:
Posté par jean47
est ce le hasard seul qui fait qu'il soit sorti apres n (variables)tirages successifs?
Oui bien sûr.
Citation:
Posté par jean47
ou peut on en deduire une probabilité pour le nb de tirages à venir pour tirer encore le 3?
Tu ne peux pas à coup sûr trouver la vrai probabilité, le mieux que tu puisses faire : P_3\simeq \frac{1}{\frac{3+4+12+6}{4}}=\frac{1}{6,25}\simeq \frac{1}{6} Le numéro 3 sort en moyenne tous les 6 tirages. Il y a probablement 6 numéros dans le chapeau.

PS : Tu as oublié un "T" dans la série de 11.



Posted by: jean47

bonsoir et merci,
si je comprends bien, 3 est la somme TT+S, 4=TTT+S etc..
(oui sorry j'ai oublié un T)
Ne suis je pas en train de chercher la Tendance ou l'Espérance statistiques?

Si j'étudie les écarts succesifs suivants:
1,4,7,4,21,9,8,1,3,8,4,10,3 ?
supposons que ce soit le tirage du 3 parmi 10 nombres (soit une probabilité égale pour tous les 10 nombres à 1/10)
Il y a eu 95 tirages et 13 tiages du 3 donc 13% environ de réussite du 3
la moyenne des écarts est 83/13=6
l'écart max=21 (inutile)
l'écart min=1 (inutile)
l'écart le plus fréquent=4
le nb d'écarts < ou égal à8=10 et > à 8: 3

je pourrais alors estimer que le prochain écart sera < à 8, proche de 6 (moyenne) mais plus proche encore de 4, en sachant qu'un écart "grand" (>15 ou 20) sera présent au bout de 5 tirages au maximum au vu de la série?
Est ce réaliste?

je vais appliquer ta formule donnée plus haut pour voir si je trouve dans cet exemple 4?? ce serait super? (l'empirisme rejoint la science!!)

Bonne soirée et encore merci



Posted by: jean47

Re,
j'ai bien compis la formule, mais je ne comprends pas pourquoi tu écris qu'il y a 6 boules dans le chapeau car le 3 sort tous les 6 tirages (même sils ont la même probabilité)?

Est ce que ta formule change si le nombre de boules total change ?
par ex: 20 boules dans le chapeau avec la même séquence de tirages du 3 ( 2,3,11,5)?
Va t il espérer sortir toujours apres 6 tirages?
merci



Posted by: BancH

Désolé j'avais pas vu que c'était niveau supérieur, ma formule est niveau seconde...

Tu ne peux pas trouver de probabilité sans connaître le nombre de boules, tu peux juste faire une estimation ou alors si tu as un nombre de tirages suffisamment grand par rapport au nombre de numéros la formule te donne l'inverse d'une valeur approchée du nombre de numéros, par exemple si tu obtiens \frac{1}{10.16} alors il y a 10 numéros.

Mais avec tes 25 tirages et vue la fréquence d'apparition du numéro voulu, on ne peut pas être sûr qu'il y avait 6 numéros.



Posted by: nox

C'est vrai cependant qu'il existe des manières de déterminer une espérance empirique en se basant sur un seul échantillon je crois...il existe des algorithmes permettant de "dupliquer" une expérience et d'estimer ainsi les paramètres de la loi de probabilité je crois. (à confirmer...je sais que j'ai vu des trucs de ce genre en série chro cette année mais je suis incapable de me souvenir de mes cours pour l'instant et j'ai pas la force de fouiller ^^)



Posted by: buzard

Bonjour,

Il y a une notion que vous avez tous laissé de côté : l'indépendance des tirages.

Si les tirages sont indépendant (le chapeau est trés bien mélangé entre les tiirages, ou on utilise un nouveau chapeau à chaque fois) alors la probabilité de tiré un nombre suit une loi de bernouilli, et il apparaitra en moyenne tout les 1/p tirages.

Si les tirages ne sont pas indépendant (le chapeau est mal mélangé, ou on repose le numero en surface et on prend un numero en surface) alors effectivement la probabilité est modifié. Tu peut même t'arranger pour reprendre toujours le même numéro, mais c'est plus des proba, ça deviens de la prestitigation.

En ce qui concerne la loi des séries, c'est pas un truc qu'on aplique à un tirage. Elle exprime simplement que plus les echantillion sont grand plus les estimateur sont proches des paramètre réels de la loi. En effet tu peut estimer le nombre de boules avec un echantillion tel que celui la, mais les intervals de confiance seront grotesque, tu n'aura aucune confidence dans la qualité de l'estimation.

dans ton cas tu trouve bien comme estimation de p=4/25, tu peut donc estimer le nombre de boule à 1/p = 6 ou 7 si tu considère qu'il y a equiprobabilité.

c'est ce que voulait dire Banch à ce sujet, tu peut continuer est faire de la prédiction à partir de cette estimation, pour les autres tirages :

P(TT...TS) = P(Nb T = k) = (1-p)^k p

\begin{array}{c|c|c}<br />
\text{nb de T} &amp; \text{%} &amp; \text{cumule} \\ \hline<br />
0 &amp; 16.00 &amp; \\<br />
1 &amp; 13.44 &amp; 29.44 \\<br />
2 &amp; 11.29 &amp; 40.73 \\<br />
3 &amp; 09.48 &amp; 50.21 \\<br />
13 &amp; 01.66 &amp; 91.29 \\<br />
26 &amp; 00.17 &amp; 99.10 \\<br />
39 &amp; 00.02 &amp; 99.91<br />
\end{array}

bref tu a un peu plus de 50% des succes (S) qui arrivent apres 3 echecs (T) ou moins. D'ou ton impression initiale sur les série de quatre tirages.



Posted by: BancH

Citation:
Posté par buzard
dans ton cas tu trouve bien comme estimation de p=4/25
Ca, ce n'est pas totalement juste car on a arrêté d'effectuer les tirages juste quand le numéro est sorti pour la quatrième fois, 25 n'est pas un nombre pris au hasard.

C'est pour ça que je préfère faire la moyenne des écarts entre chaque sortie du numéro.



Posted by: jean47

Bonsoir,
j'ai encore une nouvelle solution donnant un nouveau résultat par l'esperance d'une variable aléatoire de loi géométrique (?)

Le nombre moyen de tirages qu'il faudra est E=1/p
Il faut à présent déterminer p, à partir de l' échantillon
(loi des grands nombres)
le nombre de fois du 3 divisé par le nombre de tirages est p.

on trouve que p est environ égal à 4/21.soit 5 tirages pour avoir le 3 (21/4)

je m'apercois que le résultat varie de 4 à 6 selon les méthodes.
bonne soirée



Posted by: BancH

Citation:
Posté par jean47
21/4
Il y a 25 tirages, pas 21. Donc ça te donnerait \frac{25}{4}\simeq 6 .

Tu peux calculer le rapport du nombre de tirages et du nombre de sorties du numéro, ce qui donne 6.25, mais comme l'on arrête les tirages juste au moment où le numéro voulu est sorti, ton résultat est légèrement inférieur à ce que tu devrais trouver.

Ou alors tu fais la moyenne du nombre de tirages entre chaque sortie du numéro en commençant par le tirage qui suit sa première sortie et en finissant par celui qui précède sa dernière sortie, ça fait : \frac{3+11+5}{3}=6.33 mais on ne voit pas vraiment si il faut arrondir à 6 ou à 7 (car il n'y a pas assez de tirages).

D'après moi c'est la meilleure estimation.



Posted by: jean47

Re et merci pour ces explications claires (sorry pour le niveau supérieur!)
Dans les 2 cas on trouve 6 !!
Que penses tu préférable comme méthode si on a beaucoup, beaucoup.. d'écarts?

Est il possible de joindre un fichier zippé ici de 55Ko (appli Excel, analysée avec Norton2006!!!) car vous verrez mon travail d'écarts et de sorties impressionnant!
Bonne soirée


PS: on a oublé le cas où le 3 sortait 2 fois de suite:
TTTSSTTTTTT ?? dans ce cas on a un écart 0 entre, faut il alors le compter?



Posted by: jean47

Si on ne finit pas sur une sortie mais un Tirage, quelle méthode choisis tu?
merci



Posted by: BancH

Citation:
Posté par jean47
Que penses tu préférable comme méthode si on a beaucoup, beaucoup.. d'écarts?
Si on a beaucoup d'écarts entre chaque sortie, ça dépend, si tu te dis :

- "je vais effectuer n tirages" : 3$P=\frac{E_S}{E_T+E_S}(le résultat sera généralement supérieur à sa vraie valeur), le numéro sort tous les 3$\frac{E_T}{E_S}+1 tirages (résultat généralement inférieur).

- "je m'arrête dès que le numéro est sorti n fois" : tu utilises la moyenne du nombre de tirages entre chaque sortie sans compter les premiers et les derniers tirages.
Citation:
Posté par jean47
dans ce cas on a un écart 0 entre, faut il alors le compter?
Oui, sinon ça fausse la moyenne des écarts.
Citation:
Posté par jean47
Si on ne finit pas sur une sortie mais un Tirage, quelle méthode choisis tu?
Là ça change tout, d'après ce que tu as dit au début, c'est voulu que le dernier événement soit une sortie, si ça ne l'est pas, tu peux très bien faire 3$P=\frac{E_T}{E_S}+1 Ce n'est pas la peine de faire la moyenne des écarts si le nombre de tirages effectués au total est choisi au début.


PS: ne te fie pas trop à tout ce que je te dis, c'est pas des trucs que j'ai appris que je te sors, c'est juste ce que je pense être juste.



Posted by: jean47

Bonjour
merci pour ces idées.
j'ai donc 3 méthodes pour mon exemple:
moyenne1:
1/3+4+12+6/4=1/6.25 donc environ 6 tirages
moyenne d'écarts:
2+3+11+5/4= 5 tirages
loi des grands nombres:
4/25= 6 tirages (c'est bien le nombre total des tirages avec sorties 25 et non sans les sorties 21 qu'il faut prendre, car le résultat changerait et deviendrait 5)


PS: pas de possibilité pour le fichier?

Bonne journée



Posted by: jean47

Bonsoir,

j'ai voulu appliquer les 3 méthodes sur un échantillon:

4T 1S 8T 2S 3T 1S 2T 2S 5T 1S 11T 1S 19T 2S
soit 52 Tirages infructueux, 10 sorties du numéro donc 62 T+S au total:

En appliquant la loi des grands nombres:
62/10= 6.2 soit 6

La moyenne T+S/nb de goupe T lié à S= 62/7 (=5+10+4+4+6+12+21/ 7 "paquets de T lié à S) soit 8.9 donc 9 tirages

et la moyenne "normale" soit 52/7= 7.4 soit 7 tirages....
De quoi y perdre son latin.....non?
Bonne soirée
jean











-