Retard, probabilite et statistiques

Discussion générale entre passionnés et amateurs de mathématiques sur des sujets mathématiques variés
beagle
Habitué(e)
Messages: 8707
Enregistré le: 08 Sep 2009, 15:14

par beagle » 27 Oct 2011, 12:35

Maisil n' y a pas rattrapage dans le fait de trouver une distribution.
Plus on augmente les tirages plus la distribution autour de la moyenne se dessine avec précision,
bien,
mais cela n'a aucun rapport de cinétique comblementesque.
La cinétique est moyennisante, pas comblementesque, pas rattrapageuse.
L'important est de savoir quoi faire lorsqu'il n' y a rien à faire.



LeJeu
Membre Irrationnel
Messages: 1141
Enregistré le: 24 Jan 2010, 22:52

par LeJeu » 27 Oct 2011, 12:38

beagle a écrit:Avait-on des résultats à interpréter comme normaux (donc comblement retard gagne ou gagne pas selon les séries, les études, de façon normale )
ou bien avait-on un biais lié comme expliqué par la fonction random

Donc super de savoir que random fait des tirages sans remise, merci nuage.
Et quid des études de Skullkid versus LeJeu, victoire et défaites normalement distribuées ou non?


Beagle; dès que possible j'essaie de vous tracer quelques courbes pour visualiser mes résultats !

beagle
Habitué(e)
Messages: 8707
Enregistré le: 08 Sep 2009, 15:14

par beagle » 27 Oct 2011, 12:45

"Que penser de l'affirmation suivante : "La valeur la plus probable d'une inconnue donnée par des expériences est celle qui correspond à la plus grande fréquence, et tel est le cas de la moyenne arithmétique dans le cas des observations directes" "

ce truc est vrai,
sauf dans les cas que l'on t'a précisés où c'est faux,
mais c'est vrai, oui!
L'important est de savoir quoi faire lorsqu'il n' y a rien à faire.

beagle
Habitué(e)
Messages: 8707
Enregistré le: 08 Sep 2009, 15:14

par beagle » 27 Oct 2011, 13:04

pile ou face
100 tirages: 45 pile donne 0,45
les 10 000 tirages suivants donnent 4917 pile,
donc un retard qui s'est creusé de 83, on un retard de 83+5
aucun rattrapage donc
et pourtant
(4917+45)/10 100= 0,49

dans cet exemple il n' y a pas eu de rattrapage,
les pile ne sont pas sortis ni plus vite, ni plus souvent
et les pile rejoignent pourtant tranquillement la moyenne
L'important est de savoir quoi faire lorsqu'il n' y a rien à faire.

Skullkid
Habitué(e)
Messages: 3075
Enregistré le: 08 Aoû 2007, 20:08

par Skullkid » 27 Oct 2011, 16:30

Dlzlogic a écrit:"La valeur la plus probable d'une inconnue donnée par des expériences est celle qui correspond à la plus grande fréquence, et tel est le cas de la moyenne arithmétique dans le cas des observations directes"


Cette phrase, donnée telle quelle, est fausse (ou alors il faut définir "observations directes") puisque, comme dit, quand je fais des tirages au hasard 0 ou 1 (pile ou face), les seuls résultats possibles sont 0 et 1, et la moyenne des résultats sur plusieurs expériences ne sera vraisemblablement ni 0 ni 1.

La raison pour laquelle en physique on prend la moyenne comme résultat significatif (et non pas probable, qui en soi ne veut rien dire) d'une mesure, c'est que l'instrument de mesure est modélisé comme un tirage aléatoire. Plus précisément, si on a une grandeur qui vaut exactement A et qu'on la mesure avec un instrument dont la précision est p, on suppose que l'instrument de mesure renvoie une valeur au hasard (loi uniforme) dans l'intervalle [A-p,A+p], et que le résultat d'une mesure n'influence pas le résultat des suivantes.

Donc, d'après ce modèle, la suite des résultats affichés par l'instrument de mesure est une suite de variables aléatoires indépendantes et identiquement distribuées, et donc, d'après le théorème central limite, converge en loi vers une loi normale d'espérance A, la "vraie" valeur qu'on cherche à mesurer.

ffpower
Membre Complexe
Messages: 2542
Enregistré le: 13 Déc 2007, 05:25

par ffpower » 27 Oct 2011, 16:40

Skullkid a écrit:Donc, d'après ce modèle, la suite des résultats affichés par l'instrument de mesure est une suite de variables aléatoires indépendantes et identiquement distribuées, et donc, d'après le théorème central limite, converge en loi vers une loi normale d'espérance A, la "vraie" valeur qu'on cherche à mesurer.


Ya du mélange de pinceaux là, entre TCL et loi des grands nombres..Ta moyenne elle converge vers A, pas de loi normale là dedans

Skullkid
Habitué(e)
Messages: 3075
Enregistré le: 08 Aoû 2007, 20:08

par Skullkid » 27 Oct 2011, 16:48

C'est vrai que la loi des grands nombres suffit pour justifier que la moyenne arithmétique converge vers l'espérance, mais je tenais à faire apparaître le théorème central limite puisque c'est ce résultat qui est verbe sacré pour Dlzlogic.

beagle
Habitué(e)
Messages: 8707
Enregistré le: 08 Sep 2009, 15:14

par beagle » 27 Oct 2011, 17:00

""Que penser de l'affirmation suivante : "La valeur la plus probable d'une inconnue donnée par des expériences est celle qui correspond à la plus grande fréquence, et tel est le cas de la moyenne arithmétique dans le cas des observations directes" ""

Lorsque l'on prend des mesures comme la taille de personnes par exemple,
cela me semble vrai, non?
Cela ne dit rien d'autre que le point le plus haut de la courbe de Gauss est à la moyenne, non?
L'important est de savoir quoi faire lorsqu'il n' y a rien à faire.

Dlzlogic
Membre Transcendant
Messages: 5273
Enregistré le: 14 Avr 2009, 13:39

par Dlzlogic » 27 Oct 2011, 17:15

Le terme "observation directe" est employé par opposition à "observation résultant d'une mise en oeuvre de plusieurs observations directes".
Si c'est ce dernier cas, on affecte à chaque mesure un poids calculé à partir de l'emq résultante des observations élémentaires.

La raison pour laquelle en physique on prend la moyenne comme résultat significatif (et non pas probable, qui en soi ne veut rien dire) d'une mesure, c'est que l'instrument de mesure est modélisé comme un tirage aléatoire. Plus précisément, si on a une grandeur qui vaut exactement A et qu'on la mesure avec un instrument dont la précision est p, on suppose que l'instrument de mesure renvoie une valeur au hasard (loi uniforme) dans l'intervalle [A-p,A+p], et que le résultat d'une mesure n'influence pas le résultat des suivantes.
C'est un peu plus compliqué que ça. La précision des appareils de mesure est caractérisée par leur emq (écart-type). Le hasard n'a rien à voir dans une mesure. On appelle ça "erreur accidentelle" par opposition à "erreur systématique".

Il n'est évidemment pas imaginable de remettre en cause cette citation, ni de la discuter. On appelle "valeur la plus probable d'une inconnue" la valeur qui se trouve au milieu de la courbe de Gauss et on posé d'abord comme postulat que c'était la moyenne arithmétique, puis on l'a vérifié sur un certain nombre d'observations dans tous les domaines, enfin on a démontré que c'était effectivement la plus probable.

L'expression "valeur vraie" a un sens particulier. On ne peut connaitre la "valeur vraie" que par une détermination précédente et avec des moyens techniques plus importants. En fait, la valeur vraie n'est vraie que vis à vis d'une autre. Exemple : soit une base de 250m (située au Jardin des Tuileries). On connait sa longueur. Lorsqu'on la mesure avec un ruban de 20M. par exemple, on considérera cette longueur connue comme valeur vraie. Dans ce cas, le dénominateur de l'écart type ne sera plus (n-1) mais n.

suite de variables aléatoires indépendantes et identiquement distribuées
Les valeurs ne sont certainement pas identiquement distribuées. Elles DOIVENT être distribuées selon la règle que j'ai déjà précisée (25% 16% 7% 2%). Et ceci est toujours le cas si les mesures sont exemptes d'erreurs systématiques.

beagle
Habitué(e)
Messages: 8707
Enregistré le: 08 Sep 2009, 15:14

par beagle » 27 Oct 2011, 17:53

j'ai dit oui pour certains cas , sans savoir que je signais pour une moyenne arithmétique,
j'ai vu moyenne, je vois que l'on parle aussi d'espérance,
bon si dans courbe de gauss il y a un point haut et que la courbe est symétrique de chaque coté de ce point haut cela doit bien faire de la moyenne arithmétique ce truc,
m'enfin je ne me battrais pas sur ce truc qui ne m'intéresse pas vraiment.
Je ne comprends pas comment Dzlogic fait pour contrattaquer en rebalançant d'autres trucs qui ne sont pas directement liés dans un raisonnement , m'enfin ...

perso j'attends des réponses sur les simulations informatiques,
comment on analyse cela,
comment on montre si l'ordi triche etc ...
je suis impatient de vous lire sur des trucs comme ça.
L'important est de savoir quoi faire lorsqu'il n' y a rien à faire.

Skullkid
Habitué(e)
Messages: 3075
Enregistré le: 08 Aoû 2007, 20:08

par Skullkid » 27 Oct 2011, 17:55

beagle a écrit:""Que penser de l'affirmation suivante : "La valeur la plus probable d'une inconnue donnée par des expériences est celle qui correspond à la plus grande fréquence, et tel est le cas de la moyenne arithmétique dans le cas des observations directes" ""

Lorsque l'on prend des mesures comme la taille de personnes par exemple,
cela me semble vrai, non?
Cela ne dit rien d'autre que le point le plus haut de la courbe de Gauss est à la moyenne, non?


Non, ça dit que la moyenne arithmétique est un résultat qui a de plus grandes chances de sortir quand tu fais ta mesure, ce qui est faux en général. Ce qui est vrai, c'est que quand tu fais la moyenne arithmétique de tes résultats, pour un nombre assez grand de résultats, cette moyenne a de plus grandes chances d'être proche de l'espérance.

Pour ton exemple de taille de personnes, en supposant que les tailles sont distribuées selon une loi uniforme, quand tu tires une personne au hasard, tu as autant de chances de tomber sur 1m20 que sur 1m70. Bien sûr, en vrai, la distribution des tailles n'est pas uniforme, et j'imagine qu'elle a une forme de cloche, un peu comme une gaussienne, et que du coup on a effectivement plus de chances de trouver une personne de taille moyenne qu'un nain ou un géant.

Dlzlogic a écrit:C'est un peu plus compliqué que ça. La précision des appareils de mesure est caractérisée par leur emq (écart-type). Le hasard n'a rien à voir dans une mesure. On appelle ça "erreur accidentelle" par opposition à "erreur systématique".


Je t'accorde que mon modèle avec la loi uniforme n'est sans doute pas celui qui est utilisé pour tous les instruments de mesure. Mais le fait qu'on caractérise la loi de l'instrument de mesure par un écart-type, ça n'implique pas que la loi soit gaussienne. La loi uniforme elle a aussi un écart-type. Le fait de dire "on caractérise les instruments de mesure par leur écart-type" ça dit juste qu'on connaît l'écart-type de la loi de l'instrument de mesure, rien d'autre.

Après, en ce qui concerne les instruments de mesure que tu manipules, peut-être qu'on les modélise comme suivant une loi normale centrée sur la vraie valeur (au sens intuitif), mais c'est une hypothèse de plus que tu fais (sans doute est-elle justifiée). On peut toutefois imaginer un protocole de mesure (peu intéressant, certes) de longueur avec une règle graduée dans lequel, si on "tombe entre deux graduations", on répond un nombre au hasard situé entre les deux graduations. Le protocole de mesure sera caractérisé par un écart-type, qui sera celui de la loi uniforme, dont l'espérance ne sera pas forcément la vraie longueur de l'objet mesuré.

Comme dit, peut-être que dans ton métier, les résultats sont supposés suivre une loi normale, et ça se justifie sans doute, mais ce n'est pas pour ça que la seule loi qui existe est la loi normale.

Identiquement distribuées ça ne veut pas dire uniformément distribuées. A et B sont identiquement distribuées signifie que A et B suivent la même loi.

beagle
Habitué(e)
Messages: 8707
Enregistré le: 08 Sep 2009, 15:14

par beagle » 28 Oct 2011, 12:28

L'important est de savoir quoi faire lorsqu'il n' y a rien à faire.

Dlzlogic
Membre Transcendant
Messages: 5273
Enregistré le: 14 Avr 2009, 13:39

par Dlzlogic » 28 Oct 2011, 13:21

Bonjour,
Oui, c'est intéressant.
D'ailleurs, au début des jeux de poker sur internet, il y a eu un souci : deux joueurs ont joué strictement en même temps, ils ont eu la même carte.
Moi qui croyais que ce genre de choses n'arrivaient que dans les film de Western :ptdr:
Concernant le générateur que j'utilise : "générateur de nombres aléatoires par congruences multiplicatives de période 2^32". Il renvoie un nombre pseudo-aléatoire.
La "graine" utilisée est une lecture automatique de l'horloge.
Je n'ai vraiment pas plus d'informations sur ces points.

Dernièrement, sur je ne sais plus sur quel forum, un visiteur demandait si on pouvait avoir confiance dans un générateur de nombre pseudo-aléatoire, je lui ai répondu que oui. :hum:

beagle
Habitué(e)
Messages: 8707
Enregistré le: 08 Sep 2009, 15:14

par beagle » 28 Oct 2011, 13:37

Mes conclusions pour le moment.
On trouve des résultats gagnants.
Soit c'est la distibution normale du fait que l'on va gagner et l'on va perdre aussi de façon égale,
reprendre les mots-explications de Doraki, Skullkid QS
Soit il y a un biais.

En l'occurrence il semblerait que l'on ait réussi à trouver un des tests qui permettent de voir si les données sont aléatoires ou non, c'est le test du rattrapage de retard, ou du comblement de retard.
Si en jouant les retards on gagne plus (plus souvent de façon significative) que de jouer au hasard,
c'est que les données aléatoires sont trop parfaites.
Je pense comme dit plus avant que si on avait de nombreuses études de n tirages F et P,
dans ce cas présent on devrait avoir une distribution des F-P plus resserrée que la normale attendue.
Mais combien de séries permettent de le dire et qui sait faire????

Comme le biais augmente avec n, merci nuage,
il faut que LeJeu s'il veut continuer, compare les résultats,
de la very big étude
contre le mème nombre étudié dans des séries plus courtes.
Et que les as de l'ordinateur nous explique à quel moment le random se réinitialise, ce serait sympa.
L'important est de savoir quoi faire lorsqu'il n' y a rien à faire.

LeJeu
Membre Irrationnel
Messages: 1141
Enregistré le: 24 Jan 2010, 22:52

par LeJeu » 28 Oct 2011, 16:27

beagle a écrit:Mes conclusions pour le moment.

En l'occurrence il semblerait que l'on ait réussi à trouver un des tests qui permettent de voir si les données sont aléatoires ou non, c'est le test du rattrapage de retard, ou du comblement de retard.
Si en jouant les retards on gagne plus (plus souvent de façon significative) que de jouer au hasard,
c'est que les données aléatoires sont trop parfaites.

J'aime bien l'approche ! ( imparfaites tu voulais dire ?)

nuage a écrit:Il faut comprendre que la fonction rand() lit une permutation déterminée d'un ensemble fini d'entiers.
Si tu fait beaucoup de tirages ils ne sont plus indépendants.

beagle a écrit:Et que les as de l'ordinateur nous explique à quel moment le random se réinitialise, ce serait sympa.

Voila le code utilisé par rand:
Code: Tout sélectionner
        return(((holdrand = holdrand * 214013L + 2531011L) >> 16) & 0x7fff);

holrand est la valeur précédente : on tourne effectivement sur 32767 valeurs, à coup de multiplication, addition,division par 16, et remise à 0 du bit de plus haut rang
comme dans mon cas je fais un modulo deux, j'ai beaucoup de mal à voir pourquoi mes tirages ne sont plus indépendants...
Beagle, ca tourne en rond ainsi, sauf si on fait un reset de holrand avec la fonction srand()

beagle a écrit:il faut que LeJeu s'il veut continuer, compare les résultats,
.

J'ai donc fait une série de 10000 parties de 1000 tirages, avec deux joueurs
"retard"et "aléa" , et j'ai compté le nb de bonnes réponses à chaque partie

coté moyenne : 499,9974 pour aléa (normal :-) )et un peu mieux pour retard :500,9324

coté distribution : c'est un peu ambigu ! mais il semble que la courbe retard est un peu décalée à droite ?
Image

Ca manque d'observations : j'y retourne ...

LeJeu
Membre Irrationnel
Messages: 1141
Enregistré le: 24 Jan 2010, 22:52

par LeJeu » 28 Oct 2011, 17:07

Je suis reparti avec 500 000 parties de 1000 tirages :

Moyenne alea = 499,999978 & Moyenne retard = 502,078554

Coté distribution , pour moi c'est net ...
Image

Qu'en pensez vous ?

beagle
Habitué(e)
Messages: 8707
Enregistré le: 08 Sep 2009, 15:14

par beagle » 28 Oct 2011, 19:42

J'en pense qu'il y a bien un biais à priori.

J'en pense que j'amerais savoir ce que donne la distribution des F-P obtenues versus attendu QS.

J'en pense que comme je comprends pas très bien le random, j'ai du mal à lui faire un protocole pour le contrer, genre:
toutes les séries de 1000 sont faites dans l'ordre,
cela change-t-il de faire les séries dans le désordre
d'abord on donne le numéro 1 des 500 séries à venir
puis le 2 des 500 séries distribué au hasard
puis le 3 des 500 séries distribué au hasard
...

J'en pense que j'aimerais les retours de nos pointures nuage, doraki, ffpower, skullkid,...
L'important est de savoir quoi faire lorsqu'il n' y a rien à faire.

beagle
Habitué(e)
Messages: 8707
Enregistré le: 08 Sep 2009, 15:14

par beagle » 29 Oct 2011, 09:47

On sait que l'aléatoire de l'ordi n'est pas un vrai aléatoire.
On sait mème par nuage que cela revient à un tirage sans remise.
Or que fait le tirage sans remise:
sac avec 5 boules rouge et 5 boules noires,
je tire 1 noire,
je tire 2 noires
à chaque fois j'augmente les chances de rouge qui est en retard,
puisque reste dans le sac le retard.
Donc nous savons que l'aléatoire n'est pas bon,
et dans ce qu'il a de pas bon, nous savons que le biais sera logiquement d'avoir un comblement de retard anormal.
donc tout va bien.

ensuite le sac est super grand pour le random,
donc comment fait-on pour vérifier la mauvaise influence du tirage sans remise.
Comme le dit nuage, plus n sera grand et plus on verra piocher dans le retard,
plus n est petit plus la différence entre retard et pas retard est faible et ce biais a peu de retentissement.
Donc il appartient aux informaticiens de dire comment je fais pour remplir le sac, ou pour rester à un faible niveau d'influence, on revient sur comment se réinitialise le random par rapport aux études faites, comment on fait le mème nombre de tirage de 1 million comme Lejeu sur de plus petites séries.
Si pas de réinitialisation de random, l'influence du sac qui tire les en retard doit se reporter plus sur les dernières séries de 1000,
quel nombre reremplit le sac,
avant ce nombre étudier le nombre de série favorable au retard,
en début d'études versus fin d'études.

Plus la distribution des F-P (quand on a un truc en tète , c'est pas dans les pieds.

Bon, de toute façon on est bon puisqu'on a redécouvert un test qui permet de vérifier si on a un bon aléatoire sur ce critère.
Voili, voilou,
au plaisir de vous lire sur ce que je n'ai pas compris et qui est faux,
Mais on rejoint bien l'intérèt du début du fil,
on est en plein dedans.
L'important est de savoir quoi faire lorsqu'il n' y a rien à faire.

Avatar de l’utilisateur
fatal_error
Modérateur
Messages: 6610
Enregistré le: 22 Nov 2007, 13:00

par fatal_error » 29 Oct 2011, 12:26

Ca devient un peu foutoir ce fil. :help:

Donc je vais essayer de resynthétiser ce qui a été dit :
Problématique
Si à un moment donné tel évènement est "en retard", alors il a plus de chances de se produire "plus vite", puis il va forcément "rattraper son retard".

Théorême central limite et interprétations


les tirages sont supposés uniformes et indépendants les uns des autres.

Il se trouve que la répétition d'une opération aléatoire donne TOUJOURS la même répartition, quelque soit la méthode utilisée, pièces, boules, tir au pistolet, fermeture des angles de triangles.

il est CERTAIN que au bout d'un certain nombre de tirages, tu auras un équilibre (presque une égalités) entre les plie et les face.

Je veux bien dire des trucs comme "si (Xn) est une suite de variables aléatoires indépendantes de même loi, de moyenne m et d'écart type ;) alors la suite de variables aléatoires Yn = (X1+...+Xn - n*m)/(;)*sqrt(n)) converge en loi vers la loi gaussienne".

Etant donné un grand nombre d'évènement indépendants et aléatoires, tels que le jeu de pile ou face, le tirage de boules dans un sac, le tir au pistolet, la fermeture de triangles en géodésie, est-il vrai que la répartition des écarts à la moyenne est toujours identique et connue sous le nom de courbe de Gauss ?
Réponse OUI (pour pil ou face)



L'affirmation que la moyenne arithmétique est la valeur la plus probable résulte-t-elle d'un postulat, ou au contraire d'un théorème, qui peut donc être démontré .
Réponse POSTULAT ou THéORèME

a tout moment la répartition des tirages respecte la loi normale (courbe Gauss). L'exact respect de la répartition ne peut arriver que pour un nombre infini de tirages


Côté simulation
En particulier la fonction rand() ne renvoie pas un nombre au hasard entre 0 et 1, mais un nombre déterminé entre 0 et 1.


Ben on a pas besoin de simulations pour calculer les lois des H et M


Pourquoi calculerait-on l'écart-type si ce n'est pas pour déterminer l'écart probable et vérifier que la répartition est conforme à la répartition normale (loi normale), c'est à dire pouvoir vérifier qu'il n'y a pas de systématisme, qu'aucune valeur ne dépasse les 4 erreurs probables etc.



la probabilité de sortie un face après une suite de 100 pile est 1- (0.5*quasi-nulle), c'est à dire presque 1


Il en résulte que si à un instant donné on constate un "retard" de l'un des évènements, ce retard sera forcément comblé, donc le chance de sortie de l'évènement concerné augmentent.



Remarque pertinente:
t'as écrit pleiin de trucs un peu comme des maths
donc je comprends rien,

edit: que beagle me pardonne, mais ya un moment ou faut arrêter le français et faut foutre les mains dans le tas. C'est bien de voir les choses avec du recul, mais c'est en construisant rigoureusement qu'on évite un maximum d'emmerdes.
la vie est une fête :)

beagle
Habitué(e)
Messages: 8707
Enregistré le: 08 Sep 2009, 15:14

par beagle » 29 Oct 2011, 13:38

Tiens j'avais oublié fatal-error dans les pointures, scuses...
bon avec ta bonne connaissance de l'informatique, c'est quand tu veux pour des explications
sur le random,
sur le sujet du fil si tu trouves que c'est foutoir,
je trouve pas ça foutoir dans la mesure où il me semble qu'on retombe sur nos pieds, mais bon.

sur le c'est des maths j'y comprends rien, j'ai bien reprécisé derrière: malheureusement, et c'est de ma faute, nul reproche c'est évident.

Les commentaires sérieux sont les bienvenus.
L'important est de savoir quoi faire lorsqu'il n' y a rien à faire.

 

Retourner vers ⚜ Salon Mathématique

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 4 invités

Tu pars déja ?



Fais toi aider gratuitement sur Maths-forum !

Créé un compte en 1 minute et pose ta question dans le forum ;-)
Inscription gratuite

Identification

Pas encore inscrit ?

Ou identifiez-vous :

Inscription gratuite