Loi de probabilité et distribution de résultat

Discussion générale entre passionnés et amateurs de mathématiques sur des sujets mathématiques variés
Dlzlogic
Membre Transcendant
Messages: 5273
Enregistré le: 14 Avr 2009, 12:39

par Dlzlogic » 08 Oct 2012, 12:05

beagle a écrit:Cela fera partie de la discussion à venir, d'autres intervenants que moi te l'expliqueront mieux.
...
Patience!
Tel que je te vois venir, t'es entrain d'essayer de me piéger. :zen:
En fait, je suis entrain de me demander si ces listes sont bien le résultat d'une expérience aléatoire, avec éventuellement une modification, dans le cadre de l'expérimentation que j'ai proposée. En effet, les séries résultant d'expérience dans laquelle il y a eu une faute ou une anomalie ne ressemblent par vraiment à celles que tu m'as proposées.
J'ai par contre le sentiment que ces séries résultent de fabrication artificielles, faites à partir d'une courbe de Gauss déformée. Si c'est cela BRAVO.



Sylviel
Membre Transcendant
Messages: 6466
Enregistré le: 20 Jan 2010, 12:00

par Sylviel » 08 Oct 2012, 12:14

C'est vrai que je suis curieux de la manière dont Dlzlogic interprète ses tableaux... Il établit un histogramme à 10 barres (chacune de largeur 1 écart-type sauf les extrêmités bien sûr) mais veut absolument les afficher sous forme de tableau (car ce n'est pas précis sinon parait-il) et compare cela à l'histogramme d'une loi normale. Mais "au jugé" visiblement...

Moi ce que l'on ma enseigné, et que j'enseigne, c'est qu'il y a deux choses : soit on veut se convaincre qualitativement, soit on effectue un test quantitatif. Qualitativement un histogramme est particulièrement efficace pour représenter la densité, mais on a tendance à vouloir prendre 50 ou 100 plages, et un milliers de valeurs pour avoir un truc un peu sympathique. Dans ce cas on voit qualitativement la tête de la fonction de densité, pour savoir quel type de test utiliser par exemple.
Des exemples de densité de probabilité : http://en.wikipedia.org/wiki/List_of_probability_distributions
(qui ne servent à rien d'après Dlzlogic puisque tout suis la loi normale... Pourquoi diable tant de gens s'acharnent-ils à étudier ces distributions ? Et plus encore à les utiliser dans des applications industrielles ou financières ?)

Quantitativement on fait un test au sens statistique du terme. Cela signifie une fonction qui prends les données de l'expérience et qui dis si oui ou non l'hypothhèse est vérifiée (l'hypothèse serait ici "les données n'ont pas été trafiquée).

Mais là on fait un savant mélange entre les deux, perdant, à mon avis, les qualités des deux approches...
Merci de répondre aux questions posées, ce sont des indications pour vous aider à résoudre vos exercices.

Dlzlogic
Membre Transcendant
Messages: 5273
Enregistré le: 14 Avr 2009, 12:39

par Dlzlogic » 08 Oct 2012, 13:55

Bonjour,
C'est vrai que je suis curieux de la manière dont Dlzlogic interprète ses tableaux... Il établit un histogramme à 10 barres (chacune de largeur 1 écart-type sauf les extrêmités bien sûr)

Juste un rectificatif, la largeur de me barres est 1 écart probable (ep = 2/3 emq). Dans la documentation que j'ai pu consulter dernièrement, l'unité choisie est l'écart-type (emq), il n'y a donc que 8 barres.
Si les écarts à la moyenne d'une expérience aléatoire (loi du hasard) n'a pas une répartition conforme à celle de la loi normale, je veux bien voir un exemple numérique.
Concernant "l'interprétation des tableaux" je le détaillerai à la fin du test de Beagle et avec des exemples réels.

beagle
Habitué(e)
Messages: 8746
Enregistré le: 08 Sep 2009, 14:14

par beagle » 08 Oct 2012, 15:21

Elle est fraiche ma série, elle est fraiche:

A4:
408,424,397,387,459,389,416,393,356,416,434,399,443,362,437,413,397,410,434,367,379,404,410,461

B4:
102,963,927,1070,889,1149,908,854,1132,755,1028,781,1110,915,1185,860,1057,1316,1028,835,723,1040,916,1077

C3
40,40,40,40,40,55,60,70,80,90,100,115,125,140,150,160,170,175,185,190,200,200,190,185,175,165,150,135,115,100,80,70,60,55,50,45
L'important est de savoir quoi faire lorsqu'il n' y a rien à faire.

Dlzlogic
Membre Transcendant
Messages: 5273
Enregistré le: 14 Avr 2009, 12:39

par Dlzlogic » 08 Oct 2012, 15:49

Code: Tout sélectionner
 Vérification de séries aléatoires  Série A4
Nombre = 24  Moyenne = 408.12  emq=27.94  ep=18.63
Classe 1  nb=   0  0.00%  théorique 0.35%
Classe 2  nb=   0  0.00%  théorique 2%
Classe 3  nb=   3  12.50%  théorique 7%
Classe 4  nb=   3  12.50%  théorique 16%
Classe 5  nb=   6  25.00%  théorique 25%
Classe 6  nb=   6  25.00%  théorique 25%
Classe 7  nb=   4  16.67%  théorique 16%
Classe 8  nb=   2  8.33%  théorique 7%
Classe 9  nb=   0  0.00%  théorique 2%
Classe 10 nb=   0  0.00%  théorique 0.35%
Correcte, mais trop beau pour être honnête.

Code: Tout sélectionner
 Vérification de séries aléatoires  Série B4
Nombre = 24  Moyenne = 942.50  emq=230.76  ep=153.84
Classe 1  nb=   1  4.17%  théorique 0.35%
Classe 2  nb=   0  0.00%  théorique 2%
Classe 3  nb=   0  0.00%  théorique 7%
Classe 4  nb=   3  12.50%  théorique 16%
Classe 5  nb=   8  33.33%  théorique 25%
Classe 6  nb=   7  29.17%  théorique 25%
Classe 7  nb=   4  16.67%  théorique 16%
Classe 8  nb=   1  4.17%  théorique 7%
Classe 9  nb=   0  0.00%  théorique 2%
Classe 10 nb=   0  0.00%  théorique 0.35%

Une valeur fausse.

Code: Tout sélectionner
 Vérification de séries aléatoires série C3
Nombre = 36  Moyenne = 112.22  emq=56.47  ep=37.65
Classe 1  nb=   0  0.00%  théorique 0.35%
Classe 2  nb=   0  0.00%  théorique 2%
Classe 3  nb=   0  0.00%  théorique 7%
Classe 4  nb=  13  36.11%  théorique 16%
Classe 5  nb=   5  13.89%  théorique 25%
Classe 6  nb=   5  13.89%  théorique 25%
Classe 7  nb=   9  25.00%  théorique 16%
Classe 8  nb=   4  11.11%  théorique 7%
Classe 9  nb=   0  0.00%  théorique 2%
Classe 10 nb=   0  0.00%  théorique 0.35%

Sûrement fausse.

Dis-moi, on en est à combien ?
Si j'avais su je t'aurais donné mon module.
Tu n'oublieras pas de dire quel est la méthode aléatoire utilisée, rand(), genrand() ou autre.

beagle
Habitué(e)
Messages: 8746
Enregistré le: 08 Sep 2009, 14:14

par beagle » 08 Oct 2012, 16:04

J'enlève ce message qui a du déplaire, y avait rien de bien méchant.

Donc dlzlogic si tu reviens, cela m'intéresse de voir la distribution de la mème série en enlevant "l'erreur", la valeur extrème.
L'important est de savoir quoi faire lorsqu'il n' y a rien à faire.

beagle
Habitué(e)
Messages: 8746
Enregistré le: 08 Sep 2009, 14:14

par beagle » 08 Oct 2012, 16:15

Donc pour la route:

série A5:
455,447,456,270,362,409,353,428,501,297,483,455,455,344,493,492,437,399,279,335,474,409,419,344

série B5:
813,656,1131,1411,1785,629,1113,1301,1456,778,731,1333,750,944,964,892,806,956,1146,1120,1043,763,731,764

série C:
demain:pluie!
L'important est de savoir quoi faire lorsqu'il n' y a rien à faire.

beagle
Habitué(e)
Messages: 8746
Enregistré le: 08 Sep 2009, 14:14

par beagle » 08 Oct 2012, 17:21

"Donc dlzlogic ..., cela m'intéresse de voir la distribution de la mème série en enlevant "l'erreur", la valeur extrème."

si tu peux mettre les derniers résultats, ensuite on analyse, je dis ce que j'ai fait.
Tu as bon aux analyses permises par ta méthode:
séries A se veulent gaussiennes
séries B se veulent Cauchy
séries C histogramme des températures, mais c'est pas n'importe quoi, ...
L'important est de savoir quoi faire lorsqu'il n' y a rien à faire.

Dlzlogic
Membre Transcendant
Messages: 5273
Enregistré le: 14 Avr 2009, 12:39

par Dlzlogic » 08 Oct 2012, 17:41

Code: Tout sélectionner
 Vérification de séries aléatoires  B4 bis
Nombre = 23  Moyenne = 979.04  emq=148.87  ep=99.25
Classe 1  nb=   0  0.00%  théorique 0.35%
Classe 2  nb=   0  0.00%  théorique 2%
Classe 3  nb=   2  8.70%  théorique 7%
Classe 4  nb=   4  17.39%  théorique 16%
Classe 5  nb=   6  26.09%  théorique 25%
Classe 6  nb=   6  26.09%  théorique 25%
Classe 7  nb=   3  13.04%  théorique 16%
Classe 8  nb=   1  4.35%  théorique 7%
Classe 9  nb=   1  4.35%  théorique 2%
Classe 10 nb=   0  0.00%  théorique 0.35%
Après suppression de la valeur fausse. Trop beau pour être honnête.
Code: Tout sélectionner
Vérification de séries aléatoires  série A5
Nombre = 24  Moyenne = 408.17  emq=69.62  ep=46.41
Classe 1  nb=   0  0.00%  théorique 0.35%
Classe 2  nb=   0  0.00%  théorique 2%
Classe 3  nb=   3  12.50%  théorique 7%
Classe 4  nb=   4  16.67%  théorique 16%
Classe 5  nb=   2  8.33%  théorique 25%
Classe 6  nb=   6  25.00%  théorique 25%
Classe 7  nb=   8  33.33%  théorique 16%
Classe 8  nb=   1  4.17%  théorique 7%
Classe 9  nb=   0  0.00%  théorique 2%
Classe 10 nb=   0  0.00%  théorique 0.35%
FAUX

Code: Tout sélectionner
 Vérification de séries aléatoires série B5
Nombre = 24  Moyenne = 1000.67  emq=293.19  ep=195.46
Classe 1  nb=   0  0.00%  théorique 0.35%
Classe 2  nb=   0  0.00%  théorique 2%
Classe 3  nb=   0  0.00%  théorique 7%
Classe 4  nb=   8  33.33%  théorique 16%
Classe 5  nb=   6  25.00%  théorique 25%
Classe 6  nb=   5  20.83%  théorique 25%
Classe 7  nb=   2  8.33%  théorique 16%
Classe 8  nb=   2  8.33%  théorique 7%
Classe 9  nb=   0  0.00%  théorique 2%
Classe 10 nb=   1  4.17%  théorique 0.35%
FAUX et une valeur invraisemblable.
Voila.

beagle
Habitué(e)
Messages: 8746
Enregistré le: 08 Sep 2009, 14:14

par beagle » 08 Oct 2012, 17:49

A5 faux c'est ennuyeux, je refais un tirage avec les mèmes données de base.
C'est normal que cela soit plus volatil car c'est pour illustrer la diminution de n et son impact.

Pour B4, c'est strange comment cela se joue à très peu, cela ne devrait pas spécialement marcher.
L'important est de savoir quoi faire lorsqu'il n' y a rien à faire.

Dlzlogic
Membre Transcendant
Messages: 5273
Enregistré le: 14 Avr 2009, 12:39

par Dlzlogic » 08 Oct 2012, 18:00

J'ai pas compris ce que tu m'as dit.

beagle
Habitué(e)
Messages: 8746
Enregistré le: 08 Sep 2009, 14:14

par beagle » 08 Oct 2012, 18:07

Je refais un tirage de A5 qui devait ètre gaussien, bien que plus dispersé que les précédents, car il repose sur une base de tirage moins élevée, moins d'éléments.
Et sinon, tu testeras aussi la base, on va voir,
mais je commençais à saturer et j'avais plus envie de discutailler des origines de la série,
elle descend de l'homme ...
L'important est de savoir quoi faire lorsqu'il n' y a rien à faire.

beagle
Habitué(e)
Messages: 8746
Enregistré le: 08 Sep 2009, 14:14

par beagle » 08 Oct 2012, 18:15

A6 cousine de A5:
455,530,409,279,372,483,362,381,353,344,483,372,502,335,483,418,428,446,427,288,474,409,419,344
L'important est de savoir quoi faire lorsqu'il n' y a rien à faire.

Dlzlogic
Membre Transcendant
Messages: 5273
Enregistré le: 14 Avr 2009, 12:39

par Dlzlogic » 08 Oct 2012, 18:29

Code: Tout sélectionner
 Vérification de séries aléatoires  Série A6
Nombre = 24  Moyenne = 408.17  emq=66.79  ep=44.53
Classe 1  nb=   0  0.00%  théorique 0.35%
Classe 2  nb=   0  0.00%  théorique 2%
Classe 3  nb=   2  8.33%  théorique 7%
Classe 4  nb=   5  20.83%  théorique 16%
Classe 5  nb=   3  12.50%  théorique 25%
Classe 6  nb=   7  29.17%  théorique 25%
Classe 7  nb=   5  20.83%  théorique 16%
Classe 8  nb=   2  8.33%  théorique 7%
Classe 9  nb=   0  0.00%  théorique 2%
Classe 10 nb=   0  0.00%  théorique 0.35%
Correcte.

beagle
Habitué(e)
Messages: 8746
Enregistré le: 08 Sep 2009, 14:14

par beagle » 08 Oct 2012, 18:39

On peut commencer la discussion.
Il y a les maths par le dessin, et les maths par le calcul.
Les maths par le dessin.
Le dessin est la courbe de la loi de proba:

Aléatoire devient on choisit en équiprobabilité des points de l'aire sous la courbe.
Je fais un tirage aléatoire de la taille d'un humain.
j'ai une courbe de Gauss, beaucoup de gens autour de la moyenne, peu de gens aux extrèmes.
Si je fais un tirage aléatoire de 1000 personnes,
la distribution attendue de ma répartition va aussi ètre gaussien.
gauss de mème moyenne et mème écart-type.
l'équiprobabilité de l'aléatoire me fait choisir beaucoup de gens près de la moyenne et moins aux extrèmes.
maintenant si je ne précise pas l'age, je ne vais plus tirer dans une quasi belle gaussienne, mais je vais faire un tirage dans une courbe sérieusement décalée vers les tailles basses du fait de l'inclusion des enfants.aucune chance de tirer avec 1000 individus une belle gaussienne.
et pourtant c'est de l'aléatoire.

Donc c'est l'idée de la série C qui est la plus iconoclaste,
les séries C sont l'histogramme des températures annuelles, par quinzaine de quebec C1, par dizaines de jours pour C2 moscou, et C3 Paris.
Les séries ne donnent pas du gauss, elles ne sont d'ailleurs pas des évènements indépendants.
C'est idiot?
Pas complètement.Si je fais une statistique où je fais des séries de tirage aléatoire de 200 jours des 30 dernières années.Mes séries ne peuvent refléter que le dessin de l'histogramme annuel.
et pourtant, je tire un jour au hasard d'équiprobabilité sur 30 ans et je note la température.
comme quantité d'autres études.

Les séries A et B se veulent un peu plus plus mathématiques.

ici, l'illustration était je tire dans quoi?
Dlzlogic ne veut pas savoir dans quoi il tire, il ne veut pas connaitre l'aire sous la courbe, sa forme etc...
je ne vois pas comment il peut s'affranchir de ce phénomène.
L'important est de savoir quoi faire lorsqu'il n' y a rien à faire.

beagle
Habitué(e)
Messages: 8746
Enregistré le: 08 Sep 2009, 14:14

par beagle » 08 Oct 2012, 18:42

A6 et A5 sont pourtant un tirage aléatoire isus d'une mème série.
comme quoi l'aléatoire peut envoyer sur du pas de bol qui fait prendre pour faux, du vrai.
c'est l'éternel problème du p inf 0,05, on pouvait avoir un tirage qui n'avait que 5 chances sur 100 de survenir si hypothèse ...
L'important est de savoir quoi faire lorsqu'il n' y a rien à faire.

Dlzlogic
Membre Transcendant
Messages: 5273
Enregistré le: 14 Avr 2009, 12:39

par Dlzlogic » 08 Oct 2012, 18:57

Il me semble que tu confonds "aléatoire" et "échantillon".
La répartition des écarts à la moyenne arithmétique est conforme à la loi normale (TCL).
Je vois pas pourquoi j'aurais besoin de savoir dans quoi je tire.
Tout ceci me parait bien compliqué.
En gros, tu calcules une probabilité d'avoir une probabilité. C'est pas recevable.

beagle
Habitué(e)
Messages: 8746
Enregistré le: 08 Sep 2009, 14:14

par beagle » 08 Oct 2012, 19:05

on discutera des résultats plus en détail.
je donne juste sur quoi sont basées les séries A et B.

Je prends les sorties des numéros complémentaires du loto.
Equiproba de la loi uniforme cette fois-ci,
et en accord avec dlzlogic, la distribution après n tirages fait une dispersion gaussienne.
Donc au départ on voulait 10 valeurs, donc comme un crétin je me dis et bien je donne 5 numéros pour chaque élément de ma dizaine de cas souhaité, et dès lors que les 5 numéros sont déterminés avant de regarder le résultat des tirages cela sera ok.
sauf que le loto c'est 49 numéros.
C'est là que j'ai commencé à regrouper par deux numéros.
et à faire l'addition.
et cela donne une distribution gaussienne.
ce sont les séries A.

Et là, n'y connaissant rien mais que cela m'intéresse, je me dis
et si au lieu d'additionner je divisais l'un par l'autre,
est-ce que je n'aurais pas un quotient de valeurs gaussiennes,et donc du Cauchy.
donc j'espère que je ne vais pas me faire tuer par les vrais mathématiciens,
j'ai dit les séries B se veulent du Cauchy.
Et si je suis autorisé à le dire, cela va ètre sympa de comparer la forme de la courbe, plus étalée qu'une gaussienne, "moins de valeurs attirées par la moyenne",
et la variabilité de la moyenne et de l'écart-type.
Voili, voilo.
L'important est de savoir quoi faire lorsqu'il n' y a rien à faire.

beagle
Habitué(e)
Messages: 8746
Enregistré le: 08 Sep 2009, 14:14

par beagle » 08 Oct 2012, 19:14

Dlzlogic a écrit:Il me semble que tu confonds "aléatoire" et "échantillon".
La répartition des écarts à la moyenne arithmétique est conforme à la loi normale (TCL).
Je vois pas pourquoi j'aurais besoin de savoir dans quoi je tire.
Tout ceci me parait bien compliqué.
En gros, tu calcules une probabilité d'avoir une probabilité. C'est pas recevable.


tu n'as pas besoin de savoir dans quoi tu tires,
si le sais c'est bien,
mais parfois tu ne le sais pas et tu es obligé de voir avec quoi collent tes données.
Toi qui nous a parlé récemment de monte carlo, je connais mal, mais il me semble qu'ils vont chercher avec quoi cela colle.Ils n'ont pas l'air de négliger ce truc.

et en ne regardant pas ça tu confonds depuis le début les gauss issues de tirages uniformes,
où ces gauss voient leur écart-type diminuer avec le nombre de tirages, des gauss issues de gauss,
où en augmentant la taille de l'échantillon tu ne fais pas bouger l'écart-type.
c'est heureux d'ailleurs quand tu augmente le nombre d'individus examinés pour leur taille tu ne fais pas baisser l'écart-type de la population, tu te rends compte du problème sinon.
L'important est de savoir quoi faire lorsqu'il n' y a rien à faire.

Dlzlogic
Membre Transcendant
Messages: 5273
Enregistré le: 14 Avr 2009, 12:39

par Dlzlogic » 08 Oct 2012, 19:30

Pourquoi compliquer le problème à l'infini.
Il est vrai que j'ai parlé de Monte-Carlo, mais je ne sais plus à quelle occasion. Je me souviens seulement de la réaction de Doraki, définitive, mais sans explication.
Je pense que puisque tu voulais utiliser des générateurs que personne n'utilise, tu aurais mieux fait de faire valider ta méthode par quelqu'un d'autre, avant de commencer. J'ai l'impression que tu es juriste, alors tu dois savoir que la forme prime sur le fond.

 

Retourner vers ⚜ Salon Mathématique

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 18 invités

Tu pars déja ?



Fais toi aider gratuitement sur Maths-forum !

Créé un compte en 1 minute et pose ta question dans le forum ;-)
Inscription gratuite

Identification

Pas encore inscrit ?

Ou identifiez-vous :

Inscription gratuite