Nightmare a écrit:Je reviens vers ce problème avec une nouvelle question.
je me demande si cela à un sens de considérer la quantité "E(P(X > Y))".
Plus précisément : On a montré dans ce topic qu'il existe des distributions de [0;1] vérifiant les hypothèses de mon premier post et donc pour lesquelles P(X 1/2 ?
Bonjour,
Je me suis une peu penché sur le probleme que je trouve interessant. Mon analyse risque de faire grincer quelques dents de par son niveau d'empirisme mais bon :happy:
Non seulement il y a plus de chances que P(X1/2, mais je serais même tenté de dire que l'événement P(XP(Y<t), tout cela méritant bien sûr qu'on s'entende sur la mesure de l'ensemble entre autres.
J'ai fait le choix d'une discrétisation des fonctions de densités afin d'avoir une base quantifiable tout en "convergeant" vers l'ensemble des fonctions de distributions quand on augmente le pas de la grille. (ou pour être plus précis, vers l'ensemble des distributions à densité réglée, ce qui est plutôt honnête si on veut considérer l'ensemble des variables aléatoires continues à densité Riemann-intégrables)
Pour être plus clair, je choisis n entier, et je me place dans l'ensemble Dn des distributions sur [0,1] pour le couple (X,Y) définies par une grille de pas 1/n sur X et sur Y, constante sur chaque "carré".
c'est à dire une distribution est définie par
avec
, de telle manière que la densité f de ma distribution s'exprime par :
La condition sur la sommation permet de vérifier que f soit bien une densité (l'aire de chaque carré étant 1/n²).
Les distributions de Dn sont donc visualisables comme une matrice. Si on étudie le problème sur ces distributions et que l'on fait tendre n vers l'infini, on peut raisonnablement penser que le résultat est bon sur l'ensemble des distrib (au moins celle dont la densité est une fonction réglée).
En théorie on peut à présent mesurer notre ensemble Dn : chaque x_jk = 1/n²*P_jk est entre 0 et 1 et la somme totale est contrainte à 1, c'est un calcul de volume immédiat qui vaut 1/(n²)!
En revanche déterminer le volume du sous-ensemble des distrib vérifiant (H) et encore plus (H) et P(X<Y)<1/2 m'a l'air hélas assez inextricable, je suis alors passé complètement en mode empirique avec un petit Monte-Carlo.
On va donc simuler des distributions de Dn. La méthode pour éviter de développer un biais entre les cases de la matrice est la suivante : simuler une uniforme sur [0,1] pour chaque Pjk, puis renormaliser par n² divisé par la somme totale des Pjk, de sorte que cela vérifie bien la condition de sommation (et de cette manière les pjk suivent la meme loi de Bates).
Reste à préciser comment s'applique les tests de (H) et de P(X<Y)<1/2 dans ce cadre :
- pour (H), cela signifie que la somme sur les k premières lignes est supérieure à la somme sur les k premières colonnes et ce pour tout k.
- pour P(X<Y)<1/2, il faut voir comment calculer P(X<Y). "En gros", il s'agit de la somme sur le demi-triangle supérieur, sachant que la question est de savoir quoi faire des carres de la diagonale. Le bonne façon est de les compter pour 1/2 car dans chaque carré la proba que X<Y est 50%.
Une fois armé avec tout ça, on peut pour un n donné, lancer une simulation (jai fait avec 100 000 chemins), en comptant la proportion de distrib vérifiant (H) et celle des distrib vérifiant (H) et P(X<Y)<1/2 pour en faire le ratio.
Pour ceux qui ont eu le courage de lire jusque là, voici les résultats en fonction de n :
- tout d'abord une expérience témoin, la proportion des distrib donnant P(X<Y)<1/2 (mais pas forcement (H)) avoisine 50% quelque soit n, ce qui confirme la découpe des carres diagonaux.
- la proportion des distrib vérifiant (H) suit l'évolution suivante :
En effet, plus la pseudo-dimension du problème augmente, plus il est "compliqué" pour une distribution "aléatoire" de vérifier l'hypothèse (H). D'ailleurs cette courbe suit presque parfaitement l'équation y=1/x (R² = 0.999), y'aurait t-il une démonstration analytique trouvable ici ?
- parmi celles qui vérifient (H), la on a la proportion de celles qui vérifient P(X<Y)<1/2
La courbe est chaotique à droite car 100.000 chemins commence a être trop peu pour décrire l'ensemble Dn qui est de "pseudo-dimension" n^2-1.. mais l'allure globale est là : on se situe très clairement clairement <50%, au début décroissante et possiblement une recroissance légère par al suite avec n, et on pourrait conjecturer une autour de 2%, bien que la précision du MC est trop faible pour affirmer réellement quelque chose (limite autour de 2% ? limite nulle ?). Et quant à la proportion de ces distributions dans Dn au total, elle tend du coup vers 0 (produit des deux courbes ci-dessus).
Voilà, à présente les plus théoriciens/courageux peuvent essayer de creuser une méthode analytique sur les questions en suspens ici ! (allure du sous-ensemble suivant (H) en 1/x, limite du cas P(X<Y)<1/2 dans (H)).
Damien