Problème probabilité...
Réponses à toutes vos questions après le Bac (Fac, Prépa, etc.)
-
Frenchyscot
- Messages: 1
- Enregistré le: 07 Nov 2012, 23:15
-
par Frenchyscot » 07 Nov 2012, 23:58
Bonjour,
J'ai ici un problème pour lequel je ne trouve pas de réponse. Je suis thésard en biologie et assez limité en mathématique. N'hésitez donc pas à me demander des clarifications si je ne suis pas très clair ;). Néanmoins la résolution de ce problème réglerait pas mal de mes problèmes...
J'ai un sac rempli de n*8 boules de couleurs (je connais le nombre de couleurs différentes). J'effectue n tirages de 8 boules sans remise (je tire donc l'intégralité des boules). J'obtiens donc un jeu de données du genre:
i1=>2 rouges, 1 verte, 5 violettes
i2=>8 rouges
i3=>3 vertes, 5 rouges
...
n=>4 vertes, 4 rouges
Mon problème est que l'information à laquelle je peux accéder pour chacun de ces tirages est limitée. Je peux seulement savoir la couleur de chaque tirage mais pas le nombre de boules par couleur. Par exemple:
i1=>rouge, vert, violet
i2=>rouge
i3=>vert, rouge
...
n=>vert,rouge.
Je me demandais donc si il n'y avait pas un moyen d'inférer le premier jeu de données à partir du second. Mon idée original est que plus la fréquence d'occurence d'une couleur dans le second jeu de données est élevée, plus le nombre de boules de cette couleur dans un tirage a la probabilité d'être élevée...mais je ne sais pas vraiment comment appliquer cette idée.
Bien sur, j'ai conscience qu'il est impossible de reconstituer trait pour trait le premier jeu de données mais je me disais qu'il y a surement un moyen de simuler les 1000 jeux de données les plus probables...cela me suffirait amplement! La partie programmation, si besoin, ne me fait pas trop peur.
Je ne demande pas une résolution de ce problème mais juste que quelqu'un m'aiguille dans la bonne direction.
Je vous remercie d'avance pour votre aide!
-
fatal_error
- Membre Légendaire
- Messages: 6610
- Enregistré le: 22 Nov 2007, 12:00
-
par fatal_error » 08 Nov 2012, 22:18
salut,
comme ca une idée:
on note c1...c_n le nombre de boules de chaque couleur.
le but est de connaitre c_1,...c_n à partir du second jeu de données.
Par exemple :
on note a_1j l'inconnue du nombre de boules j sortie au lancé 1
i1=>a_11, a_12,a_13
où j=1 représente rouge, 2 verte, et 3 violet
La probabilité d'avoir i1 c'est :
piocher a_11 parmi c_1, a_12 parmi c_2, a_13 parmi c_3 / 8 parmi n*8
sous contrainte a_ij>0, somme_j a_ij = 8, somme_i a_ij=c_i
pour i_2, il faut prendre en compte a_1j, donc (a_2j parmi (c_j - a_1j) ) etc...
et au final tenter de maximiser la proba i_1*i_2*...*i_n
genre pe faire un petit test avec 3 couleurs et 5 entrées histoire de voir ce que ca donne
PS: c'est ptet pas la bonne direction, juste une piste
la vie est une fête

-
fatal_error
- Membre Légendaire
- Messages: 6610
- Enregistré le: 22 Nov 2007, 12:00
-
par fatal_error » 11 Nov 2012, 12:28
petit bump, j'ai continué un peu de chercher dans la piste que j'ai proposée.
Si on ne considère qu'une seule colonne : on a
i1: C(c,M1)
i2: C(c-M1,M2)
in: C(c-M1...-M_{n-1}, Mn)

je pose

on remarque

on a
)
 = \frac{C(c,M_1) }{2^c}\\<br />P(i_2| i_1 ) = \frac{C(c-v_2,M_2) }{2^{c-v2}})
on a au final :
 = P(i_1)*P(i_2|i_1)*P(i_3|i_1,i_2)...=N(1,n)/D(1,n))
où
 = \bigprod_{k=1}^n C(c-v_k, M_k) = \frac{c!}{\bigprod_{k=1}^n M_k!})
et
 = 2^{ \bigsum_{k=1}^n c-v_k} = 2^{nc - \bigsum_{k=1}^{n} v_k})
soit
=\frac{c!}{2^{nc - \bigsum_{k=1}^{n} v_k} \bigprod_{k=1}^n M_k!})
Le problème, c'est de maximiser P(i1 et ... et in) sachant qu'on manipule M_k qui sont uniquement des entiers supérieurs à zéro.
ya-t-il une méthode/algorithme?
y aller à coup de floor sur les M_k pour appliquer la factorielle ne m'a pas l'air convainquant...
la vie est une fête

-
Dlzlogic
- Membre Transcendant
- Messages: 5273
- Enregistré le: 14 Avr 2009, 12:39
-
par Dlzlogic » 11 Nov 2012, 13:14
Bonjour,
Je ne suis pas sûr d'avoir bien compris le problème.
Le nombre de possibilités d'avoir 8 boules de 3 couleurs différentes est connu et fixe, je n'appelle N.
Est-ce que ces N assemblages sont utilisés ou seulement un certain nombre de fois une partie de N ?
Peut-on décrire les hypothèses (dépôt de boules) et la procédure de tirage de façon suffisamment précise et exacte pour pouvoir la reproduire avec un petit programme. Si oui, je pense que c'est vraiment la meilleure méthode.
Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 36 invités