m et n sont deux entiers naturels fixés.
On considère une urne contenant m boules numérotées de 1 à m. On effectue n tirages successifs avec remise et on note le nombre de fois où la boule numéro i a été obtenue.
On obtient un m-uplet tel que .
On range ensuite les dans l'ordre décroissant et on obtient un m-uplet .
Ainsi .
Questions : quelle est la loi de la variable aléatoire (vectorielle discrète) ?
Quelles sont les éléments de qui ont la probabilité la plus grande ?
Pour la première question, j'ai fait un petit dénombrement et je trouve :
pour tout avec .
Petit exemple pour n=3 boules et m=3 tirages, on a .
En listant toutes les configurations dans un arbre on vérifie que :
(tirer la même boule 3 fois)
(tirer deux boules différentes dont une 2 fois)
(tirer trois boules différentes)
Pour la seconde question, je n'ai pas de réponse complète mais j'ai quelques pistes intéressantes.
Je voudrais minimiser la quantité :
où les sont des entiers naturels vérifiant et .
En effet on peut écrire .
Pour cela, je me suis inspiré de la thermodynamique : je vois mon problème comme un système de m particules d'énergie totale n, où représente le nombre de particules qui occupent le niveau d'énergie j, et 1/D correspond à l'entropie du système. Pour minimiser D, il faut que les particules occupent des niveaux j pas trop élevés, mais qu'un niveau donné ne soit pas occupé par trop de particules.
Considérons une distribution quelconque.
Disons que R est stable si elle réalise le minimum de à m,n fixés.
Supposons qu'une particule de niveau échange une unité d'énergie avec une particule de niveau .
Cela signifie que et diminuent de 1 tandis que et augmentent de 1.
Disons que R est localement stable si cet échange fait croître pour tous choix d'indices .
J'ai rédigé un programme en Python qui teste si une distribution est localement stable, et qui renvoie une paire d'indices pour lesquels l'échange fait décroître D sinon :
- Code: Tout sélectionner
def test_lstable(R):
res=True
jmax = len(R)-1
j1=jmax+1
while res and (j1>1):
j1-=1
j2=-1
while res and (j2<jmax-1):
j2+=1
if j1==j2:
Daugm = (R[j1-1]+1)*(R[j1+1]+1)*(j1+1)>=R[j1]*(R[j1]-1)*j1
elif j1-1==j2+1:
Daugm = (R[j1-1]+1)*(R[j1-1]+2)*(j1-1)>=R[j1]*R[j2]*j1
else:
Daugm = (R[j1-1]+1)*(R[j2+1]+1)*(j2+1)>=R[j1]*R[j2]*j1
res = Daugm
return (res,j1,j2)
Il faut traiter à part les cas où les niveaux de départ sont égaux ou les niveaux d'arrivée sont égaux.
EDIT : quelques explications sur ce point...
Soit et des indices tels que sont distincts.
On pose tels que
et pour les autres indices.
Alors
Si R est localement stable alors la fraction ci dessus est supérieure ou égale à 1 ce qui s'écrit
"R localement stable" est donc une conjonction de conditions de ce type pour chaque paire d'indices .
J'itère ensuite à partir d'un état donné quelconque jusqu'à aboutir à un état localement stable (qui est sans doute stable tout court, mais je n'ai aucun moyen de le prouver).
Par exemple pour n=1000 et m=400, j'obtiens R=[31, 81, 104, 87, 55, 27, 11, 3, 1,0] (i.e. ).
En testant divers paramètres n, m, je constate que mon analogie avec la thermodynamique n'est pas dénuée de sens puisque les états localement stables ont des allures de distribution de Maxwell-Boltzmann, plutôt de loi de Poisson en fait. (EDIT : image en lien ci dessous)
https://1drv.ms/u/s!AuibTdDx9Xe-qSLL4-3_0o0U8jXJ
https://fr.wikipedia.org/wiki/Loi_de_Poisson
Mon objectif maintenant serait de trouver une expression exacte ou approchée pour les de la forme par exemple (cette forme-ci semble convenir assez bien dans certains cas).
Je me suis intéressé à l'ensemble micro-canonique en physique statistique, mais j'ai du mal à définir rigoureusement ce qui serait l'entropie S ou la température dans ma situation discrète.
En théorie serait en .
https://fr.wikipedia.org/wiki/Ensemble_microcanonique#%C3%89quilibre_thermique:_temp%C3%A9rature_microcanonique
Voilà, merci de m'avoir lu, j'espère que mon petit problème vous aura intéressé.e.s.
Il m'a été inspiré par les magnets département à collectionner dans les boites de nuggets : pour info j'ai environ n=200 magnets actuellement pour m=95 départements et ma distribution correspond assez bien à un état localement stable.
J'ai donc voulu fouiller la question, je crois hélas avoir atteint mes limites en physique statistique...
Je ne sais pas s'il existe déjà des résultats à ce sujet, le problème est assez simple à formuler donc je suppose que oui.