Bonjour,
Dans le cadre d'une étude d'un jeu, je me pose la question suivante. Admettons que j'ai un ensemble E dont je connais le nombre d'élements N. Je sais qu'il y a des élèments uniques (une seule occurence), et des élèments non-uniques (plusieurs occourences dans l'ensemble).
Voici mon problème. J'aimerais estimer le nombre d'éléments uniques de mon ensemble E (appelons le k). Le problème étant que je n'ai pas accès directement à E, mais je peux tirer aléatoirement des éléments de E sans remise.
Une fois que j'ai tiré un nombre d'élements p de E, je peux les comparer entre eux (regarder combien il y a d'élements uniques, de doublons, de triplet...). Cependant la proportion dans laquelle j'ai tiré des éléments uniques après p tirages dans E n'est absolument pas représentative de la proportion réelle d'éléments uniques dans E. En effet par exemple, soit E un ensemble tel qu'il y ait 100 éléments dont 50 éléments uniques et 25 doublons. En tirant 2 élements de E, je n'ai pas du tout 1/2 chance de tirer un doublon (qui correspondrait à 50/100), mais bien (1/2)*(1/99), car il faut tirer un nombre qui a effectivement un doublon, puis tirer son doublon. (j'espère que c'est clair)
Enfin bref ma question elle la suivante : est-il possible d'estimer le nombre d'élements uniques dans E (qui possède N élements) en tirant simplement un échantillon de p éléments ? (sachant comme je l'ai dit, que je n'ai pas d'information sur E).
Je pense personnellement que non mais je voulais savoir si quelqu'un s'était déjà posé la question ou voulait y réfléchir.