Puisque l'heure est aux urnes !!!

Olympiades mathématiques, énigmes et défis
Imod
Habitué(e)
Messages: 6476
Enregistré le: 12 Sep 2006, 12:00

Puisque l'heure est aux urnes !!!

par Imod » 27 Fév 2009, 00:31

Nous n'avons pas été appelé aux urnes depuis un moment c'est sans doute ce qui justifie peut-être ce foisonnement de problèmes d'urnes : un nouveau que j'espère original :we:

On dispose d'une urne électronique contenant n boules , c'est à dire que si on presse le bouton elle fourni de façon aléatoire un nombre entre 1 et n . On presse 5 fois sur le bouton et on obtient les résultats suivant : 45 ; 7 ; 2803 ; 101 ; 744 . Il est clair qu'on aura du mal à estimer le nombre n de boules dans l'urne , mais quel choix proposé pour approché ce nombre au mieux ?

Amusez-vous bien :zen:

Imod

PS : j'ai choisi les valeurs complètement au hasard !!!



emcee
Membre Relatif
Messages: 105
Enregistré le: 23 Fév 2009, 16:30

par emcee » 27 Fév 2009, 12:23

sans aucun calcul j'estimerais n = 2*moyenne(valeurs des boules tirées) ...
Ici n voisin de 1480 ... ce qui est évidemment aberrant puisqu'on a tiré 2803. D'où une contre proposition, max(boules tirées, 2*moyenne(boules tirées)) !

Doraki
Habitué(e)
Messages: 5021
Enregistré le: 20 Aoû 2008, 12:07

par Doraki » 27 Fév 2009, 12:26

max(boules tirées) ça me paraît très bien.

Imod
Habitué(e)
Messages: 6476
Enregistré le: 12 Sep 2006, 12:00

par Imod » 27 Fév 2009, 13:28

En effet Doraki , quand même surprenant :doh:

Imod

scelerat
Membre Relatif
Messages: 397
Enregistré le: 03 Aoû 2005, 14:37

par scelerat » 27 Fév 2009, 17:46

Doraki a écrit:max(boules tirées) ça me paraît très bien.

Je dirais un peu faible. J'essaierais plutot de dire que ce maximum est au niveau 1-1/(m+1) (ou m est le nombre de boules tirees) dans la fonction de repartition puisque cette fonction monte de 0 a 1 sur m+1 intervalles, donc n = (m+1)/m*max(boules tirees) = 3363 dans l'exemple.

ThSQ
Membre Complexe
Messages: 2077
Enregistré le: 10 Oct 2007, 18:40

par ThSQ » 27 Fév 2009, 17:56

Imod a écrit:En effet Doraki , quand même surprenant :doh:


Juste par curiosité, pourquoi est-ce la bonne réponse ?

Quelle hypothèse implicite est utilisé ici ? (simplicité; optimalité suivant un critère que je connais pas car j'y connais rien en optimisation; rapidité de convergence; ...)

Pourquoi (et en quoi) est-ce "mieux" que min + max par exemple ? (perso je trouve ça plus intuitif).

On n'utilise pas la connaissance sur du fait que ça commence à 0 : si donne 60 et 61 le 'n' intuitif n'est pas le même si on dit que ça commence à 0 ou à 50, non ?

ThSQ
Membre Complexe
Messages: 2077
Enregistré le: 10 Oct 2007, 18:40

par ThSQ » 27 Fév 2009, 18:24

Je viens de faire quelques simulations avec Maple, si on prend comme critère à minimiser |estimé - n|, min + max est (en moyenne) meilleur que max seul.


Edit : d'ailleurs l'idée de scelerat de considérer la distribution de l'ensemble des mesures me fait dire que utiliser comme valeur à ajouter au max la moyenne des écarts entre les données successives (triées ..) est une idée séduisante :

estimé

et la simu donne de meilleurs résultats aussi.

ffpower
Membre Complexe
Messages: 2542
Enregistré le: 13 Déc 2007, 05:25

par ffpower » 27 Fév 2009, 19:02

Il est vrai qu il y a p-e plusieurs interpretation possibles de la chose.Mais en tout cas,avec mon interpretation,je suis l avis de Doraki et Imod.Pour tout n,j ai regardé la proba P(X1=45 et X2=7 et X3=2803 et X4=101 et X5=744}ou X1..X5 sont iid uniformes sur {1...n}.Ca donne donc une foncton de n,qui se trouve etre maximale pour n=2803

Imod
Habitué(e)
Messages: 6476
Enregistré le: 12 Sep 2006, 12:00

par Imod » 27 Fév 2009, 19:46

- En fait je n'ai pas fait de calcul , d'ailleurs dans quel espace les faire ? Disons que de façon évidente le nombre de boule est supérieur ou égal au plus grand numéro tiré M on est donc tenté d'ajouter un petit quelque-chose à M pour approcher n . Problème : ajouter quoi ?
- Je ne pense pas qu'un paramètre calculé à partir des écarts soit judicieux , seule la plus grande valeur est importante . On pourrait alors imaginer l'intervalle [1;M] partagé en m part égales ( pour m tirages ) et ajouter un intervalle pour estimer n mais je ne vois pas pourquoi une valeur de cet intervalle serait meilleure que M , au contraire .

Si quelqu'un a des arguments plus mathématiques je suis preneur bien sûr :zen:

Imod

scelerat
Membre Relatif
Messages: 397
Enregistré le: 03 Aoû 2005, 14:37

par scelerat » 27 Fév 2009, 20:01

Imod a écrit:Si quelqu'un a des arguments plus mathématiques je suis preneur bien sûr :zen:


En fait, tout depend de ce qu'on appelle "estimer au mieux". Si on demande la valeur de n la plus probable, alors on ne doit pas avoir de difficulte a demontrer que la densite de probabilite est decroissante. Si on demande celle qui minimise une erreur, alors pour les fonctions d'erreur les plus courantes, on va trouver quelque chose un petit peu plus eleve. Imaginons par exemple que ce soit un jeu dans un casino, ou on gagne 50-|e| euros, avec e l'erreur de prediction, si cette quantite est positive et ou on sait juste que n a au plus 5 chiffres.

ThSQ
Membre Complexe
Messages: 2077
Enregistré le: 10 Oct 2007, 18:40

par ThSQ » 27 Fév 2009, 20:37

Imod a écrit:seule la plus grande valeur est importante


Malheureusement je n'y connais rien en estimation/statistique (le parent pauvre à mon niveau = bac + 1,6) mais le problème peut-il se modéliser par : trouver la distribution uniforme (sur 1..N avec N >= max) qui colle le mieux (critère à définir) à l'échantillon.
Si on prend un Khi² on utilise bien toutes les valeurs.
Ici vous dites donc que la distrib uniforme la meilleure c'est 0..max et ce sans tenir compte des autres valeurs (en particulier la valeur min). Vous avez surement raison mais ça me choque.



Edit : ah oui et les simus que j'ai faites semblent bien montrer que le max n'est pas le meilleur estimateur.

Edit 2 : ici c'est j'imagine un tirage sans remise ce qui fait que les tirages ne suivent pas une loi uniforme mais sans devrait pas changer le fond du pb).

Imod
Habitué(e)
Messages: 6476
Enregistré le: 12 Sep 2006, 12:00

par Imod » 27 Fév 2009, 20:45

Attention , je ne dis pas que la distribution des valeurs n'a pas d'importance mais seulement qu'elle ne donne aucun renseignement sur la valeur de n .

Par exemple :

T1 : 1 ; 2 ; 3 ; 4; 1458 .
T2 : 1000 ; 1227 ; 1400 ; 1458 .

Je ne vois pas en quoi le deuxième tirage indiquerait qu'il il a plus de boules que le premier .

Imod

ThSQ
Membre Complexe
Messages: 2077
Enregistré le: 10 Oct 2007, 18:40

par ThSQ » 27 Fév 2009, 20:48

Ben je sais pas faudrait faire un Khi² pour voir.

On en reparle dans un an ou deux ;)

Perso j'aimais bien min+max car intuitivement on a autant de chance d'avoir loupé les petits numéros que les grands par symétrie.

Imod
Habitué(e)
Messages: 6476
Enregistré le: 12 Sep 2006, 12:00

par Imod » 27 Fév 2009, 21:00

Le problème serait plutôt de savoir si khi² s'applique ici , ne compte pas trop sur moi pour répondre ( le khi² m'a dégoûté pendant longtemps des probas ) .

Imod

ThSQ
Membre Complexe
Messages: 2077
Enregistré le: 10 Oct 2007, 18:40

par ThSQ » 27 Fév 2009, 21:05

J'ai pas dit qu'il fallait utiliser le Khi² (j'ai sais frichtre rien non plus), juste qu'on y utilise toutes les valeurs.

ThSQ
Membre Complexe
Messages: 2077
Enregistré le: 10 Oct 2007, 18:40

par ThSQ » 27 Fév 2009, 21:12

Je ne sais pas non plus ....

Fais des Monte-Carlo tu vas voir que max est moins bon (cf post précédent pour le critère retenu) que min+max lui même moins bon que max + (moyenne des différences).

Doraki
Habitué(e)
Messages: 5021
Enregistré le: 20 Aoû 2008, 12:07

par Doraki » 27 Fév 2009, 21:31

ThSq, tu fais quel genre de simulation ?
tu tires un N au hasard (,selon quelle loi ?), tu tire n boules entre 1 et N, et tu regardes si N = max(ni) ?

ThSQ
Membre Complexe
Messages: 2077
Enregistré le: 10 Oct 2007, 18:40

par ThSQ » 27 Fév 2009, 21:57

Non j'ai fixé N (1000 je crois bien, j'ai fermé Maple depuis là)). Je tire 5 nombres entiers de manière uniforme (tous différents) entre 0 et N et je regarde quel "estimateur" (entre max, min+max, max+delta moyen) est le plus proche de N en valeur absolue. Et je fais ça "plein de fois".

Imod
Habitué(e)
Messages: 6476
Enregistré le: 12 Sep 2006, 12:00

par Imod » 27 Fév 2009, 22:02

Je crains qu'avec N fixé le jeu ne soit faussé dès le départ :!:

Imod

ThSQ
Membre Complexe
Messages: 2077
Enregistré le: 10 Oct 2007, 18:40

par ThSQ » 27 Fév 2009, 22:14

Ce que je voulais voir c'est quel estimateur était le meilleur. Je vois pas le problème de fixer N.

Heureusement qu'il y a googlebook pour les étudiants loin de leur BU :

http://books.google.fr/books?id=8HFQLTCmY8EC&printsec=frontcover&dq=noether+%22introduction+to+statistics%22&source=gbs_summary_r&cad=0

p. 33 et suivantes.

La méthode min+max y est décrite, c'est l'"extreme estimate" (3.3.2) et le max+delta est l'exo 18 p. 43 "gap estimate".

Il parle aussi d'un "median estimate"

 

Retourner vers ⚔ Défis et énigmes

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 11 invités

Tu pars déja ?



Fais toi aider gratuitement sur Maths-forum !

Créé un compte en 1 minute et pose ta question dans le forum ;-)
Inscription gratuite

Identification

Pas encore inscrit ?

Ou identifiez-vous :

Inscription gratuite