Regret Mathématique

Réponses à toutes vos questions après le Bac (Fac, Prépa, etc.)
ED102
Membre Relatif
Messages: 144
Enregistré le: 04 Nov 2008, 18:16

Regret Mathématique

par ED102 » 21 Fév 2014, 12:17

Bonjour,

J'aurais besoin de l'aide d'un matheux, sur une formule.

Je suis en train d'implémenter un algorithme en langage C, pour résoudre un problème dit du "Bandit Manchot"

L'idée c'est que l'on a UNE grosse machine à sous à plusieurs bras, a chaque bras correspond une probabilité de gain, une récompense positive ou négative.

Le but de l'algo et de trouver le bras qui maximise le gain sur L tirages de bras et ceux le plus rapidement possible.

A la fin de cet algo je souhaite, introduire une formule me permettant de calculer ce que l'on nomme le regret.
Qui est donné comme suit :





r* : est la récompense moyenne max
T : le nombre de tirage/essais effectués
: la récompense retiré du bras i
: le nombre de fois qu'on a tiré le bras i

Mais, je ne comprends pas ce que veut dire
L’espérance du nombre total de tirage du bras i ? .... ça me parle pas trop.

Merci

Ps : désoler, j'arrive pas à enlever ce [?]



 

Retourner vers ✯✎ Supérieur

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 14 invités

Tu pars déja ?



Fais toi aider gratuitement sur Maths-forum !

Créé un compte en 1 minute et pose ta question dans le forum ;-)
Inscription gratuite

Identification

Pas encore inscrit ?

Ou identifiez-vous :

Inscription gratuite