Moyenne empirique

par **humpf** » 05 Juin 2007, 18:08

Bonsoir. J'ai un problème avec cet exercice:

Soit X une v.a. binomiale de paramètre (4, p), p inconnu.
X a été observée 150 fois. Résultat:
X (valeurs)/Fréquence
0 30
1 62
2 46
3 10
4 2

Véri;)er que p, estimé sur la base dune moyenne empirique, vaut 0.32.
Je sais que la moyenne empirique se calcule

. Comme X est une binomiale, on a

. Mais je ne sais pas comment mettre les choses ensemble, bref, je suis bloquée :mur:
Est-ce que quelqu'un pourrait me donner une indication pour que je puisse continuer?

Merci :marteau:

par **fahr451** » 05 Juin 2007, 18:15

la moyenne empirique sur les 150 observations étant

(0x30 + 1x62 +2x46+3x10+4x2)/150 = M est une estimation de l'espérance de X qui vaut np avec n = 4 et p inconnu
donc p = M/4 est l'estimation demandée

il manque un intervalle de confiance ...
fondé sur le théorème central limite ou BT (plus mauvais)

par **humpf** » 05 Juin 2007, 18:38

Merci beaucoup :id:

par **cesar** » 05 Juin 2007, 19:57

fahr451 a écrit:la moyenne empirique sur les 150 observations étant

(0x30 + 1x62 +2x46+3x10+4x2)/150 = M est une estimation de l'espérance de X qui vaut np avec n = 4 et p inconnu
donc p = M/4 est l'estimation demandée

il manque un intervalle de confiance ...
fondé sur le théorème central limite ou BT (plus mauvais)

on peut aussi calculer une estimation de l'écart type, mais si le meilleur estimateur de la moyenne, c'est la moyenne des données, le meilleurs estimateur de l'écart type sigma n, c'est l'écart type des données calculé en divisant par 149 au lieu de 150...

par **BQss** » 06 Juin 2007, 05:07

cesar a écrit:on peut aussi calculer une estimation de l'écart type, mais si le meilleur estimateur de la moyenne, c'est la moyenne des données, le meilleurs estimateur de l'écart type sigma n, c'est l'écart type des données calculé en divisant par 149 au lieu de 150...

Salut Cesar.
Ce que tu dis n'est pas juste en divisant par 149 ton estimateur sera sans biais, mais ce ne sera pas un "meilleur estimateur" de l'ecart type pour autant.
En effet son erreur quadratique est superieur a celle de quand on divise par 150.

On ne juge pas la qualité d'un estimateur a son biais mais a son risque quadratique(somme pondérée des erreurs aux carrées): somme du biais et de la variance.
Et ici meme si le biais est nul il est superieur à la somme Variance plus biais obtenue en divisant par 150.

De plus le biais de la variance vaut alors

-> 0 reduisant le seul desavantage de "l'estimateur 150"(intelectuel car dans la pratique ça n'en est pas un) a néant du moment que le nombre de données et suffisamment grand

Au final la moyenne de ton erreur en divisant par 149 sera plus grande qu'en divisant par 150 meme si la moyenne de tes estimations vaut théoriquement

, le paramètre estimé.
En divisant par 150 la moyenne de ton erreur quadratique de ton estimateur sera plus faible, meme si la moyenne theorique de tes estimateurs ne vaudra pas

Au final l'estimateur le plus fiable est celui obtenu en divisant par 150.
i.e Si j'ai des données je me tromperai probablement de moins en estimant ma variance en divisant par 150 qu'en divisant par 149.

Malheureusement beaucoup croient que biais = qualité, ce qui est faux en general, cette confusion va jusqu'a prendre parfois un estimateur moins bon pour la variance(comme je le vois souvent par des non statisticien) ce qui est une aberration.

Toute fois, ce n'est pas si grave car les deux estimateurs sont consistants et converge a la même vitesse et la difference est negligeable quand n grandi:

risque quadratique:
de l'estimateur en divisant par n:

de l'estimateur en divisant par n-1:

Moyenne empirique

Moyenne empirique

fréquence thérique

Qui est en ligne