Statistique exhaustive d'une loi discrète

par **CoulisoCoulis** » 29 Mar 2019, 09:36

Bonjour,

Je dois trouver une statistique exhaustive minimale d'une loi discrète quelconque qui est telle que :

,

.

Avec la notation 1 pour l'indicatrice,

pour notre échantillon.
J'ai calculé la log-vraisemblance et j'obtiens :

.

Le problème est que je ne peux pas factoriser facilement et trouver le produit d'une fonction de

et d'une fonction des

.
En effet, je ne peux ni factoriser pas les indicatrices, ni par une fonction de

,

n'a aucune relation simple avec

…

Pourriez-vous m'aider s'il vous plaît ?

Merci beaucoup.

par **LB2** » 29 Mar 2019, 14:54

Bonjour,

Comment définis tu une statistique exhaustive pour une va discrète ?

par **aviateur** » 29 Mar 2019, 15:20

Bonjour
Je ne comprends ce que tu dis.
Ceci étant dit, si tu chercher le maximum de du log vraisemblance, tu l'obtiens lorsque la dérivée de ta fonctionnelle est nulle. Si h(t) est ta fonctionnelle on a

Notation à améliorer évidemment

Autrement dit

ssi

où a correspond au nombre de

0 ou 1 et
b le nombre de au nombre de

2 ou 3 dans la série.

J'ai pas vu le message de LB2 j'espère que je ne suis pas en contradiction.

par **LB2** » 29 Mar 2019, 18:28

Bonjour @aviateur : non pas du tout, j'allais d'ailleurs faire le calcul que tu as effectué et il est en cohérence avec la notion "intuitive" de statistique exhaustive.

Je ne suis pas du tout spécialiste du sujet, je n'ai que quelques notions de base mais je pense qu'elles sont suffisantes pour traiter cet exemple.

La première chose ici c'est de connaitre la définition d'une statistique exhaustive, dans le cadre du modèle paramétrique. Une statistique

est une fonction de l'échantillon

. Par abus de langage, on parle de statistique indifféremment pour la fonction

ou pour la v.a.

. Pardéfinition, une statistique

est exhaustive lorsque la loi conditionnelle de l'échantillon

sous

sachant

est indépendante du paramètre

.

Ensuite, on dispose d'un théorème de factorisation (j'ai vu pas mal de noms circuler suivant les bouquins : Halmos-Savage, Fisher-Neyman ) :

est exhaustive si et seulement si la vraisemblance

de l'échantillon

se factorise de la façon suivante : il existe des fonctions

et

telles que

En pratique, on cherche donc à calculer cette vraisemblance, et à exhiber une fonction S qui permet d'écrire une telle factorisation. Cette fonction S nous donnera alors par théorème une statistique exhaustive, sans avoir à calculer la probabilité conditionnelle.

Ce qui peut poser problème, c'est l'expression différente de cette vraisemblance dans le cas discret (mesure de comptage) et dans le cas continu (mesure de Lebesgue). Pour une v.a. discrète, la vraisemblance c'est la fonction de masse

qui est une fonction du paramètre

, étant donné les observations

.
Pour une v.a. continue, la vraisemblance c'est la densité de probabilité

, étant donné une réalisation x (à dx près) de la v.a. X.

On peut, dans les deux cas, calculer l'estimateur de maximum de vraisemblance en maximisant cette fonction dérivable de

(ou plus simplement, en maximisant la log-vraisemblance, défini comme son log).

Mes connaissances s'arrêtent à peu près là, mais je voulais exposer l'exemple du modèle de Bernoulli, qui est je pense transposable ici.

Si les v.a.

sont indépendantes, de même loi, suivant toutes la loi de Bernoulli de paramètre

B(

)

,

, on connait la loi de

par produit.
La vraisemblance du modèle de Bernoulli s'écrit donc

avec

, et

La statistique

(à un facteur près, la moyenne empirique) est donc exhaustive.
Cette statistique était donnée, à un facteur près, par l'estimateur du maximum de vraisemblance 'EMV).

Intuitivement,

contient "toute l'information contenue sur

par l'échantillon des

". En effet, il semble naturel de supposer que l'ordre dans lequel on observe les réalisations 0 ou 1 n'apporte aucune information sur

: seul compte le nombre total de 1 dans l'échantillon.

Pour revenir à l'exercice :
- on calcule la vraisemblance du modèle
- on cherche à utiliser le théorème de factorisation
- on sait par théorème que l'estimateur du maximum de vraisemblance est une fonction de la statistique exhaustive.
- on montre que la statistique exhaustive choisie est "minimale" en un sens à préciser (toute statistique exhaustive est fonction de celle-ci)

par **LB2** » 29 Mar 2019, 18:39

Par analogie avec le modèle de Bernoulli, ici on a l'intuition que l'ordre dans lequel on observe les réalisations 0, 1, 2, 3 n'apporte pas d'information sur

: seul compte a priori le nombre de "0"

, le nombre de "1"

, le nombre de "2"

et le nombre de "3"

.

Le calcul de la vraisemblance du modèle semble montrer que par symétrie, on peut se contenter d'un peu mieux : le nombre a = (nombre de "0" observés+ nombre de "1" observés), car a+b = n en reprenant les notations d'aviateur.

Ma question : pour le modèle de Bernoulli, il était facile d'obtenir la quantité similaire (nombre de "1" observés) en calculant la moyenne empirique. En revanche ici, la moyenne empirique ne suffit pas car elle donne une combinaison linéaire des n_0, n_1, n_2, n_3 :

alors qu'on cherche

.
Comment donc calculer ce "a=n_0+n_1" pour former l'EMV? Et comment en déduire une statistique exhaustive?

Statistique exhaustive d'une loi discrète

Statistique exhaustive d'une loi discrète

Re: Statistique exhaustive d'une loi discrète

Re: Statistique exhaustive d'une loi discrète

Re: Statistique exhaustive d'une loi discrète

Re: Statistique exhaustive d'une loi discrète

Qui est en ligne