PROBABILITE

Réponses à toutes vos questions après le Bac (Fac, Prépa, etc.)
fanjeay
Messages: 9
Enregistré le: 21 Jan 2020, 23:07

PROBABILITE

par fanjeay » 05 Fév 2020, 20:19

QCM26 – Une proportion de 4% d’une population d’étudiants de PluriPASS veut faire maïeutique en première intention. On veut prendre un échantillon d’étudiants de PluriPASS et que cette proportion ne soit pas inférieure à 2%, au risque α = 1%. Une loi normale si ses conditions d’utilisation sont possibles donnera une approximation des probabilités acceptable. Parmi les propositions suivantes, choisir celle(s) qui est ou sont exacte(s).
A La valeur minimale de la taille de l’échantillon sera comprise entre 620 et 630.
B La valeur minimale de la taille de l’échantillon sera comprise entre 630 et 640.
C La valeur minimale de la taille de l’échantillon sera comprise entre 640 et 650.
D La valeur minimale de la taille de l’échantillon sera comprise entre 650 et 660.
E Aucune des propositions précédentes n’est exacte.

Bonjour,

j'ai trouvé les parametre suivant de la loi binomiale B(n;0,04)
j'ai exprimé cette loi par une loi normale (sans savoir si n>30), N(0,04n; racine carré 0,0384n)

Je cherche maintenant a exprimer (P(x)>0,02) mais je suis bloqué... et je ne suis pas sur de ma démarche...

Merci d'avance



GaBuZoMeu
Habitué(e)
Messages: 6133
Enregistré le: 05 Mai 2019, 09:07

Re: PROBABILITE

par GaBuZoMeu » 05 Fév 2020, 21:25

N'aurais-tu pas oublié d'indiquer la population totale d'étudiants ?

fanjeay
Messages: 9
Enregistré le: 21 Jan 2020, 23:07

Re: PROBABILITE

par fanjeay » 05 Fév 2020, 21:44

GaBuZoMeu a écrit:N'aurais-tu pas oublié d'indiquer la population totale d'étudiants ?



Bonjour, nan cette dernière n'est pas mentionnée...

LB2
Habitué(e)
Messages: 1504
Enregistré le: 05 Nov 2017, 16:32

Re: PROBABILITE

par LB2 » 05 Fév 2020, 21:55

Bonjour,

pour bien comprendre l'énoncé qui est à mon sens trop rapide et donc source de confusions :

- Dans la population totale des étudiants, la proportion de ceux qui souhaitent faire maïeutique est 4%
- On sélectionne un échantillon d'étudiants de taille n
- Dans cet échantillon, on mesure la proportion de ceux qui souhaitent faire maïeutique.
Cette proportion est la réalisation d'une variable aléatoire, puisque l'échantillon est aléatoire.
C'est à dire que pour deux échantillons différents, on obtiendrait deux valeurs différentes.

L'idée statistique est de faire comme si on pouvait répéter cette expérience un grand nombre de fois, et simuler ainsi la loi d'une variable aléatoire (ce qui serait trop couteux en pratique).

On souhaite alors déterminer la taille de l'échantillon n telle que la probabilité de l'évènement "La proportion dans l'échantillon des étudiants souhaitant faire maïeutique est inférieure à 2%" soit très faible, ici inférieure à 1%. C'est ce qu'on appelle le niveau alpha ou risque de première espèce.

Notre modèle :

1) Dans l'échantillon de taille n, le nombre d'étudiants souhaitant faire maïeutique suit une loi binomiale de paramètres n et p=0.04.
Remarque : En réalité, ce nombre suit une loi hypergéométrique, car l'opération de sélection des étudiants est un tirage sans remise et non avec remise. Considérer que c'est une loi binomiale est une approximation, que l'on considère vraie si la taille de l'échantillon est faible devant la taille de la population totale. En pratique, un facteur 10 suffit. On admet que cette hypothèse est vraie ici pour simplifier les calculs, de toutes façons le nombre total d'étudiants n'est pas indiqué.

2) On peut alors approximer la loi binomiale B(n,0.04) par une loi normale de moyenne 0.04 n et de variance 0.04*0.96*n = 0.0384 n, à condition toutefois que n soit supérieur ou égal à 30, que 0.04 n soit supérieur à 5, et que 0.96n soit supérieur à 5, conditions que l'on peut résumer par n supérieur à 125. On remarque que toutes les réponses proposées vérifient cette condition

3) Sous l'hypothèse que ce nombre d'étudiants souhaitant faire maïeutique dans l'échantillon de taille n, que l'on note M(n), est une réalisation de loi normale de moyenne 0.04n et de variance 0.0384n, que peut-on dire?

a) On peut donner un intervalle de confiance, correspondant aux valeurs les plus probables, et en excluant les valeurs de queue de distribution, c'est à dire les valeurs exceptionnelles.

Il y a deux choix principaux pour cet intervalle de confiance :
- bilatéral (symétrique centré autour de la moyenne)
- unilatéral (à gauche ou à droite)

et il faut également préciser à quel seuil "d'exceptionnalité" on le calcule, c'est exactement ton niveau de risque = 1% ici.

Pour cela, on se ramène à la table de la loi normale centrée réduite (souvent notée Z), en utilisant le lemme suivant :
Si suit une loi normale de moyenne et d'écart type , alors suit une loi normale centrée réduite.

b) On peut également,comme tu souhaitais le faire, et c'est plus direct, calculer la probabilité de l'évènement (M(n) >0.02) en fonction de la taille de l'échantillon n. Toujours en utilisant le lemme pour se ramener à une loi normale centrée réduite, dont on connait la loi dans des tables : https://www.math.u-bordeaux.fr/~pmagal1 ... tudent.pdf)

4) On conclut sur la valeur minimale souhaitée de n (qui dépend bien sûr de alpha, mais ici alpha est fixé = 1%)
Modifié en dernier par LB2 le 06 Fév 2020, 01:23, modifié 2 fois.

GaBuZoMeu
Habitué(e)
Messages: 6133
Enregistré le: 05 Mai 2019, 09:07

Re: PROBABILITE

par GaBuZoMeu » 05 Fév 2020, 22:27

la probabilité de l'évènement "La proportion dans l'échantillon des étudiants souhaitant faire maïeutique est supérieure à 2%" soit très faible

Tu voulais dire "inférieure à 2%", je suppose.

LB2
Habitué(e)
Messages: 1504
Enregistré le: 05 Nov 2017, 16:32

Re: PROBABILITE

par LB2 » 05 Fév 2020, 22:48

oui, je corrige merci

GaBuZoMeu
Habitué(e)
Messages: 6133
Enregistré le: 05 Mai 2019, 09:07

Re: PROBABILITE

par GaBuZoMeu » 06 Fév 2020, 09:47

Sauf erreur :

Supposons une population totale de PluriPass égale à 100 000 étudiants. Parmi ceux-ci, 4 000, soit 4%, veulent faire maïeutique en premier choix.
La proportion d'échantillons de 430 étudiants parmi les 100 000 qui comptent au plus 8 étudiants ayant maïeutique en premier choix (c.-à-d. moins de 2% sur l'échantillon) est de 0,996%.

Que penser de l'exercice ?

LB2
Habitué(e)
Messages: 1504
Enregistré le: 05 Nov 2017, 16:32

Re: PROBABILITE

par LB2 » 06 Fév 2020, 10:46

Que c'est la réponse E) "Aucune des propositions suivantes n'est exacte" qu'il faut choisir

GaBuZoMeu
Habitué(e)
Messages: 6133
Enregistré le: 05 Mai 2019, 09:07

Re: PROBABILITE

par GaBuZoMeu » 06 Fév 2020, 10:49

Est-ce la réponse attendue par la personne qui a posé l'exercice ?

On peut se dire, 100 000, ce n'est pas assez. Soyons plus ambitieux et enrôlons 650 000 étudiants dans le programme (avec toujours 4% de fans de la maïeutique, soit 26 000). Alors un échantillon de 396 étudiants a 0,985% de chances de contenir au plus 7 fans de maïeutique (soit moins de 2% de l'échantillon). Sauf erreur, c'est la plus petite taille d'échantillon à passer sous la barre de 1% de déchets.

Pour une population totale de 650 000 le pourcentage de déchets (moins de 2% de fans de maïeutique dans l'échantillon) en fonction de la taille de l'échantillon. Les sauts s'expliquent facilement.

Image

LB2
Habitué(e)
Messages: 1504
Enregistré le: 05 Nov 2017, 16:32

Re: PROBABILITE

par LB2 » 06 Fév 2020, 14:46

C'est intéressant mais je ne vois pas ce que change l'hypothèse que la taille de la population totale vaut 650000 ou 100000

fanjeay
Messages: 9
Enregistré le: 21 Jan 2020, 23:07

Re: PROBABILITE

par fanjeay » 06 Fév 2020, 14:56

GaBuZoMeu a écrit:
la probabilité de l'évènement "La proportion dans l'échantillon des étudiants souhaitant faire maïeutique est supérieure à 2%" soit très faible

Tu voulais dire "inférieure à 2%", je suppose.



Bonjour,

Tout d'abord merci pour cette réponse détaillée !

Cependant je ne comprends toujours pas comment procédé car vous m'avez détaillé ce que j'ai déjà fais.
De plus, dans mon énoncé, le "n" n'est pas donné, c'est pour cela que je ne comprends pas votre raisonnement en prenant n'importe quelle valeur de n...

Je reste toujours bloqué...

J'au tout de même essayée de faire quelque chose :

J'ai testé p(x>0,02) avec les différents n donné dans les réponses (630, 640...) en exprimant la loi binomiale par une loi normale... mais je trouve des pourcentages bien supérieurs a 2%.
(49,2 % par exemple)

LB2
Habitué(e)
Messages: 1504
Enregistré le: 05 Nov 2017, 16:32

Re: PROBABILITE

par LB2 » 06 Fév 2020, 15:22

n est la taille de l'échantillon donc vaut 620, 630, 640, 650 suivant les réponses proposées. Comme aucune ne convient , il faut choisir la réponse E dans ce QCM.

D'un point de vue heuristique sans aucun calcul : 2% est très inférieur à 4%, donc l'évènement "Dans l'échantillon, il y a moins de 2% d'étudiants choisissant maïeutique" est très improbable.

On peut utiliser la règle des "6 sigma", à savoir qu'une gaussienne prend 99% de ses valeurs entre [mu-3sigma, mu+3sigma]

fanjeay
Messages: 9
Enregistré le: 21 Jan 2020, 23:07

Re: PROBABILITE

par fanjeay » 06 Fév 2020, 15:29

Dans l'énoncé, il est dit : "cette proportion ne soit pas inférieur à 2%", cela veut dire qu'il faut qu'elle soit supérieur a 2%... c'est pour cela que je ne comprends pas votre raisonnement...

GaBuZoMeu
Habitué(e)
Messages: 6133
Enregistré le: 05 Mai 2019, 09:07

Re: PROBABILITE

par GaBuZoMeu » 06 Fév 2020, 15:33

LB2 a écrit:C'est intéressant mais je ne vois pas ce que change l'hypothèse que la taille de la population totale vaut 650000 ou 100000


Je fais les graphiques pour des populations totales de 1000 (en noir), 10000 (en vert), 100000 (en rouge) et 1000000 (en bleu).

Image

Rappel : en abscisse la taille de l'échantillon, en ordonnée le pourcentage de déchets (moins de 2% de fans de maïeutique dans l'échantillon).

On constate que la taille de la population a bien évidemment une influence sur les résultats, mais que ça stationne au-delà de 100000 (la courbe bleue est pratiquement confondue avec la rouge).

LB2
Habitué(e)
Messages: 1504
Enregistré le: 05 Nov 2017, 16:32

Re: PROBABILITE

par LB2 » 06 Fév 2020, 16:05

J'aime beaucoup ces courbes, qu'on voit rarement dans des cours de stats, mais qui aident à comprendre le bien fondé du point de vue statistique asymptotique sous des hypothèses d’échantillonnage correct.

Tu évoquais que les sauts sont faciles à expliquer, comment peut-on les interpréter?

fanjeay
Messages: 9
Enregistré le: 21 Jan 2020, 23:07

Re: PROBABILITE

par fanjeay » 06 Fév 2020, 16:51

GaBuZoMeu a écrit:
LB2 a écrit:C'est intéressant mais je ne vois pas ce que change l'hypothèse que la taille de la population totale vaut 650000 ou 100000


Je fais les graphiques pour des populations totales de 1000 (en noir), 10000 (en vert), 100000 (en rouge) et 1000000 (en bleu).

Image

Rappel : en abscisse la taille de l'échantillon, en ordonnée le pourcentage de déchets (moins de 2% de fans de maïeutique dans l'échantillon).

On constate que la taille de la population a bien évidemment une influence sur les résultats, mais que ça stationne au-delà de 100000 (la courbe bleue est pratiquement confondue avec la rouge).



Merci pour ce travail, mais cela ne m'aime toujours pas à comprendre le sens de l'exercice...

GaBuZoMeu
Habitué(e)
Messages: 6133
Enregistré le: 05 Mai 2019, 09:07

Re: PROBABILITE

par GaBuZoMeu » 06 Fév 2020, 17:38

1°) La question des sauts : ils se produisent aux multiples de 50, c'est-à-dire aux endroits où la partie entière des 2% de l'effectif de l'échantillon change ! Et quand on passe de 6 à 7 puis à 8, ça fait à chaque fois une différence très appréciable. Je pense qu'il est maintenant clair pourquoi il y a des sauts à ces endroits, n'est-ce pas ?

2°) La question du sens de l'exercice. J'aurais du mal à expliquer quelque chose que je ne comprend pas très bien moi-même : où veut en venir l'auteur de l'exercice ? Je me suis contenté de prendre les données de l'exercice en faisant des calculs exacts (sans approximation par une loi normale ou truc de ce genre), ce qui suppose de faire un choix d'effectif total. Bien entendu, je n'ai pas fait les calculs à la main, je les ai fait faire par SageMath avec le code suivant (qui est je pense facile à déchiffer, mais je peux préciser en cas de besoin) :
Code: Tout sélectionner
def prob(mai,ech) :
    pop=25*mai
    min=floor(ech/50)+1
    s=sum(binomial(mai,u)*binomial(pop-mai,ech-u) for u in range(min))
    return (s/binomial(pop,ech)*100).n(12)

mai est le nombre total de maïeuticiens, ech la taille de l'échantillon.
pop est la population totale
min est le nombre minimum admissible de maïeuticiens dans l'échantillon
s le nombre d'échantillons ne satisfaisant pas la condition minimale
binomial(pop,ech) est bien sûr le nombre total d'échantillons.

LB2
Habitué(e)
Messages: 1504
Enregistré le: 05 Nov 2017, 16:32

Re: PROBABILITE

par LB2 » 06 Fév 2020, 17:55

fanjeay a écrit:
Merci pour ce travail, mais cela ne m'aime toujours pas à comprendre le sens de l'exercice...


Pour une réponse rapide à l'exercice, je t'ai déjà répondu. Voilà comment on peut procéder pour répondre en 1 min à la question.

J'évalue moyenne et écart type de la gaussienne (en fonction de n)
Pour chaque valeur de n proposée (mais ici elles sont toutes similaires), je calcule mu-3sigma, mu+3sigma (qui correspond à un intervalle de confiance bilatéral à 99% pour la proportion des étudiants souhaitant M).

J'observe que cette intervalle centré autour de 0.04 ne contient pas 0.02, pour aucune valeur de n.
Il faudrait n beaucoup plus faible pour que cela se produise.

Conclusion : réponse E

 

Retourner vers ✯✎ Supérieur

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 39 invités

Tu pars déja ?



Fais toi aider gratuitement sur Maths-forum !

Créé un compte en 1 minute et pose ta question dans le forum ;-)
Inscription gratuite

Identification

Pas encore inscrit ?

Ou identifiez-vous :

Inscription gratuite