Urgent Sujet Grand oral Maths filtrage bayésien

Réponses à toutes vos questions de la 2nde à la Terminale toutes séries
chloemares
Messages: 2
Enregistré le: 13 Juin 2022, 00:55

Urgent Sujet Grand oral Maths filtrage bayésien

par chloemares » 13 Juin 2022, 01:02

Bonjour,
Je suis actuellement en train de préparer mon grand oral de mathématiques. J'ai donc choisi de parler du filtrage bayésien, et pour cela j'ai décidé de présenter un exercice. Le problème etant que je bloque sur la fin et ne suis pas sûre de toutes mes réponses. Pourriez-vous m'aidez s'il vous plaît? Cela me serait vraiment d'une grande aide. L'exercice paraît long mais c'est juste l'énoncé ou plutôt la mise en contexte. Le problème vient du livre Belin

Filtrage bayésien des spams

Problème 1

Nous recevons régulièrement dans nos boîtes de messagerie électronique des courriers indésirables, aussi appelés spams. C'est pourquoi il existe des logiciels dont le rôle est de filtrer ces messages. Voici un des principes qui est utilisé pour réaliser ce filtrage. Le logiciel repère les mots les plus fréquents dans les spams à l'aide de l'utilisateur de la messagerie qui peut indiquer au fur et à mesure du temps si un courrier est légitime ou non. Ensuite, lorsqu'un message arrive, le logiciel analyse les mots qu'il contient et évalue à partir de leur fréquence d'apparition dans les spams la probabilité que le message en soit un ou non. Si cette probabilité est suffisamment grande, il range le message dans un dossier « courrier indésirable » et sinon il le laisse passer dans la boîte de réception principale.

En simplifiant le filtrage sur un mot donné (par exemple : « facture », « cadeau »…), on peut modéliser la situation de la façon suivante.
On choisit un message au hasard dans une boîte de messagerie et on considère les événements suivants :
-Le message est un spam (S)
-Le message contient le mot en question (M).
Les renseignements de l'utilisateur ont permis d'établir que :
P de M sachant S = 0,7
P de M sachant Sbarre=0,4

On considère qu'il n'y a pas plus de chance qu'un message arrivant dans la boîte soit un spam qu'il ne le soit pas.
D'où P(S)=P(Sbarre)=0,5

Question 1:
Remplir un arbre ponderé (fait)

Question 2:
Un message qui contient le mot arrive dans la boîte de réception. Quelle est la probabilité que ce soit un spam ?

Nous savons déjà que P de M sachant S=0,7 et que P(S)=0,5. Afin de pouvoir utiliser la formule de Bayes il faut que l'on calcule P(M).
D'après la formule des probabilités totales P(M)=P(M inter S)+P(M inter Sbarre)
         =P de M sachant S×P(S) + P de M                   sachant Sbarre×P(Sbarre)
         =0,7×0,5 + 0,4×0,5
         =0,35 + 0,2
         =0,55
D'après la formule de Bayes:
P de S sachant M= P de M sachant S× P(S) le tout divisé par P(M)
=0,7×0,5/0,55
=0,35/0,55
~0,63

Question 3:
a-En réalité, on estime que la proportion de spams qui arrivent dans une boîte de messagerie varie entre 55 % et 95 %.

On note alors x la probabilité qu'un message soit un spam.

Ainsi P(S)=x et les valeurs de P de M sachant S et P de M sachant Sbarre sont inchangées.

Modifier l'arbre de probabilité précédant afin de représenter cette nouvelle situation. (Fait)

b-Exprimer  P de S sachant M en fonction de x. On notera f(x) cette fonction.

P de S sachant M= 0,7x/0,55

c-Étudier les variations de f sur [0 ; 1].

d-Le logiciel classe un message dans le dossier « courrier indésirable » à partir du moment où P de S sachant M⩾90 %. Déterminer la valeur de x à partir de laquelle un message sera rangé dans ce dossier sachant qu'il contient le mot en question.



Voilà, j'espère que vous pourrez m'aider a trouver les solutions et corriger mes fautes si il y en a.

Merci beaucoup d'avance !



Rdvn
Membre Rationnel
Messages: 803
Enregistré le: 05 Sep 2018, 12:55

Re: Urgent Sujet Grand oral Maths filtrage bayésien

par Rdvn » 13 Juin 2022, 22:32

Bonsoir,
Noter, pour être plus lisible, P(M/S) la probabilité de M sachant S
(c'est l'ancienne notation, l'actuelle est Ps(M) mais difficile à écrire ici)

Au 3 b votre résultat est faux :
P(M) dépend de x : voyez votre arbre avec en première ramification :
P(S) = x
P(non S)=1-x (non S est l'événement contraire à S , noté S barre au dessus, avec la bonne typographie )
A vous, proposez vos essais

ADILON
Membre Naturel
Messages: 15
Enregistré le: 08 Sep 2021, 18:35

Re: Urgent Sujet Grand oral Maths filtrage bayésien

par ADILON » 13 Juin 2022, 23:54

Bonjour,
Bonne observation Rdvn, mais Chloemares a oublié de remettre le dénominateur dans la formule de Bayes en fonction de x.
Le reste consiste à résoudre une inégalité du premier degré.

Rdvn
Membre Rationnel
Messages: 803
Enregistré le: 05 Sep 2018, 12:55

Re: Urgent Sujet Grand oral Maths filtrage bayésien

par Rdvn » 14 Juin 2022, 11:56

En fait chloemares a gardé P(M)=0,55 , à tort , au lieu de calculer P(M) en fonction de x .
C'est ce que je lui signalais dans ma première réponse.

chloemares
Messages: 2
Enregistré le: 13 Juin 2022, 00:55

Re: Urgent Sujet Grand oral Maths filtrage bayésien

par chloemares » 15 Juin 2022, 00:27

Bonsoir,
Merci beaucoup pour vos remarques, grâce à elles j'ai réussi à résoudre le problème et compris mes erreurs!

Rdvn
Membre Rationnel
Messages: 803
Enregistré le: 05 Sep 2018, 12:55

Re: Urgent Sujet Grand oral Maths filtrage bayésien

par Rdvn » 15 Juin 2022, 07:35

OK
N'hésitez pas à proposer vos résultats, en cas de doute.
Bon courage

 

Retourner vers ✎✎ Lycée

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 160 invités

Tu pars déja ?



Fais toi aider gratuitement sur Maths-forum !

Créé un compte en 1 minute et pose ta question dans le forum ;-)
Inscription gratuite

Identification

Pas encore inscrit ?

Ou identifiez-vous :

Inscription gratuite