Test adéquation pour 2 échantillons

Discussion générale entre passionnés et amateurs de mathématiques sur des sujets mathématiques variés
Avatar de l’utilisateur
leon1789
Membre Transcendant
Messages: 5475
Enregistré le: 27 Nov 2007, 16:25

test adéquation pour 2 échantillons

par leon1789 » 28 Mar 2020, 10:58

Bonjour à tous,
Un enseignant a corrigé deux classes dont voici les résultats (notés sur 20, avec des demi-points parfois) :
classe A (22 personnes) :
2.5, 3, 5, 5, 5.5, 6.5, 7, 7.5, 7.5, 9, 9.5, 10, 10.5, 10.5, 10.5, 11.5, 12, 12, 12, 14, 15, 17.5
classe B (24 personnes) :
2, 2, 2.5, 3, 4, 4.5, 5.5, 5.5, 5.5, 6.5, 7, 7.5, 7.5, 8, 9.5, 9.5, 10, 10, 10, 10.5, 12.5, 13, 16.5, 16.5

La question est simple : quel test statistique peut-on mettre en place (avec un minimum d'hypothèse pour employer le test !!) pour vérifier si les deux classes ont des résultats en adéquation (ou si on peut éventuellement penser le contraire) ?

Je vous remercie d'avance pour vos suggestions.



Noemi
Membre Complexe
Messages: 3240
Enregistré le: 20 Oct 2007, 17:09

Re: test adéquation pour 2 échantillons

par Noemi » 28 Mar 2020, 14:27

Bonjour leon1789,

Les tests classique : déterminer la médiane, la moyenne, l'écart type, les quartiles

Avatar de l’utilisateur
leon1789
Membre Transcendant
Messages: 5475
Enregistré le: 27 Nov 2007, 16:25

Re: test adéquation pour 2 échantillons

par leon1789 » 28 Mar 2020, 14:32

Merci Noemi,

On peut calculer moyennes, médianes, écart-types de chaque série et les comparer. Mais cela ne révèle rien !!

Exemple avec une série C :
0, 0, 8.5, 8.5, 8.5, 8.5, 8.5, 9.5, 9.5, 9.5, 9.5, 10, 10, 10, 10, 10, 10, 10, 10, 10, 13, 20

On obtient le même nombre d'individu que la classe A, des moyennes, médianes et écarts-type quasi identiques, et pourtant il est évident que les répartitions ne sont pas du tout du tout du tout les mêmes.

Noemi a écrit: les quartiles

Précisément, cela donne quoi avec les quartiles ?
Modifié en dernier par leon1789 le 28 Mar 2020, 15:25, modifié 2 fois.

Noemi
Membre Complexe
Messages: 3240
Enregistré le: 20 Oct 2007, 17:09

Re: test adéquation pour 2 échantillons

par Noemi » 28 Mar 2020, 14:51

Que veux tu dire en indiquant "Cela ne révèle rien !!" ?

Tu parles de test statistiques avec un minimum d'hypothèses, peux tu indiquer un exemple d'hypothèse ?

Avatar de l’utilisateur
leon1789
Membre Transcendant
Messages: 5475
Enregistré le: 27 Nov 2007, 16:25

Re: test adéquation pour 2 échantillons

par leon1789 » 28 Mar 2020, 15:31

Noemi a écrit:Que veux tu dire en indiquant "Cela ne révèle rien !!" ?

Tu vois les deux séries A (dans le premier message) et C (dans mon second message) : elles ont même nombre d'éléments (22), même moyenne (9.25), médiane (9.75), écart-type (3.76), et pourtant leurs répartitions sont totalement différentes. Donc moyenne, médiane, écart-type sont bien insuffisants dans l'absolu, non ?


Noemi a écrit:Tu parles de test statistiques avec un minimum d'hypothèses, peux tu indiquer un exemple d'hypothèse ?

Les tests statistiques reposent parfois sur des hypothèses comme, même taille d'échantillon, répartition normale, etc. Le genre d'hypothèse pas vérifiées ici.

Idriss
Membre Relatif
Messages: 121
Enregistré le: 03 Mar 2020, 16:59

Re: test adéquation pour 2 échantillons

par Idriss » 28 Mar 2020, 17:11

Bonjour,

leon1789 a écrit:2.5, 3, 5, 5, 5.5, 6.5, 7, 7.5, 7.5, 9, 9.5, 10, 10.5, 10.5, 10.5, 11.5, 12, 12, 12, 14, 15, 17.5

2, 2, 2.5, 3, 4, 4.5, 5.5, 5.5, 5.5, 6.5, 7, 7.5, 7.5, 8, 9.5, 9.5, 10, 10, 10, 10.5, 12.5, 13, 16.5, 16.5


Trouver des indicateurs qui permet de différencier ces 2 séries de nombres :

1/ la longueur de la suite : pour l'une c'est 22 et l'autre 24

2/ La médiane : entre 9.5,10 et entre 7.5,7.5

3/ Comparer la moyenne des carrés, des cubes, des puissances 4...., ils ne seront identiques que si et seulement si la liste est la même.

Bonne journée.

Avatar de l’utilisateur
leon1789
Membre Transcendant
Messages: 5475
Enregistré le: 27 Nov 2007, 16:25

Re: test adéquation pour 2 échantillons

par leon1789 » 28 Mar 2020, 18:14

Bonjour Idriss,

Les longueurs : pour l'une c'est 22 et l'autre 24, certes,
mais quel est le lien par rapport à leur adéquation ?

La médiane : entre 9.5 et 10 pour la classe A et 7.5 pour la classe B, OK,
et cela permet-il de répondre que les séries ne sont vraisemblablement pas en adéquation ?

Comparer la moyenne des carrés, des cubes, des puissances 4....
Et on s'arrête où pour conclure quoi ?

beagle
Habitué(e)
Messages: 8707
Enregistré le: 08 Sep 2009, 15:14

Re: test adéquation pour 2 échantillons

par beagle » 28 Mar 2020, 18:45

je pense que le prof était énervé quand il a corrigé la classe B
L'important est de savoir quoi faire lorsqu'il n' y a rien à faire.

Avatar de l’utilisateur
leon1789
Membre Transcendant
Messages: 5475
Enregistré le: 27 Nov 2007, 16:25

Re: test adéquation pour 2 échantillons

par leon1789 » 28 Mar 2020, 19:01

Certes, il y avait de quoi, mais c'est une autre histoire, je pense.
Tu penses donc qu'il y a une différence significative ? comment le justifies-tu ?

Idriss
Membre Relatif
Messages: 121
Enregistré le: 03 Mar 2020, 16:59

Re: test adéquation pour 2 échantillons

par Idriss » 28 Mar 2020, 21:35

Le prof a été plus sévère avec une classe, ou le sujet était mieux maîtrisé par une classe qu'une autre.

En effet il y a 50% de gens avec la moyenne dans la classe A, contre seulement 33% avec la moyenne dans la classe B.

LB2
Habitué(e)
Messages: 1504
Enregistré le: 05 Nov 2017, 17:32

Re: test adéquation pour 2 échantillons

par LB2 » 28 Mar 2020, 21:53

Sinon,

si on veut parler de choses sérieuses, tu peux regarder du coté du test t de Student (groupes appariés ou groupes non appariés).

Mais il y a une hypothèse de normalité...

Avatar de l’utilisateur
leon1789
Membre Transcendant
Messages: 5475
Enregistré le: 27 Nov 2007, 16:25

Re: test adéquation pour 2 échantillons

par leon1789 » 28 Mar 2020, 21:56

@Idriss

oui, ok pour toutes ses statistiques descriptives, mais est-ce que cela permet de justifier correctement une différence significative entre les deux classes ?

Autrement dit, de telles différences entre les médianes, ou les notes >= 10, ne sont -elles pas dues simplement au hasard ?

Avatar de l’utilisateur
leon1789
Membre Transcendant
Messages: 5475
Enregistré le: 27 Nov 2007, 16:25

Re: test adéquation pour 2 échantillons

par leon1789 » 28 Mar 2020, 21:58

LB2 a écrit:si on veut parler de choses sérieuses, tu peux regarder du coté du test t de Student (groupes appariés ou groupes non appariés).

c'est exactement de cela que j'aimerais parler. De tests "sérieux" qui ont un nom.

LB2 a écrit:Mais il y a une hypothèse de normalité...

oui, justement, c'est ce que j'aimerais éviter (les notes ne suivent pas forcément une loi normale).

Idriss
Membre Relatif
Messages: 121
Enregistré le: 03 Mar 2020, 16:59

Re: test adéquation pour 2 échantillons

par Idriss » 28 Mar 2020, 22:09

leon1789 a écrit:mais est-ce que cela permet de justifier correctement une différence significative entre les deux classes ?

Pour faire cela tu as besoin de plus de résultats.

Il faut plus de classes notés par ce même prof, il faut savoir que les profs s'arrangent (en générale) pour avoir un certain pourcentage de la classe avec plus de la moyenne, si c'est bien le cas avec ce prof (pour cela il faut plus de classes notés par ce prof) alors tu as ta réponse : la sévérité !

LB2
Habitué(e)
Messages: 1504
Enregistré le: 05 Nov 2017, 17:32

Re: test adéquation pour 2 échantillons

par LB2 » 28 Mar 2020, 22:31

@leon1789

je ne l'ai jamais utilisé, mais le test de Wilcoxon-Mann-Whitney me semble intéressant.
C' est un test statistique non paramétrique qui permet de tester l'hypothèse selon laquelle les médianes de chacun de deux groupes de données sont proches. Il n'y a pas d'hypothèse de normalité.
https://fr.wikipedia.org/wiki/Test_de_W ... nn-Whitney

Il est implémenté dans R et dans Python.

Petit avertissement : On lit parfois que ce test permet de déterminer si les échantillons proviennent de populations ou de distributions identiques. Cela est totalement faux. Ce test permet uniquement d'étudier la position relative des échantillons. Par exemple, si on génère un échantillon de 500 observations tiré dans une loi N(0,1) et un échantillon de 500 observations tiré dans une loi N(0,4), le test de Mann-Whitney ne trouve aucune différence entre les échantillons

Et de toutes façons, les échantillons sont de taille très faible : sans des données supplémentaires, on ne pourra malheureusement pas dire grand chose de significatif...

Idriss
Membre Relatif
Messages: 121
Enregistré le: 03 Mar 2020, 16:59

Re: test adéquation pour 2 échantillons

par Idriss » 28 Mar 2020, 22:40


Avatar de l’utilisateur
leon1789
Membre Transcendant
Messages: 5475
Enregistré le: 27 Nov 2007, 16:25

Re: test adéquation pour 2 échantillons

par leon1789 » 28 Mar 2020, 23:48

Idriss a écrit:
leon1789 a écrit:mais est-ce que cela permet de justifier correctement une différence significative entre les deux classes ?

Pour faire cela tu as besoin de plus de résultats.

Il faut plus de classes notés par ce même prof, il faut savoir que les profs s'arrangent (en générale) pour avoir un certain pourcentage de la classe avec plus de la moyenne, si c'est bien le cas avec ce prof (pour cela il faut plus de classes notés par ce prof) alors tu as ta réponse : la sévérité !

Je ne veux pas savoir ce qu'il se passe avec d'autres classes, mais uniquement si ces deux là ont des résultats significativement différents. Tu fais entrer en jeu une subjectivité par rapport à la sévérité, cela ne m'intéresse pas. Je ne veux pas comparer deux profs, mais deux classes.

Je précise que je désire un raisonnement basé sur l'étude mathématique des séries statistiques, ultimement à l'aide d'un calcul de probabilité.
Bref, j'ai uniquement ces deux séries (et je dois m'en satisfaire), avec la donnée que les notes sont entre 0 et 20, avec des demi-points (lois de probabilité discrètes, etc).

Avatar de l’utilisateur
leon1789
Membre Transcendant
Messages: 5475
Enregistré le: 27 Nov 2007, 16:25

Re: test adéquation pour 2 échantillons

par leon1789 » 29 Mar 2020, 00:07

LB2 a écrit:je ne l'ai jamais utilisé, mais le test de Wilcoxon-Mann-Whitney me semble intéressant.
C' est un test statistique non paramétrique qui permet de tester l'hypothèse selon laquelle les médianes de chacun de deux groupes de données sont proches. Il n'y a pas d'hypothèse de normalité.
https://fr.wikipedia.org/wiki/Test_de_W ... nn-Whitney

Merci pour ce nouveau test. C'est ce genre de piste que j'aimerais.
Il est en ligne : http://www.sthda.com/french/rsthda/unpa ... lcoxon.php
(version échantillon non appareillé)

Mais malheureusement, ce test n'est pas satisfaisant pour la question.
Par exemple, les deux séries de notes suivantes obtiennent un p-value de 1,
série D : 0., 0.5, 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 15.5, 16, 16.5, 17, 17.5, 18, 18.5, 19, 19.5, 20.
série E : 5, 5.5, 6, 6.5, 7, 7.5, 8, 8.5, 9, 9.5, 10, 10.5, 11, 11.5, 12, 12.5, 13, 13.5, 14, 14.5, 15
alors qu'elles sont distribuées de manières évidemment très différentes !!

LB2 a écrit:Petit avertissement : On lit parfois que ce test permet de déterminer si les échantillons proviennent de populations ou de distributions identiques. Cela est totalement faux.

Je suis absolument d'accord avec toi. On le lit souvent, et c'est pourtant totalement faux, en effet.

LB2 a écrit:Et de toutes façons, les échantillons sont de taille très faible : sans des données supplémentaires, on ne pourra malheureusement pas dire grand chose de significatif...

Tout dépend des échantillons ! Les séries D et E sont clairement différentes, bien que de petites tailles. Idem pour A et C ...

C'est comme une estimation par intervalle de confiance : même avec un échantillon de petite taille, on peut donner un intervalle. Celui-ci sera peu précis, ok, mais il sera mathématiquement correct. La petite taille de l'échantillon n'empêche pas la rigueur la mathématique... (sauf si on pense à une limite quand la taille devient infinie, genre TCL)

Résumons : test Wilcoxon-Mann-Whitney , ou du student, pas satisfaisants ici.
Autre idée ?

Avatar de l’utilisateur
leon1789
Membre Transcendant
Messages: 5475
Enregistré le: 27 Nov 2007, 16:25

Re: test adéquation pour 2 échantillons

par leon1789 » 29 Mar 2020, 00:12


Merci Idriss, je vais lire ce document (en partie...) , et je reviens.
Modifié en dernier par leon1789 le 29 Mar 2020, 00:13, modifié 1 fois.

Idriss
Membre Relatif
Messages: 121
Enregistré le: 03 Mar 2020, 16:59

Re: test adéquation pour 2 échantillons

par Idriss » 29 Mar 2020, 00:12

Ok, serais-tu faire ce que tu nous demandes avec les 2 séries suivantes :

une classe avec 22 : 0

et une classe avec 24 : 20

J'aimerais un raisonnement basé sur l'étude mathématique des séries statistiques, et avec un calcul de probabilité.

 

Retourner vers ⚜ Salon Mathématique

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 16 invités

cron

Tu pars déja ?



Fais toi aider gratuitement sur Maths-forum !

Créé un compte en 1 minute et pose ta question dans le forum ;-)
Inscription gratuite

Identification

Pas encore inscrit ?

Ou identifiez-vous :

Inscription gratuite