Réaliser un classement statistiquement

Réponses à toutes vos questions après le Bac (Fac, Prépa, etc.)
Toad1010
Messages: 3
Enregistré le: 31 Mai 2019, 22:27

Réaliser un classement statistiquement

par Toad1010 » 31 Mai 2019, 22:31

Bonjour à vous !

Je suis actuellement en train de sonder différentes personnes afin de dresser un classement de popularité entre différents personnages : les individus interrogés classent six personnages dans l'ordre qu'ils souhaitent, et donc, ces six personnages n'obtiennent pas forcément la même place, cependant la récurrence d'une certaine place peut rendre un personnage plus populaire ou son contraire

Exemple :

Personnage A reçoit cinq fois la première place mais une fois la dernière place, cela n'empêche qu'il reste bien plus populaire que Personnage B qui a reçu quatre fois la quatrième place et deux fois la cinquième place (sans jamais recevoir la dernière place contrairement au premier... et pourtant !)... Sommes-nous d'accord ? Voyez-vous où je veux en venir ?

Je souhaite faire apparaître tout ça sur un ou plusieurs graphiques... L'objectif étant d'avoir un graphe montrant directement quel est le personnage le plus populaire ce qui demande probablement différents type de graphes et donc de calculs en amont

Pour ce faire, j'ai réalisé un simple tableau de statistiques sur Excel, le même pour chacun des six personnages, qui se présente de la manière suivante :

Classement

Effectif (Nombre d'occurrences)

Fréquence

Fréquence (%)

On pourrait donc par exemple avoir :

Classement 1er 2ème 3ème 4ème 5ème 6ème Total

Effectif 0 1 0 1 2 2 6

Et ensuite les fréquences qui correspondent (ici l'effectif total vaut bien six parce que six personnes ont été sondées, il n'a pas juste été mis six parce qu'il y a six personnages)

Donc "1" veut bien dire ici qu'un personnage a reçu une fois la deuxième place et/ou une fois la quatrième place

C'est un tableau qui serait donc mis à jour à chaque fois qu'un nouveau classement est donné... Si par exemple le personnage de l'exemple arrivait 1er/6 dans un nouveau classement on aurait :

Classement 1er 2ème 3ème 4ème 5ème 6ème Total

Effectif 1 1 0 1 2 2 7

Vous voyez ?

Désolé si j'ai l'air un peu trop exhaustif, c'est juste pour être sûr que mon raisonnement reste bien clair, et que donc, on comprenne tous bien de la même manière

Simplement, ayant déjà fait ce tableau pour chacun des personnages, il me faut approfondir, mais là se trouve le problème...

Bien que la répartition puisse être différente, le total reste le même donc calculer la moyenne reviendrait à calculer exactement la même valeur pour chacun des tableaux (au niveau des fréquences, mais cela s'appliquerait pour chaque ligne) A moins qu'il ne s'agisse de la moyenne d'autre chose (pondérée ?... autre ?...)

C'est plutôt vers la médiane (et accessoirement les quartiles) que je souhaitais m'orienter car quelque chose me dit que c'est vers elle que je devais me diriger, mais là... c'est plutôt le contexte qui ne me paraît pas forcément être le bon... ou c'est le tableau qui aurait dû être fait avec des variables différentes, mais là encore...

J'ai aussi pensé à une répartition gaussienne, avec éventuellement de la loi normale... mais ça me paraît sortir de trop gros outils non forcément nécessaires même si... cela pourrait me parler aussi mais là encore... sommes-nous bien dans le bon contexte ?...

J'en appelle donc à votre aide, même si j'en ai un peu honte tellement je pense que la manière de faire doit être évidente, mais bon, tant pis...

J'ai cru avoir entendu parler du paradoxe de Condorcet ou encore du système de vote australien pour m'aider à résoudre mon problème... mais cela ne me laisse que plus confus... Je m'en remets donc à vous



pascal16
Membre Légendaire
Messages: 6663
Enregistré le: 01 Mar 2017, 12:58
Localisation: Angoulème : Ville de la BD et du FFA. gare TGV

Re: Réaliser un classement statistiquement

par pascal16 » 01 Juin 2019, 06:58

1 1 0 1 2 2 n'a clairement rien de gaussien.
sans gaussienne, moyenne et écart-type représentent toujours une moyenne et une dispersion qui sont comparables à d'autres séries du même type.
Pour la représentation, une version colorée en dégradé de la boite à moustache serait peut être pas mal

Toad1010
Messages: 3
Enregistré le: 31 Mai 2019, 22:27

Re: Réaliser un classement statistiquement

par Toad1010 » 01 Juin 2019, 09:29

Un diagramme en boîte ?... Donc calcul d'un min et d'un max ainsi que des quartiles et donc la médiane ?
Dans ces cas-là, faudrait-il plutôt que je me base sur l'effectif selon mon cas, ou bien les fréquences que j'ai obtenues ? Parce qu'en faisant un diagramme en boîte comme cela j'ai l'impression qu'un certain nombre d'informations se perdraient (notamment les fréquences) et je ne suis pas sûr de bien voir comment l'interpréter (selon mon cas)... Je sais qu'Excel a des fonctions pour calculer ces valeurs directement, mais il faut juste que je puisse partir des bonnes...
Dans le cas de mon exemple, le min serait 1 et le max serait 2, ce qui ne me paraît pas être d'un grand sens vu que ces valeurs sont (pour le moment) récurrentes, j'imagine qu'il faudrait donc plutôt partir des fréquences... mais là encore c'est avec des quartiles que l'on se retrouverait sur le graphe final, j'ai donc un doute quant à l'interprétation en faisant le diagramme en boîte pour chaque personnage par rapport à leur classement de popularité, en suivant le modèle de tableau de fréquences que je vous ai envoyé, même si je pense avoir une petite idée (non sûr qu'elle soit correcte) mais c'est pourquoi j'aimerais m'en assurer avec vous

pascal16
Membre Légendaire
Messages: 6663
Enregistré le: 01 Mar 2017, 12:58
Localisation: Angoulème : Ville de la BD et du FFA. gare TGV

Re: Réaliser un classement statistiquement

par pascal16 » 01 Juin 2019, 10:07

si tu veux représenter 6 valeurs par seulement une, tu perds forcément des informations.

exemple de diagramme en boite minimaliste (moyenne +- écart-type) :

Image

Avatar de l’utilisateur
fatal_error
Membre Légendaire
Messages: 6610
Enregistré le: 22 Nov 2007, 12:00

Re: Réaliser un classement statistiquement

par fatal_error » 01 Juin 2019, 10:35

Hi,

Il y a certainement de la littérature sur le sujet m'enfin...
J'aurais personnellement envie d'utiliser une pondération avec des pts.
Ex: pour un votant. Le premier élu prend 9pts, le deuxieme 6pts, le troisieme 3pts, puis les autres 1pt (genre mario kart)

A la fin tu sommes les points pour chaque élu et tu as déterminé un classement.
Chaque "ordre" donné par un votant est pris en compte vu qu'on a réparti ses points en fonction
la vie est une fête :)

GaBuZoMeu
Habitué(e)
Messages: 6132
Enregistré le: 05 Mai 2019, 09:07

Re: Réaliser un classement statistiquement

par GaBuZoMeu » 01 Juin 2019, 10:54

J'ai cru avoir entendu parler du paradoxe de Condorcet


C'est facile de se renseigner. Et on peut voir la page wikipedia
Théorème d'impossibilité d'Arrow
qui explique qu'il n'y a aucun système satisfaisant de classement à partir d'ordres de préférence donnés par des votants.

Toad1010
Messages: 3
Enregistré le: 31 Mai 2019, 22:27

Re: Réaliser un classement statistiquement

par Toad1010 » 01 Juin 2019, 14:48

Re-bonjour, merci pour l'ensemble de vos réponses !

si tu veux représenter 6 valeurs par seulement une, tu perds forcément des informations.

exemple de diagramme en boite minimaliste (moyenne +- écart-type) :

Image


Quand tu parles des six valeurs, tu fais bien allusions aux différents nombres de points ou fréquences associées à ces points pour un personnage c'est bien ça ? Dans ces cas-là oui en effet, mais si c'est suffisamment visuel, je pense que ça ne devrait pas être un problème, dans la mesure où cela s'applique bien j'imagine ^ ^

Hi,

Il y a certainement de la littérature sur le sujet m'enfin...
J'aurais personnellement envie d'utiliser une pondération avec des pts.
Ex: pour un votant. Le premier élu prend 9pts, le deuxieme 6pts, le troisieme 3pts, puis les autres 1pt (genre mario kart)

A la fin tu sommes les points pour chaque élu et tu as déterminé un classement.
Chaque "ordre" donné par un votant est pris en compte vu qu'on a réparti ses points en fonction


C'est vrai que le système à la Mario Kart paraît plus simple à mettre en oeuvre ! Il me semble avoir pensé à quelque chose de similaire au début quand j'ai eu l'idée de faire ces classements mais elle a dû finir par se perdre ^ ^' J'essaierai d'exploiter un système comme celui-ci bien qu'il serait tout de même complémentaire à mes autres tableaux qui permettrait de voir plus clairement la répartition de l'attribution des places !!! En effet, avec le "système Mario Kart" on ne voit pas forcément la récurrence des places, mais c'est pourquoi il vaudrait mettre un écart assez considérable entre les points attribués à chaque place tout en restant assez cohérent ! De toute manière, si je comprends bien, ça serait quelque chose d'assez arbitraire... Parfait ! Merci beaucoup ! Je vais essayer d'exploiter cette piste et voir si c'est assez parlant pour moi (et d'autres) d'avoir ces différents types de graphes ensemble avec la littérature qui correspond ! J'aurais donc un graphe global montrant le classement général par rapport à cette répartition de points, et donc six graphes annexes (six par rapport aux six personnages) qui montrera la répartition en fréquence (?) du nombre de fois où une place à été obtenue (ça serait donc préférablement des histogrammes ou des diagrammes circulaires) Est-ce que ça te / vous paraîtrait parlant dans le cadre de l'estimation de la popularité d'un personnage (juste dans le cadre de ces statistiques je parle, d'autres moyens plus tard pourraient être mis en place, mais impossiblement faisables à l'instant présent) ?

C'est facile de se renseigner. Et on peut voir la page wikipedia
Théorème d'impossibilité d'Arrow
qui explique qu'il n'y a aucun système satisfaisant de classement à partir d'ordres de préférence donnés par des votants.


J'avoue ne pas comprendre la condescendance ^ ^' Je me suis justement renseigné sur le paradoxe de Condorcet sachant qu'il déclare que ce type de système est problématique et que justement le système de vote australien pouvait être une alternative proposant une solution à ce type de problème, mais baignant dans un certain nombre d'informations, et n'étant pas sûr que ces mêmes informations justement s'appliquaient bien à mon problème, j'ai préféré poser la question à juste titre, pensant notamment que tout cela était trop poussé pour ce que je souhaitais mettre en place, enfin... Je te remercie malgré tout pour la page partagée, ce sont des connaissances plus nombreuses à acquérir même si je reste tout de même assez déconcerté par le ton abordé ^ ^'

GaBuZoMeu
Habitué(e)
Messages: 6132
Enregistré le: 05 Mai 2019, 09:07

Re: Réaliser un classement statistiquement

par GaBuZoMeu » 01 Juin 2019, 15:19

Désolé si je t'ai froissé.
Mais tu avoueras que
J'ai cru avoir entendu parler du paradoxe de Condorcet

n'indique pas vraiment que tu es allé voir de quoi il s'agissait.

Il n'y a pas de bon système dans l'absolu. Il y en a des moins mauvais que d'autres.

Allez, pour apporter quelque chose de constructif, je montre un petit problème avec "Mario Kart"

Supposons qu'on a trois votants, d'abord pour 7 compétiteurs A B C D E F, puis pour 6 compétiteurs suite au décès de F. Les votants ont émis dans le premier vote les classements
F A C D B E
B A F E D C
B A F D C E
B est gagnant avec 19 points, il l'emporte sur A qui a 18 points.
Le décès de F ne change rien aux préférences des votants :
A C D B E
B A E D C
B A D C E
C'est maintenant A qui est gagnant avec 21 points, il l'emporte sur B qui a toujours 19 points.

Le système Mario Kart ne satisfait pas à la quatrième demande pour un système de vote raisonnable (voir la page wikipedia sur le théorème d'Arrow).
Indépendance des options non pertinentes : le classement relatif de deux options ne doit dépendre que de leur position relative pour les individus et non du classement d'options tierces ; si l'on ne considère qu'un sous-ensemble d'options, la fonction ne doit pas aboutir à un autre classement de ce sous-ensemble.


Le théorème d'Arrow dit qu'il n'existe aucun système de classement qui possède les quatre propriétés énoncées, qui semblent pourtant toutes très raisonnables !

 

Retourner vers ✯✎ Supérieur

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 44 invités

Tu pars déja ?



Fais toi aider gratuitement sur Maths-forum !

Créé un compte en 1 minute et pose ta question dans le forum ;-)
Inscription gratuite

Identification

Pas encore inscrit ?

Ou identifiez-vous :

Inscription gratuite