Comparaison de distribution

Réponses à toutes vos questions après le Bac (Fac, Prépa, etc.)
tidam001
Messages: 4
Enregistré le: 11 Avr 2007, 15:05

Comparaison de distribution

par tidam001 » 11 Avr 2007, 15:14

Bonjour à tous,

voilà ce qui m'amène !! je suis étudiant biologiste et j'ai un petit problème :

- je possède une distribution d'un paramètre (appelons le "têta") avec une barre d'erreur (en Y donc) en fonction d'un angle variant de 0 à 180 (appelons le "orientation") indépendants entre eux.

Je possède plein de distribution de têta, comparables entre elles... Or j'aimerais avoir une relation mathématique qui me permettent de dire "ces deux courbes sont identiques entre elles... celles là ne le sont pas"...

J'ai éliminé tout ce qui étaient tests sur moyennes etc etc..

je recherche particulièrement une sorte de "norme" afin de regrouper ces courbes de distributions entre elles et donc créer une typologie..

Je vous remercie, si vous des idées je suis preneur... et si vous voulez d'autres infos sur mon problème également !!

Merci à toutes et tous !!!



Ted
Membre Naturel
Messages: 71
Enregistré le: 26 Mar 2007, 21:22

par Ted » 11 Avr 2007, 16:34

Ma faible experience des distributions me ferait dire qu'il est pas facile de dire si deux distributions sont égales.
En fait cela depend, si mes souvenirs sont bons, de leur comportement sur les parametres et leurs derivées.
Bref, il faut connaitre quelques critere sur le parametre. En as-tu? (fonctions derivable, à decroissance rapide, voire une formule explicite...)

Sinon tes courbes sont-elles données par des formule explicite, dans ce cas là des normes d'integrations pourraient etre utiles...

Si tu as le courage d'expliquer ton probleme en profondeur, je pense que tout le monde y verrai plus clair et pourrai y aller de sa petite idée.

tidam001
Messages: 4
Enregistré le: 11 Avr 2007, 15:05

par tidam001 » 12 Avr 2007, 14:06

Alors un peu plus d'explications :

voici un exemple tiré de mes données

Abscisse : 5; 15; 25; 35; 45; 55; 65; 75; 85

Distri1: 0.00512059; 0.00988847; 0.0135293; 0.0150932; 0.0260811; 0.0400348; 0.0398794; 0.0667474; 0.117341
Distri2: 0.0182555; 0.0263648; 0.02327; 0.0211711; 0.0211926; 0.0305989; 0.0696884; 0.0846795; 0.160947

Je n'ai pas d'équations pour les distributions !! ce sont des données qui caractérisent un endroit, et le but serait donc de dire : ces deux distributions sont globalement identiques ou pas !
En fait il faudrait comparer les 2 points des distributions situés en abscisse 5, puis les deux autres en 15 etc etc...

est ce que vous me suivez ?

Merci beaucoup !!!

buzard
Membre Relatif
Messages: 274
Enregistré le: 22 Mai 2006, 14:29

par buzard » 12 Avr 2007, 18:41

bonjour,

Je ne vois pas ou ce situe ton problème, comparer deux distributions, au sens mathématiques, ça revient simplement à dire si elles sont égale presque partout.

Je n'ai pas compris ton problème, pourquoi ton paramètre est-il "paramétré"?

ce que tu appel paramètre, c'est sans doute une caractéristique (ou propriété) que tu mesure pour chaque individus de ta population.

ou est-ce que c'est un paramètre estimé de la loi dont sont issus tes échantillons? Dans quel cas il faut faire du test de student, fisher, khi^2 et autre suivant le cas qui s'applique ici.

Je pencherais pour du khi^2 d'homogénéité, vu ta situation. mais il faudrait étayé un peu.

tidam001
Messages: 4
Enregistré le: 11 Avr 2007, 15:05

par tidam001 » 12 Avr 2007, 21:52

buzard a écrit: Je ne vois pas ou ce situe ton problème, comparer deux distributions, au sens mathématiques, ça revient simplement à dire si elles sont égale presque partout.


Oui c'est ça, je voudrais savoir si elles sont égales ou presque... surtout le "ou presque"!!!

buzard a écrit:ce que tu appel paramètre, c'est sans doute une caractéristique (ou propriété) que tu mesure pour chaque individus de ta population.


Oui, c'est une caractéristique (qui a été calculée précédemment par une méthode) mais les points (globalement 10 par distributionsà ne viennent pas d'une loi particulière !!!


J'ai du mal a expliquer ce que je voudrais faire, je m'excuse ! je vais essayer d'être plus clair :

le petit jeu de données que j'ai mis un peu plus haut avec quelques distributions en plus (non données ici), je fais un graphique avec... je vois que 2 courbes sont quasi horizontales, 3 sont de pentes négatives et encore 2 autres ressemblant à 2 sinusoïdes presques collées...
Je peux donc tirer GRAPHIQUEMENT des groupes de courbes... mais pour faire ces groupes je voudrais, si possible et si ça existe, pouvoir les faire mathématiquement, et donc dire : ces courbes là sont pareils ou pas !!

est ce plus clair ? j'espère aussi que j'emploi pas de mauvais termes pour m'expliquer !!!! merci beaucoup !!

buzard
Membre Relatif
Messages: 274
Enregistré le: 22 Mai 2006, 14:29

par buzard » 13 Avr 2007, 11:43

bonjour,

d'accord exprimé comme cela, c'est en effet du khi-2 qu'il faut que tu fasse. Malheureusement les résultats ne sont pas vraiment fiables, c'est un test qui supporte mal les variations dans les données, et qui est fortement biaisé par le choix des représentants de classes.

des alternatives au test du khi-2 sont le test de Kolomogorov-Smirnov et Anderson-Darling, qui ont l'avantage d'être indépendant des données empiriques. Et qui sont plus ou moins sensible aux petites variations.

Mais tous reviennent au même il s'agit de test d'hypothèse d'adéquation à une distribution donnée.

Le problème c'est que tu n'a pas cette distribution, il faut donc que tu fasse la moyenne des individus que tu pense pouvoir mettre dans la même classe. Et tu compare à cette individus moyen pour chaque classe.

Mais comme tu possède assez peu d'échantillons les résultats seront peu révélateur, étant données que tu compare à leur moyenne tu lisse déjà les écart, la probabilité de rejet diminuant d'autant.

Il y a d'autres test un peu plus robuste pour le test d'homogénéité, mais plus difficile à mettre en oeuvre, ils utilisent des principes de rassemblement d'échantillon avec des statistiques d'ordre. Le plus simple c'est d'utiliser un logiciel de statistique, et de tester les différents tests disponibles.

il y a un exemple simple dans [url=http://fr.wikipedia.org/wiki/Test_du_;)²]cette page[/url]

avec un lien vers une calculatrice en ligne qui fait le khi-2. remarque il faudra que tu revienne sur les effectifs pour faire le test.

tidam001
Messages: 4
Enregistré le: 11 Avr 2007, 15:05

par tidam001 » 13 Avr 2007, 12:46

Dans mon jeu de données réel j'ai beaucoup de distributions (plus d'une centaine), graphiquement je peux déjà isoler certains groupes

Donc pour un groupe graphique, je pourrais utiliser une des courbes présentes comme courbe référence et comparer avec les autres restantes... est ce que ça pourrais marcher ça ? voire même ensuite changer de courbes références ensuite...

dans cette optique là, lequel des tests serait le plus efficace à votre avis ?

En tout cas merci beaucoup pour votre éclairage car j'ai de grosses lacunes en stats...

Merci !!!

buzard
Membre Relatif
Messages: 274
Enregistré le: 22 Mai 2006, 14:29

par buzard » 13 Avr 2007, 16:02

tidam001 a écrit:Donc pour un groupe graphique, je pourrais utiliser une des courbes présentes comme courbe référence et comparer avec les autres restantes...


une courbe de référence c'est pas terrible, en générale on prend tous le groupe, et calcul la distribution normal en fonction de l'effectif de chaque échantillon.

est ce que ça pourrais marcher ça ? voire même ensuite changer de courbes références ensuite...


Oui ça va marché, mais est-tu sure que l'échantillon que tu choisi pour référence est vraiment un bon représentant? ensuite chaque modalité de seconde espèce (les différents échantillon du groupe) à son caractère propre dans sa classe, il n'a pas la même fréquence d'occurrence que les autres en générale. Il faudra donc normaliser avant de faire le test vis-à-vis d'un seul référent.

dans cette optique là, lequel des tests serait le plus efficace à votre avis ?


je persiste si tes échantillons sont suffisamment denses le plus simple c'est khi-2.

Mais si tu peux augmenter le nombre de modalité de première espèce (les catégories sur l'axe des abscisses), de sorte de te rapprocher d'une distribution continue, alors vaut mieux utiliser K-S ou A-D. A-D est plus sensible aux petits écarts que K-S, mais les lois de référence sont moins nombreuse (normal, log-normal, exponentiel, ...)

Donc avant de pouvoir appliquer A-D, il faut faire une stat sur tes échantillon pour en tirer une loi praticable.

Par contre, il est fortement possible que tous ces tests échoue, avec un taux d'erreur de discrimination trop important. Il faudra alors nécessairement tiré un modèle paramétré plus adapté et faire du test d'hypothèse sur ces paramètres. Il y a eu plus ou moins récemment des travaux de recherche à ce sujet, concernant la modélisation statistique des crus annuels, décennal, quinquennal, ... Avec un peu de recherche tu pourras sûrement trouver des articles qui puisse t'aider.


Pour savoir, il s'agit de mesures dans quels domaines? recherche dans la littérature associé des sujets analogues. tu aura des meilleurs indications.

 

Retourner vers ✯✎ Supérieur

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 61 invités

Tu pars déja ?



Fais toi aider gratuitement sur Maths-forum !

Créé un compte en 1 minute et pose ta question dans le forum ;-)
Inscription gratuite

Identification

Pas encore inscrit ?

Ou identifiez-vous :

Inscription gratuite