Analyse en Composantes Principales (Statistiques)

Réponses à toutes vos questions après le Bac (Fac, Prépa, etc.)
Mathys
Messages: 7
Enregistré le: 19 Avr 2012, 10:55

Analyse en Composantes Principales (Statistiques)

par Mathys » 19 Avr 2012, 11:10

Bonjour,

J'essaie de résoudre (et surtout comprendre) les exercices (ACP) d'un annale d'examens afin de m'entraîner.
N'ayant pas eu de cours à ce sujet (prof absent tout du long), il est dur pour moi d'y comprendre quelque chose.

Pourriez-vous tout d'abord me dire ce qu'il est nécessaire de comprendre et me donner les clefs essentielles concernant cette analyse en fonction de ce qui est donné (de façon à être capable de résoudre non seulement cet exercice, mais les potentiels autres exos lors des examens :id: ). Dans tous ces tableaux, je m'y perds et n'y comprends pas grand chose.

Comme ça, j’essaierai pas à pas de répondre aux questions...

Voici le sujet :

Une expérience visait à (1) analyser les mécanismes qui sous-tendent l’apprentissage collaboratif et le fonctionnement de la communication référentielle, et (2) à expliquer comment les interactions entre de jeunes apprenants, via l’outil informatique, pouvait faciliter l’apprentissage (voir Ben Abdallah et Castano, 2007). Pour atteindre ce double objectif, 26 enfants de Cours Elémentaires 2ème année (CE2), filles et garçons, ont d’abord été soumis à un questionnaire visant à évaluer leur niveau en informatique (fréquence et durée d’utilisation d’un ordinateur, de jeux vidéos – notées de 0 à 4). Les enseignants ont également rempli un questionnaire sur le niveau de français (de 1 à 5) et de mathématiques (de 1 à 5) de ces élèves, ainsi que sur leur niveau d’expression orale (de 1 à 3) et leur degré d’attention (de 1 à 2).
Les enfants ont ensuite été mis en situation de collaboration «*forcée*» dans laquelle ils devaient répondre à une série de 8 énigmes, qu'il était impossible de résoudre seul, sans communication. Le nombre de réponses correctes, la durée (en millisecondes) mise pour pointer le personnage et l'importance de la collaboration (notée de 0 à 4) ont été recueillies.

Une ACP a été réalisée à partir de cette étude. Une partie des résultats est présentée en Annexes.
1. Quelles sont les différences variables de l'étude*? (0,5 point).

2. Quel est le nombre maximal de facteurs de l'ACP*? Expliquez. Comment déterminer le nombre de facteurs à conserver pour l'interprétation*? (1 point)

3. On observe une valeur propre de 0.881 correspondant à la troisième composante. À quoi correspond la valeur propre*? Donnez une interprétation de ce chiffre et expliquez précisément les résultats du tableau 1 (1,5 points).

4. La variable «*langage*» est-elle bien prise en compte dans l'ACP*? Indiquez clairement sur quoi votre réponse est fondée (0,5 points).



Annexes :
Image

Image

Image



Elerinna
Membre Rationnel
Messages: 559
Enregistré le: 27 Fév 2012, 18:59

L'acp

par Elerinna » 19 Avr 2012, 15:02

Un cours , un résumé, un autre résumé et des exercices pour s'entraîner au préalable vous sont fournis.

Mathys
Messages: 7
Enregistré le: 19 Avr 2012, 10:55

par Mathys » 19 Avr 2012, 15:26

J'ai bien essayé de regarder les cours sur le net, mais j'y comprends riennnn :cry:
Les liens que vous me proposez sont vachement mathématiques. Et ce n'est absolument pas ma branche...
Ce que j'aurais aimé c'est que quelqu'un qui s'y connaissent peut-être un peu, m'aide en fonction de mon exercice ci-dessus. Car ça n'a pas grand chose à voir avec les cours/entraînements qu'on peut trouver sur le net si vous regardez.

Mathys
Messages: 7
Enregistré le: 19 Avr 2012, 10:55

par Mathys » 20 Avr 2012, 16:17

Bon, j'ai essayé de répondre aux question, comme ça, "de visu".

J'aimerais beaucoup qu'on m'explique mes erreurs et/ou ce que je n'ai pas compris.
Je vous préviens, je suis complètement novice et ne sais absolument pas comment lire les tableaux...

Voilà ce que je dirais:

1) Les différentes variables de l'étude :
- Note informatique
- Français
- Maths
- Langage
- Attention
- Collaboration
- Nb réponses correctes
- Temps médian

2) Le nb maximum de variables : 8. Expliquez : ??
Pr déterminer le nb de facteurs à conserver pour l'interprétation, on regarde le % de variance expliquée, et on ne conserve que les facteurs qui expliquent pour beaucoup la variabililité.

3) Cette valeur correspond au % de variance expliquée. 0,881 correspond à 88,1% ce qui signifie qu'à elle seule, cette composante explique 88,1% de la variance, ce qui est très important : cette composante constitue une composante principale.

4) La variable Langage n'est pas prise en compte dans l'ACP car elle ne corrèle que peu avec les autres variables.

Avatar de l’utilisateur
fatal_error
Membre Légendaire
Messages: 6610
Enregistré le: 22 Nov 2007, 12:00

par fatal_error » 20 Avr 2012, 21:13

salut
2. Quel est le nombre maximal de facteurs de l'ACP*?
8. tu vas pas mettre plus de facteurs que de variables. Le but c'est d'exprimer les données avec un nombre minimum de facteurs (dépendants de plusieurs variables)...
Pour t'arreter, tu regarde le cumul des valeurs propres en %. Tu t'arrêtes quand tu dépasses 90%. Ca veut dire que t'es globalement capable de représenter tes échantillons correctement en fonction de tes facteurs.

3. On observe une valeur propre de 0.881 correspondant à la troisième composante. À quoi correspond la valeur propre*?

Ca correspond normalement à l'importance que suit un facteur dans l'expression d'un échantillon. En l'occurrence, 0.881 signifie que ton facteur trois est pondéré d'un poids de 0.881 alors que le facteur 1 de 3.33 (4 fois plus important!)

4. La variable «*langage*» est-elle bien prise en compte dans l'ACP*? Indiquez clairement sur quoi votre réponse est fondée (0,5 points).

je dirais oui car elle dépend principalement des facteurs 3 et 6(0.3xx alors que les autres facteurs c'est <=0.147) cad que l'acp réalisée permet de lier la variable language à ces deux facteurs.
la vie est une fête :)

Mathys
Messages: 7
Enregistré le: 19 Avr 2012, 10:55

par Mathys » 03 Mai 2012, 19:54

Merci Fatal Error pour cette aide précieuse :id:

Du coup, je me permets quelques interrogations :

-
2. Quel est le nombre maximal de facteurs de l'ACP*?
8. tu vas pas mettre plus de facteurs que de variables. Le but c'est d'exprimer les données avec un nombre minimum de facteurs (dépendants de plusieurs variables)... Pour t'arreter, tu regarde le cumul des valeurs propres en %. Tu t'arrêtes quand tu dépasses 90%. Ca veut dire que t'es globalement capable de représenter tes échantillons correctement en fonction de tes facteurs.

Si je comprends bien ta réponse, la bonne réponse serait : 6 facteurs maximum ? Étant donné que nous arrivons à 94% de variance cumulée ?

- Concernant la valeur propre, j'ai un peu de mal à comprendre en quoi elle est exprimée. ce ne sont pas des % mais alors qu'est-ce ? Ça peut aller de 0 jusqu'à...... ?

- Qu'est-ce qui différe une variable d'un facteur ???

- Et, enfin, comment interprète-t-on le Tableau 2 : Contributions des variables. Par exemple, le facteur nommé "facteur 1" correspond concrètement à quoi ? Et, de plus, la valeur 0,012 àl'intersection entre Note information et Facteur 1 signifie quoi au juste ?


Je te remercie, tu m'as déjà bien éclairé, mais j'ai encore du chemin à faire, ce domaine étant tout à fait inconnu pour moi :hum:

Avatar de l’utilisateur
fatal_error
Membre Légendaire
Messages: 6610
Enregistré le: 22 Nov 2007, 12:00

par fatal_error » 03 Mai 2012, 20:39

Si je comprends bien ta réponse, la bonne réponse serait : 6 facteurs maximum ? Étant donné que nous arrivons à 94% de variance cumulée ?

ouais. Enfin moi mon prof m'avais dit 90% mais ca remonte à 3 ans maintenant et ya pas de papier derrière, donc cherche avec les mots clés ratio inertie covariance pour vérifier que c bien 90%
- Concernant la valeur propre, j'ai un peu de mal à comprendre en quoi elle est exprimée. ce ne sont pas des % mais alors qu'est-ce ? Ça peut aller de 0 jusqu'à...... ?

ca va de 0 a linfini. (0 chui pas sûr).
concretement, c'est un truc sans unité, considère que ca représente l'importance du facteur associé, et ca prend son sens quand tu compares une valeur propre/une autre valeur propre.

- Qu'est-ce qui différe une variable d'un facteur ???

une variable c'est genre une donnée que tu mesures. note de francais, QI, etc.
Un facteur c'est fonction de plusieurs variables. Par exemple
f=0.5*note de francais + 2*QI
- Et, enfin, comment interprète-t-on le Tableau 2 : Contributions des variables. Par exemple, le facteur nommé "facteur 1" correspond concrètement à quoi ?

ben concretement a une combinaison de variables (0.012*note de info, + 0.0169 francais+...)
Et, de plus, la valeur 0,012 à l'intersection entre Note information et Facteur 1 signifie quoi au juste ?

cf ci-dessus.
Tu remarques au passage que les colonnes et lignes sont normalisées (la somme fait 1). Chais pas cque ca apporte ou si c une propriété, mais en tout cas, ca renforce l'idée de ratio
la vie est une fête :)

Mathys
Messages: 7
Enregistré le: 19 Avr 2012, 10:55

par Mathys » 06 Mai 2012, 14:43

ouais. Enfin moi mon prof m'avais dit 90% mais ca remonte à 3 ans maintenant et ya pas de papier derrière, donc cherche avec les mots clés ratio inertie covariance pour vérifier que c bien 90%


J'avoue que je ne trouve pas en tapant ces mots clés :$ Je tombe sur des choses incompréhensibles (pour moi), mais pas sur un fameux %.



une variable c'est genre une donnée que tu mesures. note de francais, QI, etc.
Un facteur c'est fonction de plusieurs variables. Par exemple
f=0.5*note de francais + 2*QI


Okkk, ce qui signifie que Facteur 1 = 0.012*note informatique + 0.169*français + 0.243*maths etc. ???
* Va maintenant falloir que je comprenne l'application de la chose :hein: *
Comment interpréter, par exemple, la première colonne "Facteur 1" en lien avec les variables ? Comment interpréter les différents chiffres et quels liens ont-ils entre eux ?


J'ai d'autres exercices sous la main sur les A.C.P, pourrais-je essayer de les résoudre en te demandant ton avis ?

Merci beaucoup.

Avatar de l’utilisateur
fatal_error
Membre Légendaire
Messages: 6610
Enregistré le: 22 Nov 2007, 12:00

par fatal_error » 06 Mai 2012, 15:51

ya ce poly
p44

Comment interpréter, par exemple, la première colonne "Facteur 1" en lien avec les variables ? Comment interpréter les différents chiffres et quels liens ont-ils entre eux ?


ben pour facteur 1, la note informatique et le nb de réponses correctes sont pas importants.
Mais sinon, le poly a l'air d'expliquer pas mal les choses. Et c'est plus fiable que les bribes de souvenir qu'il m'en reste
la vie est une fête :)

Mathys
Messages: 7
Enregistré le: 19 Avr 2012, 10:55

par Mathys » 06 Mai 2012, 19:09

Merci ! Y a beaucoup de choses que je ne saisis pas, mais j'avance c'est déjà ça.
Concernant le nombre de facteurs à conserver, j'ai vu 80%, 65%, c'est assez vague. Du coup, je me dis que 80% c'est pas mal. Et apparemment y a aussi la technique qui consiste à regarder graphiquement où se fait le "coude".
Bref, ça OK.

J'ai essayé un exercice, et je bloque sur les 2 dernières questions :

Énoncé :

Nous avons réalisé une ACP sur les 6 items de l'épuisement émotionnel :
1. Je me sens émotionnellement extenué par mon travail
2. Je me sens épuisé à la fin de ma journée de travail
3. J'appréhende de me lever le matin pour affronter une nouvelle journée de travail
4. Je suis vidé par mon travail
5. Je me sens frustré par mon travail
6. J'ai la sensation de travailler trop dur


Et voici les 2 questions qui me posent problème :

Image
[/URL]

+ c. Quel(s) item(s) contribue(nt) le plus à l'interprétation du facteur et pourquoi ?


Pour la c. j'aurais tendance à répondre l'item 1 et l'item 4 car ce sont ceux qui ont la plus forte... valeur propre (?). Et ce sont les deux qui sont le plus liés entre eux.

 

Retourner vers ✯✎ Supérieur

Qui est en ligne

Utilisateurs parcourant ce forum : Aucun utilisateur enregistré et 36 invités

Tu pars déja ?



Fais toi aider gratuitement sur Maths-forum !

Créé un compte en 1 minute et pose ta question dans le forum ;-)
Inscription gratuite

Identification

Pas encore inscrit ?

Ou identifiez-vous :

Inscription gratuite