j'ai fait une classification avec la méthode kmeans sur un échantillon de 46 clients dont 21 sont solvables et 25 non solvables
alors le résultat donné par R est comme suit :
- Code: Tout sélectionner
K-means clustering with 2 clusters of sizes 7, 39
Cluster means:
VAR1 VAR2 VAR3 VAR4
1 0.32714286 0.06142857 3.891429 0.4514286
2 0.02923077 -0.03102564 1.697179 0.4192308
Clustering vector:
[1] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 1 1 2 2
[30] 2 2 2 2 2 2 2 2 2 2 1 2 1 2 1 2 1
Within cluster sum of squares by cluster:
[1] 4.8756 19.9965
(between_SS / total_SS = 54.0 %)
alors j'ai construit la matrice de confusion pour comparer la classification réelle avec la classification K-means et j'ai trouvé ce qui suit:
- Code: Tout sélectionner
1 2
S 0 21
NS 7 18
alors je l'est interprété comme suit :
on a
Le taux de bonne classification totale est de : (21+18)/(21+18+7)*100=84,78% la classification est globalement bonne .
Le taux de classification de « S » est : 21/21*100= 100% , les 21 clients sont bons classés en groupe 2 :le groupe 2 est des clients solvables.
Le taux de classification de « NS » est : 18/25 *100=72 % ,18 clients sont biens classées dans le groupe 2 ce qui signifie que le groupe 2 est un groupe de clients non solvables ce qui est impossible car le groupe 2 caractérisera des clients solvables et non solvables à la fois .
en fait je ne sais pas si j'ai bien interprété les résultat mais ce qui est clair est que la classification par kmeans contient une contradiction donc le taux de classification globale doit être mauvais pour affirmer le résultat mais ce n'est pas le cas
Merci de bien vouloir m'aider à bien interpréter les résultats s'il vous plait