Bonjour à tous et à toute,
Je dispose d'une base de données qui répertorie différentes informations des communes avant un déménagement, et des communes après un déménagement. En gros, j'ai des informations sur les communes de départ, et les communes d'arrivée.
L'une de mes études consiste à voir s'il existe une relation entre le nombre d'équipements dans la commune de départ, et le nombre d'équipements dans la commune d'arrivée. Par exemple, pour voir si, de manière significative, les personnes qui habitaient dans une commune pauvre en équipement sont partis vivre dans une commune avec un plus grand nombre d'équipement.
Après avoir réalisé un test du khi2 qui s'est révélé être significatif, crée des catégories du nombre d'équipement 5 par 5, je regarde à présent les pairs significatives via un diagramme de mosaique, dont voici l'export :
https://zupimages.net/viewer.php?id=20/24/oznd.png
J'ai bien compris que les cases rouges représentent une répulsion (ou une sous représentation), et les cases bleues représentent une attraction (ou une surreprésentation), la largeur des cases est proportionnelle au pourcentage ligne, et la hauteur est proportionnelle à l'effectif observé. Par exemple, j'observe qu'il y a une répulsion des personnes qui habitaient dans une commune avec entre 0 et 5 équipements à aller dans des communes qui contiennent entre 10 et 15 équipements, puis dans des communes qui contiennent entre 15 et 20 équipements.
En revanche, ce que je n'arrive pas à expliquer, ce que le pourcentage ligne des personnes qui habitaient dans une commune avec entre 0 et 5 équipements est important dans les catégories ]10,15] et ]15,20] des communes d'arrivée, alors qu'elles sont affichées en sous-représentation. Lorsque je calcul les pourcentage ligne, je vois que 30% des personnes qui habitaient dans une commune avec entre 0 et 5 équipements sont allés vivre dans une commune qui offre entre 10 et 15 équipements, et 38% de ces personnes sont allés vivre dans une commune qui offre entre 15 et 20 équipements. Sur le papier, je trouve qu'il y a clairement une volonté de ces personnes à aller vivre sur cette catégorie d'offre, et pourtant la mosaïque m"indique qu'ils sont sous-représentées.
Pour être plus claire, comment expliquer qu'une telle proportion d'une variable soit sous-représentée ?
Merci.