Bonjour,
Etudiant le paradoxe de Simpson, j'ai trouvé divers manières mathématiques pour le représenter (vecteurs, graphes, arithmétique, ...). Cependant, sur la formulation en terme de probabilités conditionnelles, je n'arrive pas à saisir comment on peut définir une variable de conditionnement.
De plus, je ne comprends pas exactement d'où viennent les deux dernières lignes de ce que je vous ai écrit ci dessous.
Merci d'avance aux personnes qui prendront le temps de lire et pourront m'expliquer plus clairement les propos ci dessous qui sont posés comme tel sur plusieurs sites, je n'ai jamais trouvé d'explication à ceux ci.
Le paradoxe apparaît, lorsque pour un certain x, on a :
P(Y = 1 | X = x, Z = z) > P(Y = 1 | X ≠ x, Z ≠ z)
pour tous les z, mais :
P(Y = 1 | X = x) < P(Y = 1 | X ≠ x)
Ceci peut être expliqué par le fait que :
P(Y = 1 | X = x) = ∑ P(Y = 1 | X = x, Z = z)P(Z = z| X = x)
P(Y = 1 | X ≠ x) = ∑ P(Y = 1 | X ≠ x, Z = z)P(Z = z | X ≠ x)
Bonne journée