par Robic » 15 Juil 2014, 16:54
L'intérêt de cet article, c'est qu'il montre que la distribution statistique du nombre de but marqué par équipe peut s'approximer par une loi de Poisson. Je trouve ça intéressant. Ça pourrait expliquer pourquoi, dans un autre forum, j'ai failli gagner un concours de pronostics en ne pronostiquant que des 0-0 : avec cette modélisation (et un nombre moyen de buts par match inférieur à 3 comme c'est toujours le cas de nos jours), c'est peut-être le score le plus probable.
On pourrait même en faire un petit exercice... « À la dernière coupe du Monde, 171 buts ont été marqués en 64 rencontres. En modélisant le nombre de buts marqués par équipe par une loi de Poisson dont le paramètre sera judicieusement choisi et en supposant que ce nombre de buts est indépendant d'une équipe à l'autre, quel score a-t-on intérêt à pronostiquer ? »
- Il faut calculer la moyenne : 2,672 buts/match, donc 1,336 buts/équipe. Comme l'espérance d'une variable de loi de Poisson de paramètre lambda, c'est lambda, on choisira donc lambda = 1,336.
- On calcule les probabilités pour une équipe de marquer k buts :
p(0) = 0,2629 / p(1) = 0,3512 / p(2) = 0,2346 / p(3) = 0,1045 / p(4) = 0,0349 / p(5) = 0,0093 / etc.
- On en déduit la probabilité de chaque score :
P(0-0) = P(X=0 et Y=0) = p(0)p(0) = 0,069
P(1-0) = p(1)p(0) = 0,092
P(1-1) = p(1)p(1) = 0,123 <-- le score le plus fréquent (donc ma stratégie avait été mauvaise !) (*)
p(2-0) = p(2)p(0) = 0,062
p(2-1) = p(2)p(1) = 0,082
p(2-2) = p(2)p(2) = 0,055
p(3-0) = p(3)p(0) = 0,027
et ainsi de suite...
Remarque : si on veut juste pronostiquer le score, sans préciser qui gagne, la probabilité qu'il y ait 1-0 est de 2x0,092 - c'est P((X=1 et Y=0) ou (X=0 et Y=1)). Mais quand on fait des pronostics, on doit préciser dans quel sens se lit le score : 1-0 ou 0-1, ce n'est pas pareil, d'où le calcul ci-dessus.
(*) En fait non puisqu'il n'y a eu que quatre 1-1, contre sept 0-0. Je soupçonne que le petit nombre de matchs (64) explique la mauvaise approximation (j'ai eu de la chance). Sur un championnat de France complet, avec 380 matchs, j'imagine que ce serait plus fiable. Et puis l'hypothèse d'indépendance est peut-être criticable (cela dit, je ne vois pas en quoi le fait d'être mené 0-1, par exemple, entraînera qu'on marquera plus ou moins de buts que si on était à 0-0 - il faudrait établir le tableau des scores et faire un test d'indépendance, encore une idée d'exercice...)