Je reviendrai sur les ouvertures, les finales et la cadence de coup,
car là ce n'est pas de l' IA c'est un choix humain de "triche"
Mais je n'ai pas compris ceci, il semblerait que le progrmmae se soit entrainé contre lui-même pour établir ses propres règles, et chapeau cela marche super bien.
MAIS il se serait entrainé AUSSI contre stockfish ??????
"n a learning phase (training) Alpha Zero used 5000 "first-generation" TPUs from the Google hardware park to play games against itself. 64 "second-generation" TPUs were used for the training of the neuronal network. And after only four hours of training Alpha Zero played better than Stockfish.
During the training phase Alpha Zero also played matches against Stockfish, always a hundred games, 50 with White and 50 with Black, and starting with ten popular openings. Alpha Zero won the majority of these matches but not all of them: in the Queens Gambit the program lost 1-2 with Black (47 games were drawn). In the Grünfeld (which DeepMind erroneously calls "Kings Indian") Alpha Zero lost 0-2 with Black while 48 games ended in a draw. In the Kan-Variation of the Sicilian it lost 3-7 with 40 draws. With colours reversed Alpha Zero always won clearly."
euh, alors là ensuite il y aurait un programme Stockfish qui serait sans connaissance de son adversaire, et un autre alphazero qui connaitrait déjà son adversaire?????
Et donc le type d'ouverture qui convient mieux à l'un ????
Euh, quelqu'un lit bien l'anglais pour me dire si j'ai bien compris?
Je n'arrive pas à voir si ce sont des parties d'netrainement avant le match ou si l'on parle des parties du match elles-mêmes.
PS: c'est extrait d'ici
https://en.chessbase.com/post/alpha-zer ... and-apples
L'important est de savoir quoi faire lorsqu'il n' y a rien à faire.