Jednak doszło do meczu rewanżowego pomiędzy programami szachowymi Alpha Zero i Stockfish!

Wynik znowu zdecydowanie korzystniejszy dla Alpha Zero: +155=839-6 (w sumie 575,5:425,5)!

Poniższe informacje starają się przybliżyć drugi pojedynek i są uzupełnieniem wcześniejszego wpisu „Czy szachy zostały rozwiązane?” z 09.12.2017. Bazują one na publikacjach przedstawionych na witrynach takich jak Wikipedia, Chess Programming Wiki, chess.com, i wielu innych.

Jak wspomniano w poprzednim wpisie z grudnia 2017, program AlphaZero, korzystający z pojedynczej maszyny z 4 TPU pierwszej generacji, wygrał mecz składający się ze 100 partii z silnikiem szachowym Stockfish 8, korzystającym z 64 wątków i tabeli transpozycji 1GB, w stosunku +28=72-0, z czego opublikowano 10 partii. Pomimo możliwej znacznej przewagi sprzętowej AlphaZero i krytykowanych warunków gry, jest to ogromne osiągnięcie.

W ostatecznej wersji artykułu, poddanej niezależnej recenzji naukowej (peer review), opublikowanym w czasopiśmie naukowym Science w grudniu 2018 roku wraz z materiałami uzupełniającymi, poinformowano o meczu składającym się z 1000 partii, z których opublikowano około 200. W sumie AlphaZero wygrywa 155 partii i przegrywa 6 przeciwko najnowszej wersji Stockfisha (dostępnej w czasie meczu, czyli Stockfish 8, wersja rozwojowa z 13 stycznia 2018, zbliżona do Stockfish 9, Brainfish z książką Cerebellum).

Stockfish został skonfigurowany zgodnie ze swoimi ustawieniami w superfinale sezonu TCEC 9 z 2016 roku: 44 wątki na 44 rdzeniach (dwa procesory Intel Xeon Broadwell x86-64 2,2 GHz z 22 rdzeniami, pracującymi pod systemem Linux), tabela transpozycji 32 GB i 6-bierkowa baza końcówek Syzygy. Tempo gry wynosiło 3 godziny na partię plus 15 sekund na posunięcie. AlphaZero zastosowało prostą strategię kontroli czasu: myślenie przez 1/20 pozostałego czasu. Każdy MCTS (Monte-Carlo Tree Search) został wykonany na jednej maszynie z 4 TPU pierwszej generacji.

AlphaZero i Stockfish (z wyjątkiem Brainfish) nie użyły książek debiutowych, rozegrano 12 typowych ludzkich pozycji, a także pozycje z superfinału sezonu 9 TCEC 2016, pierwotnie wybrane przez Jeroena Noomena. Aby zapewnić różnorodność przeciwko przeciwnikom (Brainfish), AlphaZero zastosowało pewien stopień losowości w swoich ruchach debiutowych. Pozwoliło to uniknąć dublowania partii, ale również spowodowało to więcej przegranych AlphaZero.

Warunki były zdecydowanie bardziej wyrównane, chociaż nadal pozostaje kwestia ogromnej różnicy w zainwestowanych funduszach w sprzęt dla obu programów.

P	W	Ś	C	P	S	N
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31