Его зовут AlphaZero, он за четыре часа победил лучшую в мире программу по игре в шахматы. Причем до начала турнира знал лишь как ходят фигуры. И больше ничего.
Искусственный интеллект победил лучшего шахматиста, ничего не зная об игре

Теперь AlphaZero — лучший игрок в шахматы на планете Земля. В турнире против Stockfish 8, лучшей программы для игры в шахматы, система, созданная компанией Deepmind, не проиграла не единой игры из 100 проведенных партий.

AlphaZero — это модифицированная версия AlphaGo Zero, искусственного интеллекта, недавно выигравшего 100 раз подряд в го у знаменитого AlphaGo, того самого, что победил в го лучших человеческих игроков.

Система работает практически идентично с AlphaGo Zero, но вместо го машина запрограммирована играть в шахматы и сёги, еще одну японскую стратегическую игру. Свое мастерство AlphaZero приобрел без посторонней помощи, в отличие от всех предыдущих шахматных программ у него не было никаких эмпирических данных, никакой базы с архивами уже сыгранных шахматных партий, никакого знания о шахматных стратегиях и фигурах. Он просто знал, как ходят фигуры, и цель игры. Так указано в недавно опубликованной статье, посвященной этому турниру.

Можно подумать, что AlphaZero научился играть в шахматы за четыре часа, но это не совсем точно. Скорее AlphaZero научился, как стать абсолютным чемпионом по шахматам за четыре часа. Когда турнир начался, ИИ знал, как ходят фигуры. Начав с чистого листа и вооружившись обучающим алгоритмом подкрепления, нейросетью и фигурами на доске перед ним, AlphaZero начал играть сам с собой, снова и снова, оттачивая свои навыки с каждой партией, и если говорить человеческими понятиями времени, провел за игрой в шахматы около 1400 лет за эти четыре часа. Система может обработать 800 000 позиций за секунду, тогда как Stockfish 8 может провести 70 миллионов ходов за секунду.

Затем он таким же образом за восемь часов сумел превзойти AlphaGo в го, и за два часа — программу Elmo, которая раньше считалась неоспоримым чемпионом по игре в сёги