Разработчики DeepMind создали нейросеть, которая смогла сама обучиться игре в шахматы за несколько часов и победила лучшие аналогичные алгоритмы.
Как отмечают журналисты Science Alert, программе потребовалось всего четыре часа, чтобы освоить все шахматные знания человечества.
После того, как алгоритм AlphaZero ознакомили только с правилами шахмат, без стратегии, всего за четыре часа он освоил игру в такой степени, что смог обыграть самую рейтинговую шахматную программу - Stockfish. В серии 100 игр против Stockfish, AlphaZero выиграл 25 игр, играя белыми, и три игры, играя черными. Остальные партии завершились вничью, побед у Stockfish не было.
"Теперь мы знаем, кто наш новый повелитель. Это, несомненно, будет революционизировать игру, но необходимо думать о том, как это может быть применено вне шахмат", - признался исследователь шахмат Дэвид Kремели, глава сайта Chessable.
Алгоритм AlphaZero был создан на базе наработок по программам AlphaGo и AlphaGo Zero, которые ранее стали абсолютными чемпионами в игре го. Подобно человеку, AlphaZero рассматривает меньше позиций, чем ее предшественницы. В отчете заявлено, что она оценивает 80 тысяч позиций в секунду в сравнении с 70 миллионами в секунду у Stockfish.
В отличие от предыдущих программ от DeepMind, AlphaZero создавался как алгоритм, способный научиться сразу нескольким задачам-играм, а не одной. Для этого алгоритм не обучали побеждать, а давали только базовые знания о правилах игры. AlphaZero затем играл сам с собой и самостоятельно вырабатывал тактику.
"Я всегда задавался вопросом, как это было бы, если бы более развитые виды высадились на Земле и показали нам, как они играют в шахматы. Теперь я это увидел", - сказал гроссмейстер Питер Хайне Нильсен, комментируя результаты AlphaZero.
Источник