Category: технологии

Category was added automatically. Read all entries about "технологии".

cartoon

AlphaZero, шахматы и искусственный интеллект

Сразу несколько человек спросило меня, что я думаю о нашумевшей победе AlphaChess над Stockfish, означает ли это конец шахмат и т.д. Чтобы не отвечать каждому по отдельности, а также для того, чтобы структурировать свои соображения, я решил написать отдельный пост.

Если кратко, я считаю, что создание AlphaZero - это большой прорыв для исследований в области искусственного интеллекта (с некоторыми оговорками, которые я изложу ниже), но с точки зрения шахмат ничего особенного не произошло, по крайней мере, пока.

Теперь по пунктам.

1. Одна шахматная программа победила другую шахматную программу, но это происходит постоянно. Отрыв AlphaZero от Стокфиша, на самом деле, не так велик и вряд ли значительно увеличится от дальнейшего обучения нейронной сети. Посмотрите на график в статье - на промежутке от 300,000 до 700,000 шагов разрыв в рейтинге Эло практически не изменился. Любопытно, что в сёги отрыв более значителен. Вероятно, в развитие шахматных программ исторически вкладывались больше.
2. Я готов поверить, что AlphaZero действительно лучше понимает шахматы, чем собственно шахматисты или программы предыдущего поколения. Однако, с точки зрения людей она остается "черным ящиком" или "оракулом". В каждой конкретной позиции AlphaZero может подсказать правильный ход, но не сможет объяснить нам, почему он правильный.
3. Сейчас очень популярна реакция "смотрите, рушатся основы мироздания!". С моей точки зрения, картина ровно обратная - новые данные только подтверждают уже известные нам истины. Ферзевый гамбит и даже защита Грюнфельда оказались действительно неплохими дебютами. Берлин остался неприступной крепостью. Так что многие поколения шахматистов трудились не зря. Вот если бы оказалось, что лучший ход за белых - это 1.e3 или какой-то другой из не самых популярных дебютов - тогда действительно было бы чему удивляться.

Кроме того, есть несколько факторов, которые заставляют меня отнестись к этим результатам с некоторой долей скептицизма:

1. Широкому кругу шахматистов - да что там говорить, почти никому в мире! - AlphaZero недоступна. Мы не можем независимо подтвердить результаты команды DeepMind или провести эксперименты с другими начальными условиями. Например, я не уверен, что партии с контролем "минута на ход" дают объективное отражение реальной силы Стокфиша.
2. Нам показали только 10 партий из всего матча, которые представляют AlphaZero в лучшем свете. Интересно, конечно, но 10 качественных партий я могу набрать даже из собственных партий (по переписке, конечно :) В то же время, в статье приведены результаты "тренировочных" партий и они дают менее радужную картину для AlphaZero. Там были и поражения, а главное, дебютные сводки дают основания предположить, что AlphaZero все-таки еще далеко до "шахматного бога". Посмотрите на его результаты в сицилианской защите, особенно в моем любимом Паульсене.
3. Есть вероятность, что это останется своего рода publicity stunt. Совсем недавно я закончил читать любопытнейшую книгу Гарри Каспарова "Deep Thinking", в которой основное внимание уделено исторической победе искусственного интеллекта над человеком. Так вот, одним из главных сожалений Каспарова является не само поражение, не упущенные возможности и даже не безумный блеф 7...h6?? в решающей партии (кстати, даже после прочтения книги трудно понять, что все-таки подвигло Гарри Кимовича так сыграть, но это отдельная история). Главной претензией было то, что после этой победы Deep Blue так больше и не сыграл ни одной партии в шахматы. Со временем появились другие шахматные программы, которые повторили и даже превзошли ее силу игры, но для IBM (как сегодня для Google) негативные PR-последствия от возможных поражений DeepBlue после победы над Каспаровым перевесили все другие соображения.

Я надеюсь, что с AlphaZero этого не произойдет и что он станет доступен как шахматистам, так и исследователям в области искусственного интеллекта. На самом деле, именно потенциальное влияние AlphaZero на развитие ИИ кажется мне наиболее интересной частью всей этой истории. Если результаты AlphaZero удатся повторить, воспроизвести и распространить на другие предметы (а судя по статье, авторы замахиваются именно на это - недаром они экспериментировали сразу с шахматами, сёги и го), тогда человечество научится находить близкие к идеальным решения для любых хорошо формализованных задач. Очень многое в жизни можно свести к теории игр (на эту тему см. прекрасную книгу "The Art of Strategy"), так что перспективы открываются захватывающие.

В заключение, хотел бы высказать одно наблюдение собственно о шахматных партиях этого матча. О них высказались уже многие шахматисты, от любителей до гроссмейстеров. Чаще всего обсуждается бодрый атакующий стиль победителя. В большинстве опубликованных партий AlphaZero что-то жертвует (например, в трех партиях встретилась одна и та же жертва d4-d5 в новоиндийской защите), причем чаще всего это классические жертвы материала за инициативу. Наибольшее впечатление производит партия, в которой AlphaZero жертвует пешку, потом коня, а дальше играет, как ни в чем не бывало... и побеждает!

Однако, мне показалось более любопытным, что сразу в нескольких партиях победу AlphaZero принесла последовательная игра на изоляцию или ограничение мобильности какой-то одной вражеской фигуры или даже целого фланга. Все, конечно, запомнили ферзя на h8 в партии №3, но посмотрите на несчастного слона b7 в партиях №7, №8 и №9, на коня b8 + ладью a8 в партиях №5 и №10...

На самом деле, большинство побед AlphaZero можно объяснить его лучшим пониманием только одного этого мотива!
chess

О Джоне Нанне и здоровом скептицизме

Я только что закончил читать книгу Джона Нанна "Секреты практических шахмат", которая недавно бурно обсуждалась на форуме KasparovChess. В принципе, я согласен с предыдущими ораторами - новых мыслей в этой книге не так уж много, но они есть. Например, про использование компьютера неплохо написано. Я уже пару лет играю по переписке, но некоторые из описанных в книге методов (типа комьпютерных турниров или глубого анализа позиции) до сих пор не использовал. Кроме того, повторение - мать заиканияучения, поэтому даже с известными истинами иногда полезно знакомиться заново.

Мне кажется, что основные противоречия в оценке этой книги возникают оттого, что люди по-разному подходят к ее прочтению. Книга неплохо издана, в ней много текста и достаточно диаграмм, поэтому я подозреваю, что большинство читателей только просматривает ее по диагонали. Скажем, когда эту книгу упомянули в редакционной статье в журнале "64", то имелось в виду именно такое поверхностное чтение из серии "лежу на пляжу". Но даже такую книгу общеобразовательного плана нужно все-таки читать внимательно. И тогда в ней можно обнаружить неожиданные и, я бы даже сказал, незапланированные иллюстрации авторских тезисов :) Collapse )