22:58

В марте 2016 Альфа Го сыграла пять партий с Ли Седолем и обыграла его почти во всех пяти.
Вот разбор матча, который показался мне интересным и заставил меня немного пересмотреть свою позицию о ИИ, языке и интеллекте.

t.co/rKFaXY4xYb

Немного бэкграунда для тех, кто не знакомы с Го.
Го это игра с очень простыми правилами (самым близким эквивалентом наверное будут шашки), в которой игроки сражаются на доске за территорию. Двумя основными и фундаментальными конфликтами в этой игре являются балансы стратегия/тактика и влияние/территория.

1. Камни (фишечки), один раз поставленные на доску в Го, уже не могут двигаться и почти никогда не могут быть сняты. Из-за этого игра становится очень позиционной, и начальные ходы во многом определяют течение всей партии.

Игрок каждый раз поставлен перед выбором - сделать более рискованный и агрессивный ход ближе к центру доски и претендовать на большую игрового поля, или ставить камни ближе к краям доски и уже сформированным группам, которые проще защищать.

Можно сказать что каждый ход в этой игре обладает определенным потенциалом (влияние), и все ходы в партии направлены или на увеличение или на уменьшение этого потенциального поля.

2. Го играется на большой доске и почти с самого начала игровое поле делится на 9 участков (4 края, 4 стенки и центр), в каждом из которых могут возникнуть небольшие точки противостояния. Игроки могут начать борьбу за эту локальную территорию, но в пылу боя очень легко потерять общую картину игры и упустить влияние почти на всей оставшейся доске. “Выиграть битву, но проиграть войну” - это проза жизни Го.

В силу постоянно меняющихся приоритетов, обманчивой простоты правил и почти бесконечного количества возможных вариаций игровых партий Го обладает невероятной пластичностью и выразительностью.

За партиями очень интересно наблюдать и в них почти всегда можно почувствовать характер игроков - их агрессию или мягкость, опытность, склонность к риску, стратегическое мышление. Го это язык, на котором игроки ведут длинную и сложную беседу.

3. Это самая странная и поразительная для меня часть - но поскольку Альфа Го играет по тем же правилам что и люди, и эти правила обладают некой языковой семантикой (пусть и невероятно ограниченной), мы можем не только понять не только насколько хорошо или плохо она играет, но и какой характер у этой игры, какой у нее язык.
До этого момента мы могли только предполагать, что происходит внутри искусственного интеллекта, теперь с Альфа Го мы можем немного заглянуть туда и это довольно удивительное зрелище.

4. Что мы узнали о Deep Mind и Alpha Go за эти два года?

Во первых, Альфа Го очень хорошо понимает семантику человеческой игры и играет примерно в том же стиле, что и мы, делая простые, логичные и понятные ходы.

Во вторых, (это очень рискованный шаг причислять человеческие черты тому, что по сути является просто достаточно сложным перемножением двух больших числовых матриц),
Альфа Го использует семантику игры для того чтобы понять характер человека и его поведение.

Если партия в го это диалог, то в игре с Альфа Го почти каждый ее ход - это вопрос.
Как прокомментировал один из игроков, “Alpha Go is keep asking us questions and we are keep giving wrong answers”.

В третьих, интеллект Альфа Го настолько чужероден и фундаментально отличается от нашего, что в игре Альфа Го и Альфа Го никто не может понять принцип их игры.
Игра Альфа Го с собой настолько сильно отличается от игры с людьми, что это поставило почти всех в тупик.

Одна из теорий, которая мне нравится - это то что Альфа Го не воспринимает людей как серьезных противников и все ее ходы - это попытки обучить нас игре.
Мой личный хэдканон - это то что два стиля игры это два разных языка и по характеру партии Альфа Го понимает кто ее оппонент.

В любом случае, Альфа Го ведет себя очень по разному с живыми людьми и с другими ИИ.

5. Можно долго обсуждать что же это значит, но я склоняюсь к тому что

Да, любая сложная система правил обладает семантикой
Да, любая семантика это язык, и не потому что мы биологически запрограммированы искать язык в любом наборе относительно упорядоченного шума, но потому что это фундаментальное свойство семантики и нашей вселенной.
Да, это по всей видимости то направление в диалоге человека и машины, к которому мы движемся.

В любом случае, все это невероятно интересно и what a great time to be alive.

Комментарии
15.06.2017 в 19:11

Прочитав про АльфаГо я впервые начал подозревать, что мы таки имеем шанс увидеть ИИ при жизни. Я всё время видел препятствие в огромном превосходстве нейронов над... хм... транзисторами. И не видел, что "нейроны" могут быть программными, и что все эти "свёрточные нейронные сети" _уже_ имитируют работу реальных нейронных сетей мозга.