Машины окончательно победили людей в го

Mac · 14 марта, 2016

Программа AlphaGo выиграла третью из пяти игр против Ли Седоля — одного из сильнейших в мире игроков в го. Таким образом, компьютер уже выиграл вне зависимости от исхода оставшихся двух партий. Ли Седоль играл черными камнями, AlphaGo — белыми. За игрой можно было следить в прямой трансляции.

На протяжении игры профессиональный игрок сначала уступил белым значительную территорию, однако позже попытался надавить на правую и нижнюю часть территории AlphaGo. Как и в предыдущей игре, Ли Седоль целиком потратил основное время и перешел на дополнительное (бёёми) — три фиксированных 60-секундных интервала, которые не считаются израсходованными, если игрок уложился в 60 секунд. Когда у профессионального игрока 9 дана остался последний 60-секундный интервал, у программы в запасе еще оставалось 37 минут основного времени. После длительной ко-борьбы и больше чем через четыре часа игры Ли Седоль признал поражение, положив на гобан камень противника.

Ли Седолю предстоит сыграть против алгоритма Google еще две игры. Если бы Ли Седоль победил в большинстве партий, то получил бы от Google один миллион долларов. Поскольку большинство партий выиграла AlphaGo, сумма выигрыша будет пожертвована на благотворительность.

Го — одна из древнейших настольных игр. До недавнего времени было принято считать, что компьютер не способен играть на равных с профессиональным игроком из-за высокого уровня абстракции и невозможности перебора всех доступных вариантов развития событий — точно число допустимых комбинаций в игре на стандартном гобане больше, чем число атомов в наблюдаемой Вселенной. С поражением Ли Седоля не осталось игр с открытой информацией, в которых компьютер не мог бы обыграть человека.

Источник

Ли Седоль впервые выиграл у AlphaGo

Ли Седоль, один из сильнейших в мире игроков в го, впервые выиграл у программы AlphaGo — предыдущие три игры профессионал 9 дана проиграл. AlphaGo играла черными камнями, Ли Седоль — белыми. За игрой можно было следить в прямой трансляции.

В четвертой игре Ли Седоль так же, как и в предыдущих играх, целиком израсходовал основное время раньше, чем AlphaGo — после трех часов игры профессионал 9 дана перешел на бёёми, в то время как у алгоритма Google оставалось еще около часа. Несмотря на это, в четвертой игре Ли Седолю удалось в какой-то степени приспособиться к особенностям игры AlphaGo и он не дал алгоритму сформировать значительной территории на гобане. В какой-то момент комментаторы отметили что, возможно, алгоритм просто не предусматривает в принципе возможность самостоятельно признать поражение. После более чем четырех с половиной часов игры AlphaGo признала поражение: традиционно оно отмечается камнями цвета противника, выложенными на гобан.

Завершающая игра Ли Седоля против AlphaGo состоится 15 марта. Несмотря на то, что в четвертой игре победил Ли Седоль, большинство партий все равно выиграла AlphaGo, поэтому сумма выигрыша в размере одного миллиона долларов будет пожертвована на благотворительность. Ранее, в 2015 году, AlphaGo успешно обыгралачемпиона Европы, выиграв пять игр из пяти.

Го — одна из древнейших настольных игр. До недавнего времени было принято считать, что компьютер не способен играть на равных с профессиональным игроком из-за высокого уровня абстракции и невозможности перебора всех доступных вариантов развития событий — точно число допустимых комбинаций в игре на стандартном гобане больше, чем число атомов в наблюдаемой Вселенной.

Источник

botaNICK · 14 марта, 2016

Недавно читал в Компьютерре как раз статью после того, как алгоритм первый раз обыграл менее именитого игрока в го. Комментаторы сдержанно указывали на то, что, мол, ещё не вечер, так игрок всё-таки не бог весть, а вот если победит Того Самого Легендарного с девятым даном...

И вот оно. Свершилось

И вот как раз свежая статья в Терре (копипаст под спойлером ниже):
http://www.computerra.ru/141553/alphago/

Скрытый текст

Го пала

автор: Евгений Золотов 14 марта 2016

С замирающим сердцем слежу я за поединком в го между корейцем Ли Седолем и компьютерной программой под названием AlphaGo. Матч ещё не завершён, сыграны лишь три партии из пяти, но хладнокровие, жестокость, какая-то особенная механическая дерзость, с которой машина разделалась с человеком в каждой из трёх проведённых, наводят (и не только меня!) на мысли грустные и даже страшные…

Если вы ещё не знакомы с го — что странно при том внимании, которое уделяется ей айтишным сообществом в последние годы — то вот короткий экскурс. Это одна из древнейших игр, в которые играет человек. Ей четыре тысячи лет, плюс-минус, придумана она в Древнем Китае и по сути своей очень проста. Есть разграфлённое на клетки поле, чёрные и белые камни, плюс правила, которые можно буквально сосчитать на пальцах одной руки. С точки зрения человека это такая же игра, как шахматы, шашки, и вообще любая другая сопоставимой комбинаторной сложности. Это не значит, конечно, что сильный шахматист будет так же силён и в го. Но это значит, что мыслят игроки примерно одинаково: возможных сценариев слишком много, приходится опираться на интуицию.

Ли Седоль в центре. Слева — Демис Хассабис: сильный шахматист, соавтор ИИ-ядер в нескольких легендарных играх (Black & White, Theme Park), доктор наук и один из основателей британской компании DeepMind, которая и написала AlphaGo (и поглощена Google).

А вот с точки зрения электронно-вычислительной машины, го — особый случай. В подавляющем большинстве прочих игр количество возможных ходов хоть и велико, но в принципе поддаётся механическому перебору. Грубо говоря, можно заставить машину просчитать, как скажется ход А на исходе игры Б: вычислить дерево вероятных следующих позиций, влияние их на величину функции f, которая тем больше, чем более вероятна победа.

В шахматах число комбинаций огромно (10^118, что превосходит количество атомов во Вселенной; см. число Шеннона), однако, наложением элементарных фильтров — вроде исключения запрещённых ходов, исключения невозможных положений фигур на доске и пр. — его можно сильно уменьшить. Что по сути и делают разработчики шахматных программ до сих пор: именно так Deep Blue одолел Гарри Каспарова в 1997-м.

Го — другая история. Число возможных сценариев здесь превосходит все прочие игры и оценивается для доски 19×19 полей в 10^761. Да, применением правил его тоже возможно радикально сократить, но к такому огромному вероятностному пространству применить правила ещё нужно суметь! И потом, в го, в отличие от других, трудно оценить влияние конкретного хода на исход игры. Так что в общем и целом вплоть до последнего времени го считалась недосягаемой для «решения в лоб», т.е. методом перебора вариантов. Считается она таковой и сейчас. Команда Google пошла иным путём.

Есть несколько хороших публикаций, в которых создатели AlphaGo объясняют схему своего автомата: вот подробная, но сложная, статья в Nature, вот популярное, но поверхностноеобъяснение в блоге Google. Если коротко, была построена многослойная (дюжина слоёв) искусственная нейросеть из двух блоков, работающая на облачном суперкомпьютере (в настоящий момент задействованы больше тысячи CPU и на порядок меньше GPU). Блок первый предлагает ход, блок второй оценивает вероятное его влияние на результат партии.

Тренировали AlphaGo сперва на игре с живым соперником и записях состоявшихся игр, а после заставили машину играть против самой себя — чтобы она не просто имитировала человека, а и сама изобретала стратегии. Потом AlphaGo показал свою мощь, одолев всех существующих электронных соперников. Потом, прошлой осенью, победил в закрытом чемпионате многократного европейского чемпиона. А теперь разделал под орех одного из сильнейших годзистов мира…

«Придумать стратегию» в данном случае не преувеличение и не фигура речи. Дело в том, что как и всякую машину, преодолевшую некоторый воображаемый порог сложности, мы более не в силах понять, как именно AlphaGo работает — не в силах описать это, пользуясь языком математики. Сами создатели AlphaGo в интервью называют то, что делает их машина, интуицией. Да, конечно, они знают, что это лишь результат работы двух конкурентных многослойных нейросетей. Но описать как именно генерируется тот или иной ход, а тем более предсказать, как сходит машина в произвольной ситуации, даже её создатели уже не могут!

Остановитесь здесь, задумайтесь. Человек более не в силах предсказать, как поведёт себя построенная им машина! А вживую насладиться эффектом можно на записях матча: оцените замешательство экспертов (сильнейших игроков!), в которое повергают их некоторые ходы AlphaGo. Люди сперва просто не понимают, для чего, почему был сделан ход — и только позже, крепко поразмыслив, признают, что это было умно, дальновидно, дерзко, агрессивно.

И вот тут новым светом начинает играть фраза, оброненная как-то Стивеном Хокингом. Он, входящий в число знаменитостей, призывающих опасаться появления слишком умных машин,сказал год назад, что «…машины подчинят нас оружием, которое мы не в силах будем даже понять».

Нет, AlphaGo — пока всего лишь автомат для игры. Это не система широкого профиля. Но люди, которые её построили, работают над множеством других проектов Google и надеются уже в следующие пять лет вывести их на рынок: машины, обладающие интуицией, станут трудиться бок о бок с нами уже в ближайшие пять лет! Хорошо, если мы сможем их ограничить, контролировать: пусть они помогают, например, учёным обрабатывать сырые данные, чтобы ускорить научный поиск. Но в том и парадокс, что контролировать то, чего не понимаем, мы не сможем.

Желаете посмотреть, как меняет осознание этого факта человека? Понаблюдайте за Ли Седолем. Он был абсолютно уверен в своей победе до матча, поколеблен странной игрой машины после первого сражения, расстроен после второго и, кажется, совсем утратил веру в свою способность сопротивляться после третьего.

Да, четвёртую партию, состоявшуюся сегодня ночью, он выиграл. На то и игра! Но меняет ли это что-нибудь?

Технологии глубокого обучения (нейросети, облака, и где-то там же бигдата) - это полная жесть

Hyku · 14 марта, 2016

Незнаю, а я верю, что пятую Ли Седоль выиграет. Тогда формально он проиграет, конечно, но вопрос человек vs программа останется незакрытым.

Изменено 14 марта, 2016 пользователем Hyku

Mac · 14 марта, 2016

Судя по комментариям, в четвертой игре Седоль нащупал слабое место и ввел машину в ступор и полную беспомощность. Алгоритм обещали не менять между играми, потому велика вероятность, что AlphaGo наступит на те же грабли, хотя если она учится на своих ошибках...

Кстати, DeepBlue проиграл Капарову тоже тупо из-за бага/сбоя - компьютер сходил не туда, куда надо, и даже сами создатели не могли поверить, что он ошибся. Так что очень похоже просто на случайность, досадное упущение, которое будет с легкостью исправлено в следующей версии.

Все это реально начинает пугать.

Hyku · 14 марта, 2016

2 минуты назад, Mac сказал:

Судя по комментариям, в четвертой игре Седоль нащупал слабое место и ввел машину в ступор и полную беспомощность. Алгоритм обещали не менять между играми, потому велика вероятность, что AlphaGo наступит на те же грабли, хотя если она учится на своих ошибках...

Кстати, DeepBlue проиграл Капарову тоже тупо из-за бага/сбоя - компьютер сходил не туда, куда надо, и даже сами создатели не могли поверить, что он ошибся. Так что очень похоже просто на случайность, досадное упущение, которое будет с легкостью исправлено в следующей версии.

Все это реально начинает пугать.

Про шахматы: там алгоритм и статистика большую роль играют.

Вот в го тут реально все сложнее для авторов программы. Если они смогут написать программу адаптирующуюся к изменениям ситуации, то в принципе искусственный интеллект с вариативными алгоритмами уже где-то рядом.

botaNICK · 14 марта, 2016

21 минуты назад, Hyku сказал:

Про шахматы: там алгоритм и статистика большую роль играют.

Вот в го тут реально все сложнее для авторов программы. Если они смогут написать программу адаптирующуюся к изменениям ситуации, то в принципе искусственный интеллект с вариативными алгоритмами уже где-то рядом.

Почитай статью под спойлером, там кратко описано про технологию "глубокого обучения", когда система (нейросеть и алгоритм) "запирается в банку" и играет тысячи партий сама с собой, после чего вырабатывает то, что условно назвали "интуицией". Если алгоритму дать сыграть ещё несколько партий с чемпионом, то он по идее должен так же взаимно "раскусить" его манеру.

В общем, ждём исхода пятой партии) Магия, блин.

Вот линки по сабжу на статьи на Терре, от Ваннаха, популярно и доступно (хотя и несколько философски), и не только про го:
http://www.computerra.ru/139292/igra-v-go-pala-pod-natiskom-iskina/
http://www.computerra.ru/139611/iskinyi-stanovyatsya-polittehnologami-i-razrulivayut-mezhnatsionalnyie-otnosheniya/
http://www.computerra.ru/140116/kompyuter-potihonku-perestaet-putat-slova/
Рекомендую, и там есть ещё у него и у Золотова

Hyku · 14 марта, 2016

22 минуты назад, botaNICK сказал:

Почитай статью под спойлером, там кратко описано про технологию "глубокого обучения", когда система (нейросеть и алгоритм) "запирается в банку" и играет тысячи партий сама с собой, после чего вырабатывает то, что условно назвали "интуицией". Если алгоритму дать сыграть ещё несколько партий с чемпионом, то он по идее должен так же взаимно "раскусить" его манеру.

В общем, ждём исхода пятой партии) Магия, блин.

Вот линки по сабжу на статьи на Терре, от Ваннаха, популярно и доступно (хотя и несколько философски), и не только про го:
http://www.computerra.ru/139292/igra-v-go-pala-pod-natiskom-iskina/
http://www.computerra.ru/139611/iskinyi-stanovyatsya-polittehnologami-i-razrulivayut-mezhnatsionalnyie-otnosheniya/
http://www.computerra.ru/140116/kompyuter-potihonku-perestaet-putat-slova/
Рекомендую, и там есть ещё у него и у Золотова

Спасибо, прочитал. Искусственный интеллект где-то рядом. Ждем прорыва.

botaNICK · 16 марта, 2016

Итоговый счёт, 4:1. Разгром.
https://lenta.ru/news/2016/03/15/gofinal/

Цитата

12:26, 15 марта 2016

Искусственный интеллект разгромил чемпиона мира по игре в го

Скрытый текст

Программа AlphaGo выиграла последнюю партию против одного из мировых чемпионов по игре в го корейца Ли Седоля. Всего система обошла человека в четырех из пяти игр. Турнир прошел в Сеуле с 9 по 15 марта. Об этом сообщает Gizmodo.

9, 10 и 12 марта система AlphaGo обошла Ли Седоля. Однако 13 марта чемпион впервые смог обойти искусственный интеллект. После более чем трех часов противостояния с человеком программа сделала несколько неожиданных ходов: ошибка была совершена примерно на 79-м ходу, однако AlphaGo обнаружила ее лишь к 87-му ходу.

Логическая настольная игра го возникла в Древнем Китае и считается наиболее сложной для искусственного интеллекта из-за большого размера доски и трудностей в прогнозировании ходов.

В игре участвуют двое: один получает черные камни, другой — белые. Цель соперников — отгородить на игровой доске камнями своего цвета большую территорию, чем противник. Самые лучшие программы пока доходили лишь до уровня игроков-любителей.

Программу AlphaGo разработала принадлежащая Google компания DeepMind. Она использует так называемые сети значений для оценки положения фигур на доске и сети правил для выбора ходов. Эти нейронные сети обучаются игре, анализируя известные партии, а также путем проб и ошибок, играя в одиночку.

AlphaGo обыграла другие программы в 99,8 процента партий, а затем добилась превосходства над европейским чемпионом по игре в го (со счетом пять-ноль) без всякого гандикапа.

И более подробно с Гиктаймс:

Цитата

вчера в 15:38

Ли Седоль проиграл AlphaGo в пятой, заключительной партии в гоновость

Логические игры, Искусственный интеллект*

Скрытый текст

ИИ Google AlphaGo одержал победу и в пятой, заключительной партии в го, одолев одного из лучших игроков среди людей — Ли Седоля. На этот раз чемпион играл черными камнями, а программа — белыми. Корейский игрок в го старался постоянно атаковать противника, как и в четвертой, победной для себя партии. Тогда Седоль старался не давать инициативу своему виртуальному сопернику.

Как и в прошлый раз, время у игрока-человека закончилось быстрее, чем у машины, поэтому Седоль стал использовать дополнительное время, бёёми. Ему все же удалось несколько потревожить систему защиты AlphaGo, но ИИ решил эту проблему и вернул отвоеванные территории. Практически до самого конца игроки шли на равных, но Седолю все же пришлось признать поражение. Случилось это после пяти часов напряженной игры.

По словам представителей Google, организовавших эту игру, если бы Седоль выиграл у компьютера в большинстве партий, то он бы получил $1000000. Но поскольку победа осталась за AlphaGo, то миллион ушел на благотворительность.

Сама программа для игры в Го была создана компанией DeepMind, купленной Google некоторое время назад. По мнению создателей программы, только за время обучения она обработала около 30 млн различных комбинаций, постепенно обучаясь различным методам и схемам игры. Используется и вычисление оптимальных комбинаций, но не для всей игры в целом, а только для решения часто возникающих локальных моментов.

Если вы вдруг пропустили трансляцию, вот видео с разбором «полетов»:

Ну и ссылочка на файл с ходами, если хотите разобраться детально.

Напомню, что Ли Седоль проиграл первую, вторую, третью и пятую партии машине. Четвертую партию он выиграл, о чем уже упоминалось выше.

Hyku · 16 марта, 2016

Жаль,

Mac · 16 марта, 2016

Печаль. Судьба человечества предрешена.

Трали-Вали · 16 марта, 2016

дите Старка , что ли ?)

Chaos · 16 марта, 2016

Им бы для шутеров ботов писать - вот где точно есть спрос на продвинутый ИИ.

botaNICK · 28 мая, 2017

https://www.wired.com/2017/05/win-china-alphagos-designers-explore-new-ai/

Обновлённый АльфаГо выиграл все три игры у grandmaster Ke Jie, the world’s top Go player.

И обобщённая инфа по АльфаГо: https://ru.wikipedia.org/wiki/AlphaGo Очень интересно, рекомендую почитать. Мощь.

Цитата

Версия, которая выиграла у Фань Хуэя в октябре 2015 года, работала на 1202 процессорах и 176 графических процессорах^[60] .

В игре с Ли Седолем в марте 2016 года AlphaGo использовала 1920 процессоров и 280 графических процессоров, работающих в распределённой сети^[61].

В мае 2016 года представители компании Google объявили, что AlphaGo использовала TPU, процессор, разработанный Google, специально для машинного обучения^[62]^[63].

В матче против Кэ Цзе в мае 2017 года новая версия AlphaGo использовала только один компьютер на Google Cloud c TPU процессором, т.е. примерно в 10 раз меньшую вычислительную мощность, чем была использована в матче с Ли Седолем^[64].

Mac · 30 мая, 2017

Китай запретил СМИ оглашать результаты турнира по игре го между человеком и алгоритмом Google

Власти Китая запретили местным СМИ вести трансляцию и сообщать результаты турнира по национальной игре го между сильнейшим игроком страны и алгоритмом от Google AlphaGo. Как признался позднее проигравший в схватке игрок Кэ Цзе (Ke Jie), алгоритм стал слишком силён по сравнению с человеком.

Китайское правительство разослало изданиям и телеканалам предупреждения, чтобы они не транслировали игру и не уведомляли о её результатах. Китайские фанаты игры были возмущены, что не могут посмотреть турнир, проходящий в их родной стране.

Причины, по которым запрещено транслировать игру, не называются. По данным The Guаrdian, власти Китая не хотели, чтобы пострадала национальная гордость. Отмечается, что игра го считается национальным достоянием страны, и ей наравне с живописью и каллиграфией должен владеть любой джентльмен.

Первая игра турнира состоялась 23 мая, и алгоритм от Google победил в ней 19-летнего чемпиона, который после игры признался, что машина стала сильнее человека, и он больше никогда не будет играть с искусственным интеллектом. Как пишет N+1, раньше считалось, что компьютер не может победить человека в го из-за отсутствия абстрактного мышления.

Однако алгоритм AlphaGo 2016 года стабильно обыгрывает сильнейших игроков по всему миру. 12 марта стало известно, что машины окончательно победили человека в древнейшей настольной игре.

Источник.

Один вопрос: зачем?

Hamlo · 31 мая, 2017

14 часа назад, Mac сказал:

Китай запретил СМИ оглашать результаты турнира по игре го между человеком и алгоритмом Google

Власти Китая запретили местным СМИ вести трансляцию и сообщать результаты турнира по национальной игре го между сильнейшим игроком страны и алгоритмом от Google AlphaGo. Как признался позднее проигравший в схватке игрок Кэ Цзе (Ke Jie), алгоритм стал слишком силён по сравнению с человеком.

Китайское правительство разослало изданиям и телеканалам предупреждения, чтобы они не транслировали игру и не уведомляли о её результатах. Китайские фанаты игры были возмущены, что не могут посмотреть турнир, проходящий в их родной стране.

Причины, по которым запрещено транслировать игру, не называются. По данным The Guаrdian, власти Китая не хотели, чтобы пострадала национальная гордость. Отмечается, что игра го считается национальным достоянием страны, и ей наравне с живописью и каллиграфией должен владеть любой джентльмен.

Первая игра турнира состоялась 23 мая, и алгоритм от Google победил в ней 19-летнего чемпиона, который после игры признался, что машина стала сильнее человека, и он больше никогда не будет играть с искусственным интеллектом. Как пишет N+1, раньше считалось, что компьютер не может победить человека в го из-за отсутствия абстрактного мышления.

Однако алгоритм AlphaGo 2016 года стабильно обыгрывает сильнейших игроков по всему миру. 12 марта стало известно, что машины окончательно победили человека в древнейшей настольной игре.

Источник.

Один вопрос: зачем?

Что зачем?

Зачем они скрывают или зачем разработали такой алгоритм?

В 16.03.2016 в 21:14, Chaos сказал:

Им бы для шутеров ботов писать - вот где точно есть спрос на продвинутый ИИ.

Ботов заведомо делают туповатыми, а то вы постоянно проигрывать будете )))

Mac · 31 мая, 2017

@Hamlo вопрос, разумеется, относится к теме процитированной новости. Какой смысл в утаивании такой информации в 2017-м, когда любой мало-мальски интересующийся го (а Китае таких много) без труда найдет информацию о результатах игры?

Gans86 · 31 мая, 2017

1 час назад, Mac сказал:

@Hamlo вопрос, разумеется, относится к теме процитированной новости. Какой смысл в утаивании такой информации в 2017-м, когда любой мало-мальски интересующийся го (а Китае таких много) без труда найдет информацию о результатах игры?

Хомяк обыкновенный поиском такого точно не запарится. А вот из СМИ краем уха такое уловить может, а следом и сильно испугаться

Hamlo · 1 июня, 2017

8 часов назад, Mac сказал:

@Hamlo вопрос, разумеется, относится к теме процитированной новости. Какой смысл в утаивании такой информации в 2017-м, когда любой мало-мальски интересующийся го (а Китае таких много) без труда найдет информацию о результатах игры?

Ну тут сие китайское мышление русскому не в разумить... Осмелюсь предположить, они расстроились из за того что американский ИИ обыграл китайца, а вот если бы это сделала китайская машина то всех на площадь согнали бы и рассказали да показали сие чудо китайской мысли )))

Mac · 1 июня, 2017

Скрытый текст

@Gans86 @Hamlo друзья, пожалуйста, не используйте цитирование целого поста там, где это не нужно Эти лишние цитаты реально мешают читать.

Войти

Машины окончательно победили людей в го

Рекомендуемые сообщения

Ссылка на комментарий

Го пала

автор: Евгений Золотов 14 марта 2016

Ссылка на комментарий

Ссылка на комментарий

Ссылка на комментарий

Ссылка на комментарий

Ссылка на комментарий

Ссылка на комментарий

Искусственный интеллект разгромил чемпиона мира по игре в го

Ли Седоль проиграл AlphaGo в пятой, заключительной партии в гоновость

Ссылка на комментарий

Ссылка на комментарий

Ссылка на комментарий

Ссылка на комментарий

Ссылка на комментарий

Ссылка на комментарий

Ссылка на комментарий

Ссылка на комментарий

Ссылка на комментарий

Ссылка на комментарий

Ссылка на комментарий

Ссылка на комментарий

Присоединяйтесь к обсуждению

Похожий контент

Последние посетители 0 пользователей онлайн