Перейти к содержанию

Машины окончательно победили людей в го


Mac

Рекомендуемые сообщения

Машины окончательно победили людей в го

Программа AlphaGo выиграла третью из пяти игр против Ли Седоля — одного из сильнейших в мире игроков в го. Таким образом, компьютер уже выиграл вне зависимости от исхода оставшихся двух партий. Ли Седоль играл черными камнями, AlphaGo — белыми. За игрой можно было следить в прямой трансляции.

b4c1e794e9a302fe8eb8390f4d8b62c9.png

На протяжении игры профессиональный игрок сначала уступил белым значительную территорию, однако позже попытался надавить на правую и нижнюю часть территории AlphaGo. Как и в предыдущей игре, Ли Седоль целиком потратил основное время и перешел на дополнительное (бёёми) — три фиксированных 60-секундных интервала, которые не считаются израсходованными, если игрок уложился в 60 секунд. Когда у профессионального игрока 9 дана остался последний 60-секундный интервал, у программы в запасе еще оставалось 37 минут основного времени. После длительной ко-борьбы и больше чем через четыре часа игры Ли Седоль признал поражение, положив на гобан камень противника.

a1dbd3295ad6ea7b511dac5dc0148b21.png

Ли Седолю предстоит сыграть против алгоритма Google еще две игры. Если бы Ли Седоль победил в большинстве партий, то получил бы от Google один миллион долларов. Поскольку большинство партий выиграла AlphaGo, сумма выигрыша будет пожертвована на благотворительность.

Го — одна из древнейших настольных игр. До недавнего времени было принято считать, что компьютер не способен играть на равных с профессиональным игроком из-за высокого уровня абстракции и невозможности перебора всех доступных вариантов развития событий — точно число допустимых комбинаций в игре на стандартном гобане больше, чем число атомов в наблюдаемой Вселенной. С поражением Ли Седоля не осталось игр с открытой информацией, в которых компьютер не мог бы обыграть человека.

Источник

Ли Седоль впервые выиграл у AlphaGo

9ce737f40808c35dd8aea3bd1ee3cc45.png

Ли Седоль, один из сильнейших в мире игроков в го, впервые выиграл у программы AlphaGo — предыдущие три игры профессионал 9 дана проиграл. AlphaGo играла черными камнями, Ли Седоль — белыми. За игрой можно было следить в прямой трансляции.

142f356e8d28a419e18e105f35f8a84d.png

В четвертой игре Ли Седоль так же, как и в предыдущих играх, целиком израсходовал основное время раньше, чем AlphaGo — после трех часов игры профессионал 9 дана перешел на бёёми, в то время как у алгоритма Google оставалось еще около часа. Несмотря на это, в четвертой игре Ли Седолю удалось в какой-то степени приспособиться к особенностям игры AlphaGo и он не дал алгоритму сформировать значительной территории на гобане. В какой-то момент комментаторы отметили что, возможно, алгоритм просто не предусматривает в принципе возможность самостоятельно признать поражение. После более чем четырех с половиной часов игры AlphaGo признала поражение: традиционно оно отмечается камнями цвета противника, выложенными на гобан.

254233fae42947e872eab051114547ec.png

Завершающая игра Ли Седоля против AlphaGo состоится 15 марта. Несмотря на то, что в четвертой игре победил Ли Седоль, большинство партий все равно выиграла AlphaGo, поэтому сумма выигрыша в размере одного миллиона долларов будет пожертвована на благотворительность. Ранее, в 2015 году, AlphaGo успешно обыгралачемпиона Европы, выиграв пять игр из пяти. 

Го — одна из древнейших настольных игр. До недавнего времени было принято считать, что компьютер не способен играть на равных с профессиональным игроком из-за высокого уровня абстракции и невозможности перебора всех доступных вариантов развития событий — точно число допустимых комбинаций в игре на стандартном гобане больше, чем число атомов в наблюдаемой Вселенной.

2de9d83ff4ea0e.jpg

3e4d055c883148d580ab82c483f7abef.jpg

Источник

Ссылка на комментарий

Недавно читал в Компьютерре как раз статью после того, как алгоритм первый раз обыграл менее именитого игрока в го. Комментаторы сдержанно указывали на то, что, мол, ещё не вечер, так игрок всё-таки не бог весть, а вот если победит Того Самого Легендарного с девятым даном...

И вот оно. Свершилось

И вот как раз свежая статья в Терре (копипаст под спойлером ниже):
http://www.computerra.ru/141553/alphago/
 

Скрытый текст

Го пала

автор: Евгений Золотов  14 марта 2016

С замирающим сердцем слежу я за поединком в го между корейцем Ли Седолем и компьютерной программой под названием AlphaGo. Матч ещё не завершён, сыграны лишь три партии из пяти, но хладнокровие, жестокость, какая-то особенная механическая дерзость, с которой машина разделалась с человеком в каждой из трёх проведённых, наводят (и не только меня!) на мысли грустные и даже страшные…

Если вы ещё не знакомы с го — что странно при том внимании, которое уделяется ей айтишным сообществом в последние годы — то вот короткий экскурс. Это одна из древнейших игр, в которые играет человек. Ей четыре тысячи лет, плюс-минус, придумана она в Древнем Китае и по сути своей очень проста. Есть разграфлённое на клетки поле, чёрные и белые камни, плюс правила, которые можно буквально сосчитать на пальцах одной руки. С точки зрения человека это такая же игра, как шахматы, шашки, и вообще любая другая сопоставимой комбинаторной сложности. Это не значит, конечно, что сильный шахматист будет так же силён и в го. Но это значит, что мыслят игроки примерно одинаково: возможных сценариев слишком много, приходится опираться на интуицию.

140316-1.jpg

Ли Седоль в центре. Слева — Демис Хассабис: сильный шахматист, соавтор ИИ-ядер в нескольких легендарных играх (Black & White, Theme Park), доктор наук и один из основателей британской компании DeepMind, которая и написала AlphaGo (и поглощена Google).

Ли Седоль в центре. Слева — Демис Хассабис: сильный шахматист, соавтор ИИ-ядер в нескольких легендарных играх (Black & White, Theme Park), доктор наук и один из основателей британской компании DeepMind, которая и написала AlphaGo (и поглощена Google).

А вот с точки зрения электронно-вычислительной машины, го — особый случай. В подавляющем большинстве прочих игр количество возможных ходов хоть и велико, но в принципе поддаётся механическому перебору. Грубо говоря, можно заставить машину просчитать, как скажется ход А на исходе игры Б: вычислить дерево вероятных следующих позиций, влияние их на величину функции f, которая тем больше, чем более вероятна победа.

В шахматах число комбинаций огромно (10^118, что превосходит количество атомов во Вселенной; см. число Шеннона), однако, наложением элементарных фильтров — вроде исключения запрещённых ходов, исключения невозможных положений фигур на доске и пр. — его можно сильно уменьшить. Что по сути и делают разработчики шахматных программ до сих пор: именно так Deep Blue одолел Гарри Каспарова в 1997-м.

Го — другая история. Число возможных сценариев здесь превосходит все прочие игры и оценивается для доски 19×19 полей в 10^761. Да, применением правил его тоже возможно радикально сократить, но к такому огромному вероятностному пространству применить правила ещё нужно суметь! И потом, в го, в отличие от других, трудно оценить влияние конкретного хода на исход игры. Так что в общем и целом вплоть до последнего времени го считалась недосягаемой для «решения в лоб», т.е. методом перебора вариантов. Считается она таковой и сейчас. Команда Google пошла иным путём.140316-2

140316-2.png

Есть несколько хороших публикаций, в которых создатели AlphaGo объясняют схему своего автомата: вот подробная, но сложная, статья в Nature, вот популярное, но поверхностноеобъяснение в блоге Google. Если коротко, была построена многослойная (дюжина слоёв) искусственная нейросеть из двух блоков, работающая на облачном суперкомпьютере (в настоящий момент задействованы больше тысячи CPU и на порядок меньше GPU). Блок первый предлагает ход, блок второй оценивает вероятное его влияние на результат партии.

Тренировали AlphaGo сперва на игре с живым соперником и записях состоявшихся игр, а после заставили машину играть против самой себя — чтобы она не просто имитировала человека, а и сама изобретала стратегии. Потом AlphaGo показал свою мощь, одолев всех существующих электронных соперников. Потом, прошлой осенью, победил в закрытом чемпионате многократного европейского чемпиона. А теперь разделал под орех одного из сильнейших годзистов мира…

«Придумать стратегию» в данном случае не преувеличение и не фигура речи. Дело в том, что как и всякую машину, преодолевшую некоторый воображаемый порог сложности, мы более не в силах понять, как именно AlphaGo работает — не в силах описать это, пользуясь языком математики. Сами создатели AlphaGo в интервью называют то, что делает их машина, интуицией. Да, конечно, они знают, что это лишь результат работы двух конкурентных многослойных нейросетей. Но описать как именно генерируется тот или иной ход, а тем более предсказать, как сходит машина в произвольной ситуации, даже её создатели уже не могут!

Остановитесь здесь, задумайтесь. Человек более не в силах предсказать, как поведёт себя построенная им машина! А вживую насладиться эффектом можно на записях матча: оцените замешательство экспертов (сильнейших игроков!), в которое повергают их некоторые ходы AlphaGo. Люди сперва просто не понимают, для чего, почему был сделан ход — и только позже, крепко поразмыслив, признают, что это было умно, дальновидно, дерзко, агрессивно.140316-2

140316-2.jpg

И вот тут новым светом начинает играть фраза, оброненная как-то Стивеном Хокингом. Он, входящий в число знаменитостей, призывающих опасаться появления слишком умных машин,сказал год назад, что «…машины подчинят нас оружием, которое мы не в силах будем даже понять».

Нет, AlphaGo — пока всего лишь автомат для игры. Это не система широкого профиля. Но люди, которые её построили, работают над множеством других проектов Google и надеются уже в следующие пять лет вывести их на рынок: машины, обладающие интуицией, станут трудиться бок о бок с нами уже в ближайшие пять лет! Хорошо, если мы сможем их ограничить, контролировать: пусть они помогают, например, учёным обрабатывать сырые данные, чтобы ускорить научный поиск. Но в том и парадокс, что контролировать то, чего не понимаем, мы не сможем.

Желаете посмотреть, как меняет осознание этого факта человека? Понаблюдайте за Ли Седолем. Он был абсолютно уверен в своей победе до матча, поколеблен странной игрой машины после первого сражения, расстроен после второго и, кажется, совсем утратил веру в свою способность сопротивляться после третьего.

Да, четвёртую партию, состоявшуюся сегодня ночью, он выиграл. На то и игра! Но меняет ли это что-нибудь?

Технологии глубокого обучения (нейросети, облака, и где-то там же бигдата) - это полная жесть :) 

Ссылка на комментарий

Незнаю, а я верю, что пятую Ли Седоль выиграет. Тогда формально он проиграет, конечно, но вопрос человек vs программа останется незакрытым.

Изменено пользователем Hyku
Ссылка на комментарий

Судя по комментариям, в четвертой игре Седоль нащупал слабое место и ввел машину в ступор и полную беспомощность. Алгоритм обещали не менять между играми, потому велика вероятность, что AlphaGo наступит на те же грабли, хотя если она учится на своих ошибках...

Кстати, DeepBlue проиграл Капарову тоже тупо из-за бага/сбоя - компьютер сходил не туда, куда надо, и даже сами создатели не могли поверить, что он ошибся. Так что очень похоже просто на случайность, досадное упущение, которое будет с легкостью исправлено в следующей версии.

Все это реально начинает пугать.

Ссылка на комментарий
2 минуты назад, Mac сказал:

Судя по комментариям, в четвертой игре Седоль нащупал слабое место и ввел машину в ступор и полную беспомощность. Алгоритм обещали не менять между играми, потому велика вероятность, что AlphaGo наступит на те же грабли, хотя если она учится на своих ошибках...

Кстати, DeepBlue проиграл Капарову тоже тупо из-за бага/сбоя - компьютер сходил не туда, куда надо, и даже сами создатели не могли поверить, что он ошибся. Так что очень похоже просто на случайность, досадное упущение, которое будет с легкостью исправлено в следующей версии.

Все это реально начинает пугать.

Про шахматы: там алгоритм и статистика большую роль играют.

Вот в го тут реально все сложнее для авторов программы. Если они смогут написать программу адаптирующуюся к изменениям ситуации, то в принципе искусственный интеллект с вариативными алгоритмами уже где-то рядом.

Ссылка на комментарий
21 минуты назад, Hyku сказал:

Про шахматы: там алгоритм и статистика большую роль играют.

Вот в го тут реально все сложнее для авторов программы. Если они смогут написать программу адаптирующуюся к изменениям ситуации, то в принципе искусственный интеллект с вариативными алгоритмами уже где-то рядом.

Почитай статью под спойлером, там кратко описано про технологию "глубокого обучения", когда система (нейросеть и алгоритм) "запирается в банку" и играет тысячи партий сама с собой, после чего вырабатывает то, что условно назвали "интуицией". Если алгоритму дать сыграть ещё несколько партий с чемпионом, то он по идее должен так же взаимно "раскусить" его манеру.

В общем, ждём исхода пятой партии) Магия, блин.

Вот линки по сабжу на статьи на Терре, от Ваннаха, популярно и доступно (хотя и несколько философски), и не только про го:
http://www.computerra.ru/139292/igra-v-go-pala-pod-natiskom-iskina/
http://www.computerra.ru/139611/iskinyi-stanovyatsya-polittehnologami-i-razrulivayut-mezhnatsionalnyie-otnosheniya/
http://www.computerra.ru/140116/kompyuter-potihonku-perestaet-putat-slova/
Рекомендую, и там есть ещё у него и у Золотова :) 

Ссылка на комментарий
22 минуты назад, botaNICK сказал:

Почитай статью под спойлером, там кратко описано про технологию "глубокого обучения", когда система (нейросеть и алгоритм) "запирается в банку" и играет тысячи партий сама с собой, после чего вырабатывает то, что условно назвали "интуицией". Если алгоритму дать сыграть ещё несколько партий с чемпионом, то он по идее должен так же взаимно "раскусить" его манеру.

В общем, ждём исхода пятой партии) Магия, блин.

Вот линки по сабжу на статьи на Терре, от Ваннаха, популярно и доступно (хотя и несколько философски), и не только про го:
http://www.computerra.ru/139292/igra-v-go-pala-pod-natiskom-iskina/
http://www.computerra.ru/139611/iskinyi-stanovyatsya-polittehnologami-i-razrulivayut-mezhnatsionalnyie-otnosheniya/
http://www.computerra.ru/140116/kompyuter-potihonku-perestaet-putat-slova/
Рекомендую, и там есть ещё у него и у Золотова :) 

Спасибо, прочитал. Искусственный интеллект где-то рядом. Ждем прорыва.

Ссылка на комментарий

Итоговый счёт, 4:1. Разгром.
https://lenta.ru/news/2016/03/15/gofinal/

 
Цитата
12:26, 15 марта 2016

Искусственный интеллект разгромил чемпиона мира по игре в го

Скрытый текст

pic_0ec317bce00ce780d51c0d44311758ae.jpg

Программа AlphaGo выиграла последнюю партию против одного из мировых чемпионов по игре в го корейца Ли Седоля. Всего система обошла человека в четырех из пяти игр. Турнир прошел в Сеуле с 9 по 15 марта. Об этом сообщает Gizmodo.

9, 10 и 12 марта система AlphaGo обошла Ли Седоля. Однако 13 марта чемпион впервые смог обойти искусственный интеллект. После более чем трех часов противостояния с человеком программа сделала несколько неожиданных ходов: ошибка была совершена примерно на 79-м ходу, однако AlphaGo обнаружила ее лишь к 87-му ходу.

Логическая настольная игра го возникла в Древнем Китае и считается наиболее сложной для искусственного интеллекта из-за большого размера доски и трудностей в прогнозировании ходов.

В игре участвуют двое: один получает черные камни, другой — белые. Цель соперников — отгородить на игровой доске камнями своего цвета большую территорию, чем противник. Самые лучшие программы пока доходили лишь до уровня игроков-любителей.

Программу AlphaGo разработала принадлежащая Google компания DeepMind. Она использует так называемые сети значений для оценки положения фигур на доске и сети правил для выбора ходов. Эти нейронные сети обучаются игре, анализируя известные партии, а также путем проб и ошибок, играя в одиночку.

AlphaGo обыграла другие программы в 99,8 процента партий, а затем добилась превосходства над европейским чемпионом по игре в го (со счетом пять-ноль) без всякого гандикапа.

И более подробно с Гиктаймс:

 
Цитата
вчера в 15:38

Ли Седоль проиграл AlphaGo в пятой, заключительной партии в гоновость

Скрытый текст

0747c1abeabcd9011b9c25a197633aaa.jpg

ИИ Google AlphaGo одержал победу и в пятой, заключительной партии в го, одолев одного из лучших игроков среди людей — Ли Седоля. На этот раз чемпион играл черными камнями, а программа — белыми. Корейский игрок в го старался постоянно атаковать противника, как и в четвертой, победной для себя партии. Тогда Седоль старался не давать инициативу своему виртуальному сопернику. 

Как и в прошлый раз, время у игрока-человека закончилось быстрее, чем у машины, поэтому Седоль стал использовать дополнительное время, бёёми. Ему все же удалось несколько потревожить систему защиты AlphaGo, но ИИ решил эту проблему и вернул отвоеванные территории. Практически до самого конца игроки шли на равных, но Седолю все же пришлось признать поражение. Случилось это после пяти часов напряженной игры. 

9cae008e57fcf493fda65f6a733c3d3a.png

По словам представителей Google, организовавших эту игру, если бы Седоль выиграл у компьютера в большинстве партий, то он бы получил $1000000. Но поскольку победа осталась за AlphaGo, то миллион ушел на благотворительность. 



Сама программа для игры в Го была создана компанией DeepMind, купленной Google некоторое время назад. По мнению создателей программы, только за время обучения она обработала около 30 млн различных комбинаций, постепенно обучаясь различным методам и схемам игры. Используется и вычисление оптимальных комбинаций, но не для всей игры в целом, а только для решения часто возникающих локальных моментов.

Если вы вдруг пропустили трансляцию, вот видео с разбором «полетов»: 



Ну и ссылочка на файл с ходами, если хотите разобраться детально.

Напомню, что Ли Седоль проиграл первую, вторую, третью и пятую партии машине. Четвертую партию он выиграл, о чем уже упоминалось выше.

 
Ссылка на комментарий
  • 1 год спустя...

https://www.wired.com/2017/05/win-china-alphagos-designers-explore-new-ai/

Обновлённый АльфаГо выиграл все три игры у grandmaster Ke Jie, the world’s top Go player. 

И обобщённая инфа по АльфаГо: https://ru.wikipedia.org/wiki/AlphaGo Очень интересно, рекомендую почитать. Мощь. 

Цитата

Версия, которая выиграла у Фань Хуэя в октябре 2015 года, работала на 1202 процессорах и 176 графических процессорах[60] .

В игре с Ли Седолем в марте 2016 года AlphaGo использовала 1920 процессоров и 280 графических процессоров, работающих в распределённой сети[61].

В мае 2016 года представители компании Google объявили, что AlphaGo использовала TPU, процессор, разработанный Google, специально для машинного обучения[62][63].

В матче против Кэ Цзе в мае 2017 года новая версия AlphaGo использовала только один компьютер на Google Cloud c TPU процессором, т.е. примерно в 10 раз меньшую вычислительную мощность, чем была использована в матче с Ли Седолем[64].

Ссылка на комментарий

Китай запретил СМИ оглашать результаты турнира по игре го между человеком и алгоритмом Google

Власти Китая запретили местным СМИ вести трансляцию и сообщать результаты турнира по национальной игре го между сильнейшим игроком страны и алгоритмом от Google AlphaGo. Как признался позднее проигравший в схватке игрок Кэ Цзе (Ke Jie), алгоритм стал слишком силён по сравнению с человеком.

Китайское правительство разослало изданиям и телеканалам предупреждения, чтобы они не транслировали игру и не уведомляли о её результатах. Китайские фанаты игры были возмущены, что не могут посмотреть турнир, проходящий в их родной стране.

Причины, по которым запрещено транслировать игру, не называются. По данным The Guаrdian, власти Китая не хотели, чтобы пострадала национальная гордость. Отмечается, что игра го считается национальным достоянием страны, и ей наравне с живописью и каллиграфией должен владеть любой джентльмен.

Первая игра турнира состоялась 23 мая, и алгоритм от Google победил в ней 19-летнего чемпиона, который после игры признался, что машина стала сильнее человека, и он больше никогда не будет играть с искусственным интеллектом. Как пишет N+1, раньше считалось, что компьютер не может победить человека в го из-за отсутствия абстрактного мышления.

Однако алгоритм AlphaGo 2016 года стабильно обыгрывает сильнейших игроков по всему миру. 12 марта стало известно, что машины окончательно победили человека в древнейшей настольной игре.

Источник.

Один вопрос: зачем?

Ссылка на комментарий
14 часа назад, Mac сказал:

Китай запретил СМИ оглашать результаты турнира по игре го между человеком и алгоритмом Google

Власти Китая запретили местным СМИ вести трансляцию и сообщать результаты турнира по национальной игре го между сильнейшим игроком страны и алгоритмом от Google AlphaGo. Как признался позднее проигравший в схватке игрок Кэ Цзе (Ke Jie), алгоритм стал слишком силён по сравнению с человеком.

Китайское правительство разослало изданиям и телеканалам предупреждения, чтобы они не транслировали игру и не уведомляли о её результатах. Китайские фанаты игры были возмущены, что не могут посмотреть турнир, проходящий в их родной стране.

Причины, по которым запрещено транслировать игру, не называются. По данным The Guаrdian, власти Китая не хотели, чтобы пострадала национальная гордость. Отмечается, что игра го считается национальным достоянием страны, и ей наравне с живописью и каллиграфией должен владеть любой джентльмен.

Первая игра турнира состоялась 23 мая, и алгоритм от Google победил в ней 19-летнего чемпиона, который после игры признался, что машина стала сильнее человека, и он больше никогда не будет играть с искусственным интеллектом. Как пишет N+1, раньше считалось, что компьютер не может победить человека в го из-за отсутствия абстрактного мышления.

Однако алгоритм AlphaGo 2016 года стабильно обыгрывает сильнейших игроков по всему миру. 12 марта стало известно, что машины окончательно победили человека в древнейшей настольной игре.

Источник.

Один вопрос: зачем?

Что зачем?

Зачем они скрывают или зачем разработали такой алгоритм?

В 16.03.2016 в 21:14, Chaos сказал:

Им бы для шутеров ботов писать - вот где точно есть спрос на продвинутый ИИ.

Ботов заведомо делают туповатыми, а то вы постоянно проигрывать будете )))

Ссылка на комментарий

@Hamlo вопрос, разумеется, относится к теме процитированной новости. Какой смысл в утаивании такой информации в 2017-м, когда любой мало-мальски интересующийся го (а Китае таких много) без труда найдет информацию о результатах игры?

Ссылка на комментарий
1 час назад, Mac сказал:

@Hamlo вопрос, разумеется, относится к теме процитированной новости. Какой смысл в утаивании такой информации в 2017-м, когда любой мало-мальски интересующийся го (а Китае таких много) без труда найдет информацию о результатах игры?

Хомяк обыкновенный поиском такого точно не запарится. А вот из СМИ краем уха такое уловить может, а следом и сильно испугаться :)

Ссылка на комментарий
8 часов назад, Mac сказал:

@Hamlo вопрос, разумеется, относится к теме процитированной новости. Какой смысл в утаивании такой информации в 2017-м, когда любой мало-мальски интересующийся го (а Китае таких много) без труда найдет информацию о результатах игры?

Ну тут сие китайское мышление русскому не в разумить... Осмелюсь предположить, они расстроились из за того что американский ИИ обыграл китайца, а вот если бы это сделала китайская машина то всех на площадь согнали бы и рассказали да показали сие чудо китайской мысли )))

Ссылка на комментарий
Скрытый текст

@Gans86 @Hamlo друзья, пожалуйста, не используйте цитирование целого поста там, где это не нужно ;) Эти лишние цитаты реально мешают читать.

Ссылка на комментарий

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...