AlphaZero vs. Stockfish

29.10.2007 | 19:10:30

Страницы: [1] [2] [3] [4] [5]

62	izha 09.12.2017 \| 00:07:06 все его сообщения: за день, за месяц, за все время

Vizvezdenec:

izha:

Cube2:

izha:
В отличии от всей прочей компьютерной белиберды она раширяет понимание игры.

Не могли бы Вы пожалуйста поподробнее на этом моменте? в чем качественное отличие от стока и прочих прог?

Очень грубо говоря. Ход 1.е2-е4 лучше, чем 1.h2-h4, как нас научили в раннем детстве дедушки/бабушки. А два слона сильнее чем два коня обычно. Это мы прочли в книжке длы 4-го разряда. И вообще слон вроде сильнее коня, хотя почему-то конь с ферзем может и лучше слона с ферзем и какая-то там инициатива отличная компенсация за что-нибудь еще, как нам сказал тренер. А потом смотришь на партию Фишера где вроде ничего не происходит, а потом он выигрывает и пытаешься понять как же это он делает. Могу ошибаться, но то что АлфаЗеро рассматривает в тысячу раз меньше позиций говорит о том, что она узнала о шахматах много нового и не я, конечно, но сильные гроссмейстеры будут изучать ее партии, как мы Фишера в детстве. Кстати, насколько я помню, Го чампион проигравший АлфаГо изучает ее партии и людям больше не проигрывает. А Сток к шахматам отношения не имеет. Минимим знаний вложенных людьми, не на уровне даже 2го разряда, а дальше немного математики, немного эвристики и много оптимизации быстродействия железа. Сегодняшние (вчерашиние!) программы убивают шахматы а Алфа развивает.

Прекрасное понимание логики шахматных программ и всего остального. Вопросов больше не имеется

Куда уж мне с 30ю годами опыта. Да я Вам, кстати, и не отвечал.

номер сообщения: 54-69-6201

63	Cube2 09.12.2017 \| 00:08:35 все его сообщения: за день, за месяц, за все время

izha: в альфе не заложен никакой алгоритм, она просто (только) самообучается. а в стоке, как и в любой проге, есть алгоритм построенный на человеческом понимание игры. альфа не отталкивается от каких-то вложенных в неё базисных правил/постулатов и поэтому она "мыслит" и "чувствует" игру качественно иначе. я правильно понимаю вашу мысль?

номер сообщения: 54-69-6202

64	izha 09.12.2017 \| 00:19:20 все его сообщения: за день, за месяц, за все время

Cube2: izha: в альфе не заложен никакой алгоритм, она просто (только) самообучается. а в стоке, как и в любой проге, есть алгоритм построенный на человеческом понимание игры. альфа не отталкивается от каких-то вложенных в неё базисных правил/постулатов и поэтому она "мыслит" и "чувствует" игру качественно иначе. я правильно понимаю вашу мысль?

Да, только Сток не базируется даже на понимании, а лишь на минимуме знаний. Минимуме, чтобы не замедляться. Грубо говоря, опять-таки, зачем знать как строить "мост" в ладйнике, если все можно просчитать до мата за секунду.

номер сообщения: 54-69-6203

65	Cube2 09.12.2017 \| 00:23:41 все его сообщения: за день, за месяц, за все время

спасибо

номер сообщения: 54-69-6204

66	izha 09.12.2017 \| 01:27:56 все его сообщения: за день, за месяц, за все время

Cube2: спасибо

номер сообщения: 54-69-6169

67	Vizvezdenec Ниже нуля Севастополь 09.12.2017 \| 01:36:17 все его сообщения: за день, за месяц, за все время

izha:

Так и альфа ничего этого не знает. А даже если и знает - наружу не выдаст. Чему там можно научиться - не слишком-то и понятно.

номер сообщения: 54-69-6170

68	арт. created 2004.06.10 20.00.00 09.12.2017 \| 01:46:49 Сайт все его сообщения: за день, за месяц, за все время

Vizvezdenec: Чему там можно научиться - не слишком-то и понятно.

учеба будет происходить при помощи разбора стоком партий Альфы )

номер сообщения: 54-69-6171

69	Vizvezdenec Ниже нуля Севастополь 09.12.2017 \| 01:50:55 все его сообщения: за день, за месяц, за все время

арт.:

Vizvezdenec: Чему там можно научиться - не слишком-то и понятно.

учеба будет происходить при помощи разбора стоком партий Альфы )

Ну с таким же успехом можно стоком разбирать партии более сильного стока.
Особенно если создатели гугла, как это часто бывает при создании подобного рода суперкомпов для шахмат, не будут больше им партии-то и играть.

Вообще в принципе я не особо знаю, чему можно научиться, просматривая партии как движков, которые на 500 эло сильнее людей, которые брутфорсят игру разными эвристиками и имеют облегчённую оценку, так и просматривая партии альфазеро, который вообще из себя представляет чёрный ящик, даже авторы которого не представляют, на каком основании он выдаёт именно такие ходы. Эстетическое удовольствие от прекрасных шахмат получить можно, а вот чему-то прям научиться именно на основе таких игр - сомнительно.

номер сообщения: 54-69-6172

70	арт. created 2004.06.10 20.00.00 09.12.2017 \| 05:24:05 Сайт все его сообщения: за день, за месяц, за все время

Свидлер изумился тому , что альфа играла актуальные дебютные линии,
ну и чисто эстетически - многие гроссы в восхищении от партий, красота тоже "учит", и если она "обучалась сама" - то есть с нуля за несколько часов достигла передовых рубежей дебютной мысли, то наверняка может не только проучить , но и чему-то научить))
А в общем мне так и не понятно - кого победила Альфа, был ли это полноценный движок, или же нет.
Дебютная книга для Альфы не важна - она "всё сама" , а для движка - очень важна. Ну и само "железо" - сравнить невозможно, это разные сущности , комп и нейросеть, был ли сток достаточно "вооружен" ?
зы. сами партии загрузил в начало ветки

номер сообщения: 54-69-6234

71	FIBM 09.12.2017 \| 09:58:56 все его сообщения: за день, за месяц, за все время

арт.: Свидлер изумился тому , что альфа играла актуальные дебютные линии,

Свидлер отметил очеь важную вещь: "железный пацан" обучаясь играет то, что интересно шахматистам-профессионалам, там где совершали шахматные открытия великие Гельфанд, Аронян и др (пацан их переоткрыл, что говорит в пользу и шахматистов и разработчиков). Огромное отличие от стокфиша, который во-первых, будет играть (анализировать) "все что ему прикажут", а во-вторых, не сможет отказать себе в удовольствии сыграть а6, h6, а потом легко выиграть. "Железный пацан" такими детскими глупостями заниматься не будет, ну а чтобы понять что-то в его шахматах нужен гроссмейстерский (лучше нескольких гроссмейстеров) анализ этих партий.

номер сообщения: 54-69-6237

72	izha 09.12.2017 \| 10:07:30 все его сообщения: за день, за месяц, за все время

Дебютная книга для Альфы не важна - она "всё сама" , а для движка - очень важна

. Ну и само "железо" - сравнить невозможно, это разные сущности , комп и нейросеть, был ли сток достаточно "вооружен" ?
зы. сами партии загрузил в начало ветки

Сток без дебютной книги не выйдет живым из дебюта. Насколько я понимаю АлфаЗеро не использует сети или суперпоцессоры во время игры. Все это нужно лишь на стадии самообучения (те самые 4 часа). Во время игры используется накопленное понимание. Поэтому мало узлов. Абсолютно человеческий подход.

номер сообщения: 54-69-6238

73	Vizvezdenec Ниже нуля Севастополь 09.12.2017 \| 10:29:28 все его сообщения: за день, за месяц, за все время

арт.: Свидлер изумился тому , что альфа играла актуальные дебютные линии,
ну и чисто эстетически - многие гроссы в восхищении от партий, красота тоже "учит", и если она "обучалась сама" - то есть с нуля за несколько часов достигла передовых рубежей дебютной мысли, то наверняка может не только проучить , но и чему-то научить))
А в общем мне так и не понятно - кого победила Альфа, был ли это полноценный движок, или же нет.
Дебютная книга для Альфы не важна - она "всё сама" , а для движка - очень важна. Ну и само "железо" - сравнить невозможно, это разные сущности , комп и нейросеть, был ли сток достаточно "вооружен" ?
зы. сами партии загрузил в начало ветки

У NN нету дебютной книги как таковой, но там оно примерно как работает - сначала нейронка играет кучу партий, находит "хорошие" начала, потом на них же тренируется. Так что некий аналог дебютной книги был.
Стокфиш же может вполне нормально играть и без дебютной книги, но ему для этого нужно ставить распределение времени неравномерное, а не то, какое ему поставили (по дефолту он больше времени пользует как раз на выходе из дебюта).
Но я уже всё это писал - гугл приложил крайне мало усилий для создания хотя бы отдалённо честных условий. Поэтому я это рассматриваю не как новую веху в шахматном программировании, а как хороший пиар-ход. Новой вехой это не является ещё и по той причине, что сейчас это требует специализированных суперкомпьютеров, а шахматы не настолько популярны, чтобы под них делались специализированные суперкомпьютеры. Пока нейронные сети настолько требовательны по железу - толку от таких движков очень мало, даже если они и правда будут стокфиш обыгрывать в равных условиях (в этом матче они были очень далеки от равных).

номер сообщения: 54-69-6239

74	RыbkaКАРП 09.12.2017 \| 10:38:18 все его сообщения: за день, за месяц, за все время

арт.:

Vizvezdenec: Чему там можно научиться - не слишком-то и понятно.

учеба будет происходить при помощи разбора стоком партий Альфы )

редкий момент когда я ничего ничего не понял
объясните

номер сообщения: 54-69-6240

75	Обережний герой кмс Харьков 09.12.2017 \| 10:51:43 Сайт все его сообщения: за день, за месяц, за все время

izha: Насколько я понимаю АлфаЗеро не использует сети или суперпроцессоры во время игры. Все это нужно лишь на стадии самообучения (те самые 4 часа). Во время игры используется накопленное понимание. Поэтому мало узлов. Абсолютно человеческий подход.

Так это понимание и хранится наверно в сетях или в том железе, которое эмулирует искусственные нейронные сети.
Разве при обучении этих сетей используется железо отличное от железа, используемого при работе уже обученных сетей?
У человека же мозг и вообще всё "железо" одни и те же, что при обучении, что при работе.
Разве у машин это не так?

__________________________
pr.ai PRAI Portal of Robotics and Artificial Intelligence

номер сообщения: 54-69-6241

76	Vizvezdenec Ниже нуля Севастополь 09.12.2017 \| 11:15:14 все его сообщения: за день, за месяц, за все время

Альфазеро при игре использует те самые 4 TPU, каждый из которых по мощности расчётов делаемых не очень понятно что, но от 50 до 2000 ядер в зависимости от того, какие параметры сравнивать.

номер сообщения: 54-69-6242

77	RыbkaКАРП 09.12.2017 \| 11:17:30 все его сообщения: за день, за месяц, за все время

так на настоящий момент удалось формализовать человеческий алгоритм выбора хода?
есть ли какие нибудь публикации?

номер сообщения: 54-69-6243

78	Vizvezdenec Ниже нуля Севастополь 09.12.2017 \| 11:21:18 все его сообщения: за день, за месяц, за все время

Обережний герой:

Так и есть, только для обучения использовалась нейронка с 5000 TPU, а играла нейронка с 4 TPU.
Кстати, я вроде бы не кидал тут ещё ссылку на то, что это такое, поэтому скину

В общем чистая производительность 180 ТераФлоп, что составляет около 360 весьма мощных ядер, т.к. те сейчас по половине терафлопа примерно https://www.microway.com/knowledge-center-articles/detailed-specifications-intel-xeon-e5-2600v3-haswell-ep-processors/.
Но если брать такие же процессоры и решать ими задачи альфазеро, то нужно будет порядка 2000 (это в более старых упоминаниях альфаго было), т.к. для перемножения матриц и подобного рода задач, видимо, графические процессоры подходят лучше, чем обычные.
Поэтому я и говорю, что оценка - от 400 до 8000 процессоров на эти самые 4 TPU, причём это специализированное железо.

номер сообщения: 54-69-6244

79	Vizvezdenec Ниже нуля Севастополь 09.12.2017 \| 11:22:53 все его сообщения: за день, за месяц, за все время

RыbkaКАРП: так на настоящий момент удалось формализовать человеческий алгоритм выбора хода?

Я не знаю, что в данном контексте вообще значит "формализовать". Фактически нейронная сеть подобная представляет из себя "чёрный ящик", куда заходит позиция и выходит выдаваемый ход. Если в классических шахматных программах известен алгоритм, то тут даже он не известен, известны только правила его построения и всё.

номер сообщения: 54-69-6245

80	RыbkaКАРП 09.12.2017 \| 11:35:57 все его сообщения: за день, за месяц, за все время

Vizvezdenec:

RыbkaКАРП: так на настоящий момент удалось формализовать человеческий алгоритм выбора хода?

нет я спросил именно про "человеческий алгоритм" выбора хода.
ведущие шахматисты порой выдают серии ходов по первой линии сильнейших движков,
но пользуются другими методами для выбора хода.А ЛУЧШИЙ ХОД ТЕМ НЕ МЕНЕЕ НАХОДЯТ

номер сообщения: 54-69-6246

81	Vizvezdenec Ниже нуля Севастополь 09.12.2017 \| 12:05:19 все его сообщения: за день, за месяц, за все время

Я бы сказал, что алгоритм выбора ходов нейронной сетью не человеческий и не движковый. Он просто другой.

номер сообщения: 54-69-6247

82	Обережний герой кмс Харьков 09.12.2017 \| 12:47:18 Сайт все его сообщения: за день, за месяц, за все время

Сейчас вообще проблема в том, что никто не понимает, как принимает решение программа,
это особо критично в случаях, где речь идёт о человеческой жизни, например при управлении автомобилями.
Чиновники осторожно пытаются требовать, чтобы программы могли объяснить свои действия людям,
но уверенности в осуществимости такого подхода наверно нет.

__________________________
pr.ai PRAI Portal of Robotics and Artificial Intelligence

номер сообщения: 54-69-6248

83	LB Петербург 09.12.2017 \| 12:51:28 Сайт все его сообщения: за день, за месяц, за все время

RыbkaКАРП: я спросил именно про "человеческий алгоритм" выбора хода.

Нет никакого "человеческого алгоритма" выбора хода, это оксюморон.

номер сообщения: 54-69-6249

84	RыbkaКАРП 09.12.2017 \| 12:56:32 все его сообщения: за день, за месяц, за все время

LB:

RыbkaКАРП: я спросил именно про "человеческий алгоритм" выбора хода.

Нет никакого "человеческого алгоритма" выбора хода, это оксюморон.

вы гросмейстер видимо?
вообще не поняли о чём я спросил
если нет "никакого "человеческого алгоритма" выбора хода"
тогда каким образом... "ведущие шахматисты порой выдают серии ходов по первой линии сильнейших движков,
И ЛУЧШИЙ ХОД НАХОДЯТ"

номер сообщения: 54-69-6250

85	LB Петербург 09.12.2017 \| 14:49:35 Сайт все его сообщения: за день, за месяц, за все время

RыbkaКАРП:
если нет "никакого "человеческого алгоритма" выбора хода"
тогда каким образом... "ведущие шахматисты порой выдают серии ходов по первой линии сильнейших движков,
И ЛУЧШИЙ ХОД НАХОДЯТ"

Люди обладают разумом и мыслят не по алгоритмам, хотя элементы последних в их мышлении тоже имеют место.

номер сообщения: 54-69-6251

86	xajik 09.12.2017 \| 15:17:17 все его сообщения: за день, за месяц, за все время

Будет задача формализовать решения, принимаемые нейронными сетями-сделают. Пока что это слишком сложно, люди даже не совсем понимают, как нейронная сеть принимает итоговые решения - нет даже соответсвующего общего математического аппарата.
А учиться( вытаскивать помаленьку формализацию) можно уже сейчас и в любое время с определенного уровня понимания игры- как учатся у более сильных шахматистов.
Человеческие алгоримы - собственно, люди и играют в разнообразные игры, чтобы улучшать свои алгоритмы разного рода

номер сообщения: 54-69-6252

87	Vizvezdenec Ниже нуля Севастополь 09.12.2017 \| 17:06:45 все его сообщения: за день, за месяц, за все время

xajik: Будет задача формализовать решения, принимаемые нейронными сетями-сделают. Пока что это слишком сложно, люди даже не совсем понимают, как нейронная сеть принимает итоговые решения - нет даже соответсвующего общего математического аппарата.
А учиться( вытаскивать помаленьку формализацию) можно уже сейчас и в любое время с определенного уровня понимания игры- как учатся у более сильных шахматистов.
Человеческие алгоримы - собственно, люди и играют в разнообразные игры, чтобы улучшать свои алгоритмы разного рода

Сделают. Вытащат эти огромные матрицы и скажут, что если произведение такой вот матрицы на такую имеет вот такие свойства, то мы ходим конём вот сюда, а если нет - то вот сюда.

номер сообщения: 54-69-6253

88	xajik 09.12.2017 \| 17:48:33 все его сообщения: за день, за месяц, за все время

Интересно, что было бы( сила, слабость, понимание...) если основной базой для изучения были бы эндшпили для АльфаЗиро , начиная со всех таблиц Налимова

, а не формирование со стартовой позиции ?

номер сообщения: 54-69-6255

89	Apollo КМС Москва 09.12.2017 \| 20:36:27 Сайт все его сообщения: за день, за месяц, за все время

Разбор одной из самых интересных партий AlphaZero - Stockfish

номер сообщения: 54-69-6256

90	LB Петербург 09.12.2017 \| 21:30:27 Сайт все его сообщения: за день, за месяц, за все время

Спасибо, покажите, пожалуйста, еще партии из этого матча

номер сообщения: 54-69-6257

91	ram63k любитель Челябинская обл. 10.12.2017 \| 20:14:58 все его сообщения: за день, за месяц, за все время

Все это конечно чертовски увлекательное зрелище, но у меня как любителя вопрос: А сможет ли АльфаЗеро со Стоком вытворять такое в равных условиях? Ведь насколько я понял, то у Стокфиша ни "железа" ни "памяти" для обычного его состояния не было. Интересно было бы посмотреть на АЗ в чемпионате "машин", где ко всем участникам одинаковые требования, или этот "инопланетный разум" и там всех вынесет? А так конечно... после ролика Apollo, какое то необьяснимое глубокое потрясение испытываешь... прикосновение к Вечности что ли... Спасибо, Apollo!

номер сообщения: 54-69-6258

Страницы: [1] [2] [3] [4] [5]