ChessPro online

Новости мира движков

вернуться в форум

29.10.2007 | 19:10:30

Главная  -  Поговорим?  -  Железный марш

752

Vizvezdenec

Ниже нуля

09.01.2017 | 08:10:36

все его сообщения:
за день, за месяц,
за все время
Вообще там в комментариях указали интересную и вероятную причину настолько сильных различий в значениях ценностей фигур-возможно, это связано с тем, что шахматисты сдаются раньше, чем шахматные программы, которых очень многие заставляют доигрывать партии до мата/табличных эндшпилей с оценками за 100. Не исключено, что если это учесть, различия будут меньше.
номер сообщения: 54-31-5146

753

Jeweller

09.01.2017 | 18:11:11
Email

все его сообщения:
за день, за месяц,
за все время
Ну давайте помотрим:
0) Кто как ставит играть движки не важно, важны только настройки, на которых считал для них веса автор. А он наверняка заставлял играть движки до упора, иначе эксперимент не чист.
1) Теперь заставим играть движки не до упора. Это как-нибудь разожмет сжатые человеческие веса? Никак, абсолютно :)
2) Это сожмет веса движков? Немного сожмет. Почему немного, а не до человечесвких? CM8 Human играет иначе(по человечески) сразу, иммитация человеческого стиля сразу, значит как минимум дебют и миттельшпить неплохо иммитируются. Но своему собрату с нормальными весами фигур он проигрывает. Значит, используемые сжатые веса (человеческие веса) не оптимальны.
3) Теперь сравним Карлсена и Ананда. Карлсен играет в среднем дольше Ананда, и нередко до самого упора, но веса фигур у него практически те же, не разжаты. Вот белковый игрок, играющий долго, веса практически не разживаются.
4) Смотрим на Андерсона. У него наоборот, много коротких партий, но веса у него полностью разжаты.
номер сообщения: 54-31-5147

754

Vizvezdenec

Ниже нуля

09.01.2017 | 19:35:45

все его сообщения:
за день, за месяц,
за все время
Ну вообще сам автор в комментариях говорит, что его модель сходится для, например, Морфи, к абсурдным значениям-отрицательной стоимости коня. Значит матмодель не вполне корректна, видимо
Во-вторых тут делается единая ценность материала для всей игры, что не так в любом современном движке. Матмодель, на основе которой вычислены стоимости фигур, этого никак не учитывает. Весьма вероятно, что это достаточно сильно влияет на собственно стоимость.
А СМ8 Human проигрывает по множеству причин, я думаю, и неоптимальные веса-лишь одна из них. Вообще эти веса даже у топовых программ разные. Как там сам автор статьи говорит - оценочные функции позиции и даже веса фигур плотно увязаны на принципы работы альфа-бета отсечения и функция вроде сила программы в зависимости от весов фигур и от степени отсечения перебора может иметь сколько угодно экстремумов. Поэтому можно иметь разные веса, чуть разные алгоритмы альфа-бета отсечения и получать равные по силе игры движки, только несколько стилистически различные.
Пример стоимостей от стокфиша в 1/256 пешки:
Midgame: 198, 817, 836, 1270, 2521
Endgame: 258, 846, 857, 1278, 2558
У Комодо в 2012 было вот так:
Opening

600 3100 3225 4350 9100
Ending

925 3100 3225 5475 9700
Разница очевидна в общем-то
При этом стокфиш более агрессивно отсекает лишние ветки и вообще из топовых движков самый агрессивный в плане pruning и его веса фигур на это завязаны, как и у любых других движков. Возможно, что наличие syzygy - таблиц тоже как-то влияет на веса фигур в Endgame, но тут я не уверен.
Это я всё к чему-чтиво, безусловно, любопытное. Я думаю, заниженная стоимость фигур у людей возникает из-за того, что они гораздо чаще, чем компы, жертвуют материал за сомнительную компенсацию+более ясную игру, тогда как противнику надо вести точную защиту, с чем любой движок, разумеется, справится лучше человека. Но факт и в том, что сама модель не вполне математически и логически корректна и может рассматриваться только как первое приближение, не более того.
номер сообщения: 54-31-5148

755

Jeweller

09.01.2017 | 20:05:35
Email

все его сообщения:
за день, за месяц,
за все время
Vizvezdenec: А СМ8 Human проигрывает по множеству причин, я думаю, и неоптимальные веса-лишь одна из них.
Имел в виду, проигрывает СМ8 Дефолтному, т.е. эксперимент чистый, все остальное кроме весов одинаково. На нескольких других движках с возможностью менять веса, так же, смотрел. В СМ8, кроме того, как и во всей серии СМ, веса постоянны для всех стадий, старые движки :)

Пример стоимостей от стокфиша в 1/256 пешки:
Midgame: 198, 817, 836, 1270, 2521
Endgame: 258, 846, 857, 1278, 2558
У Комодо в 2012 было вот так:
Opening
600 3100 3225 4350 9100
Ending
925 3100 3225 5475 9700
Разница очевидна в общем-то
Здесь интересно, что стоимость пешки ближе к концу повышается, а у людей она уже повышена, по результатам простой модели Медведева. Т.е. аргумент "люди раньше заканчивают, поэтому", снова не проходит - играли бы дольше, стоимость пешки, и соответственно сжатие, стало бы еще больше.

Но факт и в том, что сама модель не вполне математически и логически корректна и может рассматриваться только как первое приближение, не более того.
Да, согласен, простая модель может искажать, и раз вышла осечка с Морфи, точно искажает, есть пример)
Другое дело, само сжатие. Экспериментируя с CM давно (лет 10-15), заметил задолго до выхода статьи - сжатие весов приводит к очеловечиванию стиля в том смысле, как играют сейчас. Если мы хотим добиться имитации романтической игры середины 19в, наоборот, стоимость пешки надо занижать. Кстати, здесь может быть разгадка фокуса с Андерсеном. Сжатие весов, присущее в среднем человеку, наложилось у него на специфический романтический стиль со снижением веса пешки. И в среднем (так удачно совпало) вышло близко к оптимуму
номер сообщения: 54-31-5149

756

Vizvezdenec

Ниже нуля

09.01.2017 | 23:10:14

все его сообщения:
за день, за месяц,
за все время
Возможно, что и так.
А возможно, что веса фигур Андерсена-некая ошибка мат модели, как у Морфи, только в другую сторону. Автор предполагает, что модель по Морфи сбоит из-за малого количества партий+множества игр на фору, ну так у Андерсена тоже не слишком много партий записанных (по сравнению с современными шахматистами).
номер сообщения: 54-31-5150

757

Jeweller

09.01.2017 | 23:10:38
Email

все его сообщения:
за день, за месяц,
за все время
Другое дело, само сжатие
Хотя, если взглянуть на персоналии CM, для многих имитаций мастеров прошлого веса не сжаты, сжаты только для каждого пятого примерно. Среди "сжатых" Капабланка, Нимцович, Стейниц, Ботвинник, Решевский, Рубинштейн...
В целом, тенденция к сжатию у исторических персон есть, разжат кажется только Блэкберн.

В ProDeo зависит от персоны, стандартная настройка самого движка 100-300-320-480-1000. Для Каспарова и Ананда, стоимость пешки снижена до 95, т.е. наоборот - разжали шкалу. Для Алехина и Карпова соотношения не меняли. Для Таля снизили веса коней и слонов.

Интересно было бы посмотреть на настройки Crafty Classic 2004, но они к сожалению скрыты. Там старались добиться совпадения ходов персоналий с ходами оригиналов из реальных партий.

Интересны также различия Rybka 3 Human и обычной Rybka 3, но скрыто. Васик старался имитировать человеческий стиль, но чтобы раскрывал настройки, не слышал.
номер сообщения: 54-31-5151

758

Jeweller

09.01.2017 | 23:16:36
Email

все его сообщения:
за день, за месяц,
за все время
Vizvezdenec: А возможно, что веса фигур Андерсена-некая ошибка мат модели, как у Морфи, только в другую сторону. Автор предполагает, что модель по Морфи сбоит из-за малого количества партий+множества игр на фору, ну так у Андерсена тоже не слишком много партий записанных (по сравнению с современными шахматистами).
Да, вполне может быть.
Нет сомнений, что рано или поздно подобное исследование будет сделано более тщательно, и по лучшей модели. Лучше бы "рано", интересное дело.
номер сообщения: 54-31-5152

759

Rom77

10.01.2017 | 08:15:42

все его сообщения:
за день, за месяц,
за все время
А что насчет Giraffe? У него человекоподобный стиль игры? Кто-нибудь может оценить? Он же тренирован на человеческих партиях. Кроме того, его нейросетка вроде бы по определению должна быть гибче обычных таблиц параметров оценки у других движков.

Аналогично в игре го, сейчас для получения человекообразного стиля игры просто тренируют нейросети движков по базам партий людей. Причем если нужно получить скажем игрока уровня первого разряда, то тренируют сетку по базе партий игроков именно этого уровня. И вроде бы получается.

Наверно и в шахматах такое возможно. Мне по крайней мере кажется, что для знающего человека тренировать нейросеть будет проще, чем подбирать отдельные параметры. И результат должен получиться лучше, при должном умении. На низовом уровне, так по-моему такой подход просто необходим, потому что тот же Чессмастер, например, несмотря на все попытки, за слабых персонажей играет совсем не по-человечески.
номер сообщения: 54-31-5153

760

Jeweller

10.01.2017 | 14:05:48
Email

все его сообщения:
за день, за месяц,
за все время
Rom77: тот же Чессмастер, например, несмотря на все попытки, за слабых персонажей играет совсем не по-человечески.
Да, но при этом он это делает намного лучше, чем например, Ufim :) Давно пришел к выводу, что лучше брать слабые движки нужного уровня игры, чем ослаблять сильные.

Мне по крайней мере кажется, что для знающего человека тренировать нейросеть будет проще, чем подбирать отдельные параметры.
Для всех сильных, ручной подборки давно нет, все на автомате, человек вообще туда не лезет.

А что насчет Giraffe? У него человекоподобный стиль игры? Кто-нибудь может оценить? Он же тренирован на человеческих партиях.
Можно попробовать сравнить Жирафа с CM8 Human. Но если бы у него был человеческий или какой-то особо интересный стиль, об этом бы говорили, как о легендарном Phalanx, например. Где сразу в один голос - очень человеческий и очень интересный стиль, атаки на короля прекрасны и т.п.

Что касается тренировки, не очень много знаю про этот движок, но вроде он тренирован на комп партиях из CCRL, и основная тренировка на самом себе, про партии людей ничего не слышал:
The current evaluation architecture is a neural network with 3 hidden layers. About 270,000 parameters. It is bootstrapped using a materials-only eval, and trained by looking at millions of random positions from the CCRL dump.
If you didn't catch it last time, Giraffe is a new experimental engine using deep learning. It tries to figure out all its chess knowledge by itself through self-play.

Собственно, "обучается" оптимизируется ОФ, движок не учится с нуля, как делать ходы и т.д., он это уже все умеет. Оптимизация ОФ дает пару сотен пунктов.
номер сообщения: 54-31-5154

761

Jeweller

10.01.2017 | 16:17:17
Email

все его сообщения:
за день, за месяц,
за все время
Провел 4 партии CM8 Human - Giraffe 20161023, движки примерно равны, матч выиграл CM8 Human 2,5-1,5. Первые 2 партии играли с книжкой, потом без.

У Жирафа сильно сдвинутая ОФ. В начале партий он показывает +1,2 в пользу белых, потом поправляется. Стиль довольно агрессивный, рисковый, совершенно не человеческий. Несколько раз за партию впадает в паранойю, начиная оценивать совершенно неадекватно, за что бывает наказан, но иногда ему сходит с рук с равным соперником. Явно переоценивает превращение пешек (4-я партия).

Вот характерные оценки, 1 партия, оценки Giraffe синие, полный неадекват:


3 партия, оценки Giraffe синие:


4 партия, оценки Giraffe зеленые, CM8 Human спокойно отдал материал и ушел на ничью, Giraffe до конца считает что у него выиграно, показывает оценку +5-6:


3-я партия, Giraffe без книжки сам идет в сицилианку, много мы знаем таких движков?
CM8 Human начинает движение пешкой f, и красиво матует. Giraffe пропускает атаку белых, некоторое время еще не понимает что происходит:

[Date "2017.01.10"]
[Round "3"]
[White "CM8 Human"]
[Black "Giraffe 20161023"]
[Result "1-0"]
[ECO "B50"]
[Opening "Sicilian"]
[Variation "2.Nf3 d6 3.Nc3"]
[TimeControl "360+3"]
[WhiteType "program"]
[BlackType "program"]

1.e4 c5 2.Nf3 d6 3.Nc3 Nc6 4.d4 cxd4 5.Nxd4 g6 6.Bb5 Bd7 7.O-O Bg7 8.Be3 Nf6
9.f3 Nxd4 10.Qxd4 Bxb5 11.Nxb5 O-O 12.Qd2 a6 13.Nc3 Rc8 14.Rad1 Qc7 15.Rfe1 b5
16.Bd4 Qb7 17.Nd5 Nxd5 18.Bxg7 Kxg7 19.exd5 Rc5 20.c3 Rfc8 21.Re3 a5 22.a3 a4 23.Re2
Re8

24.f4 Kg8 25.f5 Ra8 26.Re3 Qa7 27.Kh1 Qd7 28.Rf1 Rc4 29.Rh3 Qa7 30.Qh6 Rh4
31.Rxh4 e6 32.f6 Qg1+ 33.Kxg1 Ra7 34.Qg7# {Мат} 1-0
номер сообщения: 54-31-5157

762

Vizvezdenec

Ниже нуля

10.01.2017 | 17:14:59

все его сообщения:
за день, за месяц,
за все время
Оценочная функция прямо как у Jonny, видимо.
Тот тоже любит показывать какие-то +2,4 в позициях, где стокомодини показывают 0,5.
номер сообщения: 54-31-5158

763

Rom77

10.01.2017 | 18:34:32

все его сообщения:
за день, за месяц,
за все время
Jeweller: Да, но при этом он это делает намного лучше, чем например, Ufim :) Давно пришел к выводу, что лучше брать слабые движки нужного уровня игры, чем ослаблять сильные.

Да, тоже считаю, что для каждого уровня нужен свой движок. Что касается человекообразности, то больше всего мне нравится движок из программы "Шахматы с Гарри Каспаровым". Приятно играть, правда стиль игры не сильно меняется от персонажа к персонажу.

Что касается тренировки, не очень много знаю про этот движок, но вроде он тренирован на комп партиях из CCRL, и основная тренировка на самом себе, про партии людей ничего не слышал:

Да, точно, это я попутал.
номер сообщения: 54-31-5159

764

Jeweller

10.01.2017 | 18:55:01
Email

все его сообщения:
за день, за месяц,
за все время
Vizvezdenec: Оценочная функция прямо как у Jonny, видимо.
Тот тоже любит показывать какие-то +2,4 в позициях, где стокомодини показывают 0,5.
Вы имеете в виду Jonny 8 из последнего TCEC?
У меня Jonny 4.00, с CM11 Default сейчас сравнил - да, у него оценки бывают сильно завышены, до 1-1,5 пешек в паре партий. Но стиль аккуратный, адекватный, не как у Жирафа.

Кстати, у Jonny 4.00 можно менять материальные веса, дефолтные показывает 100-370-381-580-1160, они приняты за 100%.
номер сообщения: 54-31-5160

765

Jeweller

10.01.2017 | 19:01:52
Email

все его сообщения:
за день, за месяц,
за все время
Rom77: Приятно играть, правда стиль игры не сильно меняется от персонажа к персонажу.
На днях попробую выложить несколько разных по силе движков с персонажами.
номер сообщения: 54-31-5161

766

Vizvezdenec

Ниже нуля

10.01.2017 | 23:07:34

все его сообщения:
за день, за месяц,
за все время
Jeweller:
Vizvezdenec: Оценочная функция прямо как у Jonny, видимо.
Тот тоже любит показывать какие-то +2,4 в позициях, где стокомодини показывают 0,5.
Вы имеете в виду Jonny 8 из последнего TCEC?
У меня Jonny 4.00, с CM11 Default сейчас сравнил - да, у него оценки бывают сильно завышены, до 1-1,5 пешек в паре партий. Но стиль аккуратный, адекватный, не как у Жирафа.

Кстати, у Jonny 4.00 можно менять материальные веса, дефолтные показывает 100-370-381-580-1160, они приняты за 100%.

Ну я за Jonny 4 не наблюдал, видел 7.20, 7.30 и 8.00 на TCEC, там даже шутка ходила, что для получения оценки позиции стокфишем оценку джонни надо делить на 2
номер сообщения: 54-31-5162

767

dimarko

10.01.2017 | 23:14:43

все его сообщения:
за день, за месяц,
за все время
Ну вообще сам автор в комментариях говорит, что его модель сходится для, например, Морфи, к абсурдным значениям-отрицательной стоимости коня. Значит матмодель не вполне корректна, видимо.


- Мне, конечно, трудно… советовать вам, - начал он, глядя в глаза француза. - Вы чемпион… Если бы вы согласились выслушать мое мнение… Осмелюсь сказать… эта толстая штука, - Алехин показал пальцем на ладью, - она… только мешает…
номер сообщения: 54-31-5163

768

Jeweller

12.01.2017 | 14:14:05
Email

все его сообщения:
за день, за месяц,
за все время
Jeweller: Aegon 1997
Bronstein - Nimzo



Напротив Бронштейна Chrilly Donninger, автор Nimzo, который через несколько лет создаст Hydra

Поздние версии Nimzo стали доступны и выложены здесь

NimzoWB 2000, 2000a, 2000b - Christian Donninger (WB)



~2530 Elo, тактический монстр своего времени, и сейчас превосходит многие движки в этом компоненте.
В файле настроек можно менять несколько параметров, меняя манеру игры, в частности стоимость материала (дефолтные веса 105-425-425-685-1240)

прямая ссылка - www.rwbc-chess.de/Downloads/Transfer/NimzoWB2000.zip



номер сообщения: 54-31-5164

769

Vizvezdenec

Ниже нуля

12.01.2017 | 14:46:50

все его сообщения:
за день, за месяц,
за все время
Интересно, а какие движки первыми стали применять разные веса для фигур в миттельшпиле и эндшпиле?
номер сообщения: 54-31-5165

770

Jeweller

12.01.2017 | 14:57:37
Email

все его сообщения:
за день, за месяц,
за все время
Мне не известно, но предположу, с Рыбки все пошло. Васик тогда наворотил много нового. Стоимость слонов сделал разными. Веса (и ОФ в целом) в зависимости от стадии. Насколько помню те разговоры, когда стали разбираться, что в Рыбке внутри.
номер сообщения: 54-31-5166

771

Vizvezdenec

Ниже нуля

12.01.2017 | 15:14:44

все его сообщения:
за день, за месяц,
за все время
https://chessprogramming.wikispaces.com/Tapered+Eval
Нашёл вот такое, похоже, что популяризатором подхода, включающего в себя различные веса фигур для разных стадий игры, был Fruit.
номер сообщения: 54-31-5167

772

Jeweller

12.01.2017 | 15:29:03
Email

все его сообщения:
за день, за месяц,
за все время
Vizvezdenec: https://chessprogramming.wikispaces.com/Tapered+Eval
Нашёл вот такое, похоже, что популяризатором подхода, включающего в себя различные веса фигур для разных стадий игры, был Fruit.

O :)
Там еще говорят про The King(ЧессМастер) и Phalanx. И похоже у истоков ни Васик, ни Фабъен, а Йохан в 1991 году:
https://chessprogramming.wikispaces.com/The+King#Description
Description from Don Beal's WMCCC 1991 report:

Written by Johan de Koning, already known for his program which has competed for several years in Dutch tournaments. This latest version runs on the ARM2 RISC CPU and represents 2.5 man-years of development. The evaluation function is complex and hence a little slow. Positional scores can "easily exceed several Pawns". Separate evaluation terms are used for opening/middle/endgame with smooth transitions between them by using 3 weights which sum to 100%, giving a fuzzy definition of the phases. The search techniques include check extensions and chess-specific static rules for additional extensions. Singular extensions are not used, but lower bounds are computed to limit the search in the selective phase. Best moves from earlier iterations, history heuristic, killer heuristic, priority to captures, and a refutation table are all used to order moves, which are generated in the all-and-sort fashion. Specialized endgame knowledge is included and this is actively being expanded.
номер сообщения: 54-31-5168

773

Jeweller

12.01.2017 | 15:44:14
Email

все его сообщения:
за день, за месяц,
за все время
Aegon Man-Machine tournament 1997

Смотрится как фантастика. Ананд и Тимман на церемонии открытия дают сеанс одновременной игры движкам на 6 досках.





номер сообщения: 54-31-5169

774

Jeweller

12.01.2017 | 15:45:59
Email

все его сообщения:
за день, за месяц,
за все время
Здесь результаты турниров и партии:

Aegon Man-Machine Tournaments (1986-1997)
номер сообщения: 54-31-5170

775

Vizvezdenec

Ниже нуля

12.01.2017 | 17:09:17

все его сообщения:
за день, за месяц,
за все время
Интересно бы сейчас наоборот сделать-чтобы стокфиш на 1 ядре дал сеанс n-му количеству гроссмейстеров.
Интересно, что в 91 году у движка было 3 стадии, а сейчас во всех топовых движках их 2, подтверждая тезис Свешникова о том, что миттельшпиля нет, есть длинный дебют
номер сообщения: 54-31-5171

776

Jeweller

12.01.2017 | 17:23:24
Email

все его сообщения:
за день, за месяц,
за все время
Vizvezdenec: Интересно бы сейчас наоборот сделать-чтобы стокфиш на 1 ядре дал сеанс n-му количеству гроссмейстеров.

Если грубо прикинуть, что Stockfish 8 64-bit на оном ядре примерно 3450, и сила падает на 60 пунктов при двукратном уменьшении процессорного времени, то сеанс на 1024 досках, это падение силы на 600 пунктов, до 2850.

И можно еще спокойно упасть до 2730 и сыграть сеанс с 4096 лучшими из людей
номер сообщения: 54-31-5172

777

ram63k

любитель
Челябинская обл.

12.01.2017 | 17:36:42

все его сообщения:
за день, за месяц,
за все время
Jeweller И можно еще спокойно упасть до 2730 и сыграть сеанс с 4096 лучшими из людей

Конечно можно, машина-то, ниже заявленного 2730 играть не будет, а люди вот, даже с 2800, иной раз могут в какой нибудь партии по силе и 2700 "выдать"
номер сообщения: 54-31-5173

778

Jeweller

12.01.2017 | 19:05:30
Email

все его сообщения:
за день, за месяц,
за все время
Aegon 1996-97 - фотографии

Сейраван, София Полгар:




номер сообщения: 54-31-5174

779

Jeweller

12.01.2017 | 20:07:58
Email

все его сообщения:
за день, за месяц,
за все время
Там еще говорят про The King(ЧессМастер) и Phalanx. И похоже у истоков ни Васик, ни Фабъен, а Йохан в 1991 году

Вот он, крайний справа на фото, Johan de Koning, автор ChessMaster (The King):


Stefan Meyer-Kahlen (автор Shredder) и Johan de Koning:
номер сообщения: 54-31-5175

780

Jeweller

13.01.2017 | 00:24:06
Email

все его сообщения:
за день, за месяц,
за все время
Roce 0.0390 - Roman Hartmann (UCI, 2011)



~1870 Elo

Есть возможность менять материальные веса за оба(!) цвета, что очень редко встречается в этом диапазоне силы. Дефолтные веса 100-300-300-500-950. Стиль адекватный, активный, нацелен на короля противника, ценит ферзей, любит играть. Поддерживает Chess960.

Версии 0,0390 и более ранние на сайте автора
Версия 0.0395(Win64) здесь - www.rocechess.ch/roce395.zip
номер сообщения: 54-31-5176

781

Vizvezdenec

Ниже нуля

13.01.2017 | 09:43:48

все его сообщения:
за день, за месяц,
за все время
"Super Tournament" от CCRL, участники-последние версии Houdini, Stockfish, Komodo, Shredder, Fizbo, Ginkgo, Fire, Nirvana, Andscacs и Chiron.

Более подробно - в теме (:
После 8 раундов положение следующее:

5.0 - Stockfish 100117 64-bit
5.0 - Houdini 5.01 64-bit
5.0 - Fizbo 1.9 64-bit
4.5 - Komodo 1788.00 64-bit
4.5 - Deep Shredder 13 64-bit
4.5 - Fire 5 64-bit
3.0 - Chiron 4 64-bit
3.0 - Nirvanachess 01102017 64-bit
3.0 - Ginkgo 1.9v 64-bit
2.5 - Andscacs 0.89070 64-bit
номер сообщения: 54-31-5177