|
|
|
|
|
|
|
|
|
|
Jeweller:
выражено низкий процент совпадения против всех движков в тестируемой группе, для меня говорит о перекосе в ОФ и скорее всего, о намеренном перекосе, для достижения желаемого стиля игры |
Хм... Интересно, можно ли взять например Сток и "перекосить" его оценочную функцию таким образом, чтобы получить такой же небольшой процент совпадений против него же самого? |
|
|
номер сообщения: 54-31-5803 |
|
|
|
без проблем, но с потерей силы
на СМ и Спарке, например, удавалось в широких пределах менять стиль, на СМ - в очень широких пределах
раньше экспериментировал еще с несколькими, помню Fruit, Shredder, ProDeo, Zappa
недавно пробовал с CDrill 1800, удалось создать персоналию на несколько десятков пунктов сильнее дефолтной, как раз потому, что дефолтная не оптимизирована по силе, в угоду интересному комбинационному жертвенному стилю с недооценкой материала и переоценкой атаки на вражеского короля |
|
|
номер сообщения: 54-31-5804 |
|
|
|
Вряд ли дело в "намеренном перекосе". Скорее "так получилось", ведь намеренно перекашивать движок существенно труднее, чем просто делать его сильнее. |
|
|
номер сообщения: 54-31-5805 |
|
|
|
вот эта персоналия
CDrill 1800 Resistant
MaterialWeight 180
PawnStructureWeight 120
PassedPawnWeight 100
MobilityWeight 100
ThreatWeight 100
KingAttackWeight 50
KingShelterWeight 100
RepeatStore 0 |
|
|
|
номер сообщения: 54-31-5806 |
|
|
|
Vizvezdenec: Вряд ли дело в "намеренном перекосе". Скорее "так получилось", ведь намеренно перекашивать движок существенно труднее, чем просто делать его сильнее. | CDrill 1800, например, намеренно перекошен, автор старался создать определенную манеру игры и создал
а в чем сложность перекашивать? - сначала оптимизируешь, потом сдвигаешь ОФ в нужную сторону, в зависимости от того, что хочешь получить
какие-то перекосы понизят силу на 10-20 пунктов, какие-то на 30-50, дефолтный CDrill 1800 перекошен и слабее приведенной выше персоналии пунктов на 70-75 (по коротким тестам),
при чем, приведенная персоналия, я уверен, сама не вышла на максимум |
|
|
номер сообщения: 54-31-5807 |
|
|
|
Jeweller: Vizvezdenec: Вряд ли дело в "намеренном перекосе". Скорее "так получилось", ведь намеренно перекашивать движок существенно труднее, чем просто делать его сильнее. | CDrill 1800, например, намеренно перекошен, автор старался создать определенную манеру игры и создал
а в чем сложность перекашивать? - сначала оптимизируешь, потом сдвигаешь ОФ в нужную сторону, в зависимости от того, что хочешь получить
какие-то перекосы понизят силу на 10-20 пунктов, какие-то на 30-50, дефолтный CDrill 1800 перекошен и слабее приведенной выше персоналии пунктов на 70-75 (по коротким тестам),
при чем, приведенная персоналия, я уверен, сама не вышла на максимум | Ну просто топ-6 по силе движок так обычно не получается. |
|
|
номер сообщения: 54-31-5808 |
|
|
|
а как Гудини 5 или Шреддер 13 так сильно усилились?
мы же понимаем, что степень уникальности резко идет вниз с появлением суперсильного движка с открытым кодом, что открывает широкое поле для экспериментов
но, повторюсь, хочу с надеждой допустить, что автор придумал что-то уникально свое |
|
|
номер сообщения: 54-31-5809 |
|
|
|
Jeweller: а как Гудини 5 или Шреддер 13 так сильно усилились?
мы же понимаем, что степень уникальности резко идет вниз с появлением суперсильного движка с открытым кодом, что открывает широкое поле для экспериментов
но, повторюсь, хочу с надеждой допустить, что автор придумал что-то уникально свое |
Ну Гудини всегда был в топе, так что, конечно, адаптировав чужие идеи, снова вышел в топ.
А Шреддер в общем-то не сильно сильнее Физбо.
Из интересного - такого эффекта я у этого движка раньше не видел, он появился с версии 1.9, а основные изменения в 1.9 по сравнению с 1.8 как и заключались в изменении ОФ сильном, при этом он приобрёл немало Эло.
Похоже, что именно вот эти вот изменения ОФ, которые дали много Эло, заодно и стиль таким сделали. |
|
|
номер сообщения: 54-31-5810 |
|
|
|
само по себе усложнение оценки не приведет к одновременному росту силы и аномально малому проценту совпадений со всеми топовыми движками в тест-группе
я знаю один способ добиться большого снижения процента совпадений со всеми оптимизированными - [немного, аккуратно] разоптимизировать, сдвинув ОФ куда-нибудь вбок |
|
|
номер сообщения: 54-31-5811 |
|
|
|
Стартанул regression test стокфиша перед TCEC. Пока ещё игр мало, 40+/- 12 эло показывает. |
|
|
номер сообщения: 54-31-5812 |
|
|
|
посмотрел пару десятков партий Fizbo 1.9 (скачал с CCRL) - очень приятный радующий стиль, автор молодец и эстет
"сдвиг по фазе" там конечно есть, посмотрю подробнее еще |
|
|
номер сообщения: 54-31-5813 |
|
|
|
[поверхностные] впечатления от стиля Fizbo 1.9 очень хорошие
короля старается использовать как активную фигуру, защита короля уменьшена, дорожит ладьями и ферзем, атака на вражеского короля не переоценена - никаких прямых атак на короля, слонов не переоценивает, старается не ломать свои пешечные цепи, склонность к умеренно атакующему стилю, любит тяжелофигурные многопешечные окончания, прекрасная работа с проходными (создание проходных и использование стратегических бонусов), проходные!!
автор видимо здорово усложнил ОФ, и может быть даже ничего никуда не сдвигал, просто оптимизировав по имеющимся параметрам
сдвиг скорее на уровне перекоса в самом наборе этих параметров, работа с проходными, активная игра королем, тяжелофигурные предпочтения и т.д. - это уже стилистический перекос, и очень удачный
просто получаю огромное удовольствие, просматривая партии оригинала (Vizvezdenec, благодарю, что обратили внимание на этот "эффект Fizbo" ), а также аналога - попробовал сделать персоналию имитацию "по мотивам" CM10 Fizbo (с третьей итерации "узнал брата Колю")
понимаю, что в CM10 просто нет всего того, что наворотил автор в ОФ Fizbo, поэтому неизвестно, воспроизведется ли эффект, а пока добавил CM10 Fizbo в тест, подождем еще несколько дней
зы. настройки выложу потом) |
|
|
номер сообщения: 54-31-5814 |
|
|
|
Подтверждение "эффекта Fizbo" ещё и тут есть http://www.sp-cc.de/files/programs.dat - против ВСЕХ более сильных движков он выигрывает больше партий, чем Shredder.
Но имеет по этому рейтингу на 23 пункта эло меньше
И в отличие от случая движка с "усиленной рубкой хвостов" (Komodo-стиль), имеет перформанс против движка на 70 эло меньше (Andscacs) на 3 эло хуже, чем положено по разнице рейтинга Fizbo-Shredder.
То же можно сказать и про игру против Stockfish-разница в перформансе по сравнению со Shredder составляет 25 эло, т.е. два движка этих набирают количество очков, соответствующее своему рейтингу, без перекоса в сторону "топтания слабых" или "сопротивления сильным", но при этом Fizbo просто больше побеждает и проигрывает. |
|
|
номер сообщения: 54-31-5815 |
|
|
|
номер сообщения: 54-31-5816 |
|
|
|
номер сообщения: 54-31-5824 |
|
|
|
завершились тесты с целью "прояснения" "эффекта Fizbo", вот результаты
сначала берем CM10 Default, и сводим с группой более сильных движков
CM10 Default 226.5/560 ········
02: Ktulu 9 32.0/40 27-3-10
03: SmarThink 1.20 29.0/40 24-6-10
04: Glaurung 2.2 JA 28.0/40 23-7-10
05: Hiarcs 10 27.5/40 19-4-17
06: Rybka 1.0 Beta 25.5/40 20-9-11
06: ProDeo 1.85 25.5/40 21-10-9
08: Fruit 2.2.1 23.5/40 19-12-9
09: Chess Tiger 2007.1 23.0/40 16-10-14
09: Naum 2.0 23.0/40 18-12-10
11: Alaric 707 22.0/40 16-12-12
12: Shredder 9.1 21.5/40 15-12-13
13: Jonny 4.00 21.0/40 16-14-10
14: Delfi 5.4 17.5/40 11-16-13
15: Junior 10.1 14.5/40 9-20-11 |
дальше настройки CM10 отклоняем в противоположные стороны, меняя стоимость материала, контепмт во всей серии настроек не трогаем совсем
CM10 Factor+ 1x - увеличиваем стоимость своих фигур и компенсируем понижние скорости размена фигур сдвигом баланса атака/защита в сторону атаки
CM10 Factor– 1x - ровно наоборот, уменьшаем стоимость своих фигур и сдвигаем в сторону защиты
;---- CM10 Factor+ 1x.txt
cm_parm opp=100 opn=100 opb=100 opr=100 opq=100
cm_parm myp=100 myn=105 myb=105 myr=103 myq=102
cm_parm mycc=100 mymob=100 myks=100 mypp=100 mypw=100
cm_parm opcc=100 opmob=100 opks=100 oppp=100 oppw=100
cm_parm cfd=0 sop=100 avd=-7 rnd=0 sel=21 md=99
;---- File end
01: CM10 Factor+ 1x 210.5/560 ········
02: Ktulu 9 29.5/40 27-8-5
03: Fruit 2.2.1 27.5/40 24-9-7
03: Hiarcs 10 27.5/40 24-9-7
03: Naum 2.0 27.5/40 20-5-15
06: SmarThink 1.20 26.5/40 20-7-13
06: Glaurung 2.2 JA 26.5/40 22-9-9
08: Rybka 1.0 Beta 26.0/40 22-10-8
09: Junior 10.1 25.5/40 23-12-5
10: Chess Tiger 2007.1 24.0/40 14-6-20
10: ProDeo 1.85 24.0/40 19-11-10
12: Shredder 9.1 23.0/40 18-12-10
13: Alaric 707 22.0/40 17-13-10
14: Delfi 5.4 21.5/40 16-13-11
15: Jonny 4.00 18.5/40 15-18-7 |
;---- CM10 Factor– 1x.txt
cm_parm opp=100 opn=105 opb=105 opr=103 opq=102
cm_parm myp=100 myn=100 myb=100 myr=100 myq=100
cm_parm mycc=100 mymob=100 myks=100 mypp=100 mypw=100
cm_parm opcc=100 opmob=100 opks=100 oppp=100 oppw=100
cm_parm cfd=0 sop=100 avd=7 rnd=0 sel=21 md=99
;---- File end
01: CM10 Factor– 1x 216.0/560 ········
02: Glaurung 2.2 JA 30.5/40 25-4-11
03: Chess Tiger 2007.1 29.5/40 22-3-15
04: Rybka 1.0 Beta 27.5/40 20-5-15
05: Ktulu 9 26.5/40 21-8-11
06: Shredder 9.1 26.0/40 24-12-4
06: Jonny 4.00 26.0/40 18-6-16
08: ProDeo 1.85 25.0/40 16-6-18
09: Fruit 2.2.1 24.0/40 14-6-20
10: Hiarcs 10 22.5/40 15-10-15
11: SmarThink 1.20 22.0/40 14-10-16
12: Naum 2.0 21.5/40 10-7-23
12: Delfi 5.4 21.5/40 14-11-15
14: Junior 10.1 21.0/40 16-14-10
15: Alaric 707 20.5/40 12-11-17 |
|
|
|
номер сообщения: 54-31-5831 |
|
|
|
теперь двигаем защиту чужого и своего короля (контемпт не трогаем!)
CM10 Factor+ 2x - повышаем стоимость защиты короля противника в 2 раза, это сдвигает ОФ в сторону дополнительных усилий по разрушению зашиты вражеского короля и его атаки
CM10 Factor– 2x - ровно наоборот, повышаем стоимость защиты совего короля в 2 раза, сдвиг ОФ обратный
;---- CM10 Factor+ 2x.txt
cm_parm opp=100 opn=100 opb=100 opr=100 opq=100
cm_parm myp=100 myn=100 myb=100 myr=100 myq=100
cm_parm mycc=100 mymob=100 myks=100 mypp=100 mypw=100
cm_parm opcc=100 opmob=100 opks=200 oppp=100 oppw=100
cm_parm cfd=0 sop=100 avd=0 rnd=0 sel=21 md=99
;---- File end
01: CM10 Factor+ 2x 213.0/560 ········
02: Ktulu 9 31.0/40 28-6-6
03: Hiarcs 10 29.0/40 23-5-12
04: Fruit 2.2.1 28.5/40 24-7-9
04: Naum 2.0 28.5/40 23-6-11
06: Glaurung 2.2 JA 27.0/40 23-9-8
07: Rybka 1.0 Beta 25.0/40 19-9-12
08: Delfi 5.4 24.5/40 20-11-9
09: SmarThink 1.20 24.0/40 19-11-10
09: Shredder 9.1 24.0/40 21-13-6
11: ProDeo 1.85 22.5/40 15-10-15
12: Chess Tiger 2007.1 22.0/40 17-13-10
13: Jonny 4.00 21.5/40 16-13-11
14: Alaric 707 20.0/40 18-18-4
15: Junior 10.1 19.5/40 13-14-13 |
;---- CM10 Factor– 2x.txt
cm_parm opp=100 opn=100 opb=100 opr=100 opq=100
cm_parm myp=100 myn=100 myb=100 myr=100 myq=100
cm_parm mycc=100 mymob=100 myks=200 mypp=100 mypw=100
cm_parm opcc=100 opmob=100 opks=100 oppp=100 oppw=100
cm_parm cfd=0 sop=100 avd=0 rnd=0 sel=21 md=99
;---- File end
01: CM10 Factor– 2x 205.5/560 ········
02: Ktulu 9 30.5/40 26-5-9
02: Fruit 2.2.1 30.5/40 27-6-7
04: Rybka 1.0 Beta 29.0/40 23-5-12
05: Jonny 4.00 27.5/40 22-7-11
06: Naum 2.0 26.5/40 20-7-13
07: Glaurung 2.2 JA 26.0/40 19-7-14
08: Chess Tiger 2007.1 25.5/40 16-5-19
08: Shredder 9.1 25.5/40 16-5-19
10: SmarThink 1.20 24.5/40 20-11-9
11: Junior 10.1 23.5/40 20-13-7
12: Hiarcs 10 22.5/40 18-13-9
13: ProDeo 1.85 22.0/40 18-14-8
13: Alaric 707 22.0/40 15-11-14
15: Delfi 5.4 19.0/40 13-15-12 |
|
|
|
номер сообщения: 54-31-5832 |
|
|
|
берем наиболее сильную из персоналий со сдвигом в сторону ничейности: из двух вариантов "CM10 Factor– 1x" и "CM10 Factor– 2x", это первая, и воспроизводим ее на более сильном движке CM11, с целью увеличить разницу в пунктах Эло с персоналиями с пониженной ничейностью
;---- CM11 Factor –1x–2x.txt
cm_parm opp=100 opn=105 opb=105 opr=103 opq=102
cm_parm myp=100 myn=100 myb=100 myr=100 myq=100
cm_parm mycc=100 mymob=100 myks=100 mypp=100 mypw=100
cm_parm opcc=100 opmob=100 opks=100 oppp=100 oppw=100
cm_parm cfd=0 sop=100 avd=7 rnd=0 sel=21 md=99
;---- File end
01: CM11 Factor –1x 234.5/560 ········
02: Rybka 1.0 Beta 27.5/40 21-6-13
03: SmarThink 1.20 27.0/40 20-6-14
04: Ktulu 9 26.5/40 19-6-15
05: Alaric 707 26.0/40 19-7-14
06: Glaurung 2.2 JA 25.5/40 16-5-19
07: Shredder 9.1 25.0/40 18-8-14
08: Fruit 2.2.1 23.0/40 12-6-22
08: Hiarcs 10 23.0/40 16-10-14
10: Chess Tiger 2007.1 22.5/40 13-8-19
11: Jonny 4.00 22.0/40 12-8-20
11: Junior 10.1 22.0/40 15-11-14
13: Naum 2.0 21.0/40 12-10-18
14: Delfi 5.4 19.0/40 13-15-12
15: ProDeo 1.85 15.5/40 9-18-13 |
наконец, пробуем напрямую воспроизвести стиль Fizbo на CM10, сдвигая ОФ
;---- CM10 Fizbo.txt
cm_parm opp=107 opn=102 opb= 98 opr=105 opq=110
cm_parm myp=110 myn=102 myb= 98 myr=108 myq=113
cm_parm mycc= 90 mymob=110 myks= 70 mypp=150 mypw=120
cm_parm opcc= 90 opmob=110 opks= 70 oppp=150 oppw=120
cm_parm cfd=0 sop=100 avd=-7 rnd=0 sel=21 md=99
;---- File end
01: CM10 Fizbo 186.5/560 ········
02: Rybka 1.0 Beta 31.5/40 27-4-9
03: Fruit 2.2.1 31.0/40 27-5-8
04: Ktulu 9 30.5/40 26-5-9
05: Jonny 4.00 29.0/40 24-6-10
06: Glaurung 2.2 JA 27.5/40 23-8-9
07: Chess Tiger 2007.1 26.5/40 20-7-13
07: Naum 2.0 26.5/40 18-5-17
07: Delfi 5.4 26.5/40 22-9-9
10: SmarThink 1.20 26.0/40 23-11-6
11: Shredder 9.1 25.5/40 21-10-9
11: Hiarcs 10 25.5/40 19-8-13
13: Junior 10.1 25.0/40 20-10-10
14: Alaric 707 22.0/40 17-13-10
15: ProDeo 1.85 20.5/40 16-15-9 |
|
|
|
номер сообщения: 54-31-5833 |
|
|
|
сводные данные в порядке убывания набранных очков
зеленым выделены персоналии с пониженной, относительно дефолтной, ничейностью, красным - персоналии с повышенной ничейностью
CM11 Factor– 1x 234,5/560 +124(22,14%) -215(38,39%) =221(39,46%)
CM10 Default 226,5/560 +147(26,25%) -254(45,36%) =159(28,39%)
CM10 Factor– 1x 216,0/560 +113(20,18%) -241(43,04%) =206(36,79%)
CM10 Factor+ 2x 213,0/560 +145(25,89%) -279(49,82%) =136(24,29%)
CM10 Factor+ 1x 210,5/560 +142(25,36%) -281(50,18%) =137(24,46%)
CM10 Factor– 2x 205,5/560 +124(22,14%) -273(48,75%) =163(29,11%)
CM10 Fizbo 186,5/560 +116(20,71%) -303(54,11%) =141(25,18%) |
выводы завтра |
|
|
номер сообщения: 54-31-5834 |
|
|
|
итак, контемпт вообще не трогался, для первых двух пар персоналий ОФ сдвигалась в противоположные стороны двумя разными способами, и в обоих случаях получены "расслоения" результативности за счет изменения процента ничьих
1) во всех этих случаях сдвиг ОФ привел к снижению силы на ~15-30 пунктов
2) персоналии с повышенной ничейностью (CM10 Factor– 1x и CM10 Factor– 2x) показали вместе даже чуть меньший результат - 421,5 очков, чем персоналии с пониженной ничейностью (CM10 Factor+ 1x и CM10 Factor+ 2x) - 423,5 очков
в отличие от ситуации, когда мы сдвигаем контемпт в отрицательную зону, повышаем процент ничьих и повышаем сопротивляемость более сильным соперникам, здесь такого результата нет - идет практически одинаковое (в рамках погрешности) снижение силы при выходе с оптимальных настроек ОФ как для сдвига в сторону повышения ничейности, так и наоборот
(важно, что при таких сдвигах ОФ не происходит относительного снижения силы более результативных настроек против более сильных соперников, как в случае, если бы мы сдвигали контемпт в положительную область)
3) перенос настроек Factor– 1x с CM10 на более сильный CM11, повторил эффект увеличения ничейности, и далее, сравнение результатов сильнейшей ничейной персоналии CM11 Factor– 1x с сильнейшей результативной персоналией CM10 Factor+ 2x, показывает, что хотя последняя слабее на ~30 пунктов, одержала 145 побед против 124 побед более сильной и ничейной персоналии!
повторяет ли это эффект Fizbo? - внешне воспроизводит и показывает, откуда от в принципе может взяться, но внутренне, думаю, причина его все же не в намеренной деоптимизации ОФ с целью получения желаемого стиля, а в перекосе ОФ на уровне параметров
такой вывод напрашивается из сравнения стиля оригинала с персоналией-имитацией CM10 Fizbo - при достижении возможного внешнего сходства стилей (в т.ч. с эффектом понижения ничейности), внутреннего сходства на уровне "мозгов" нет, в CM10 просто нет всех тех эвристик и позиционных факторов, что ввел автор в оригинальный Fizbo, и в этом, пмм, ключ к ответу - сила CM10 Fizbo упала ан 50+ пунктов относительно дефолтных настроек, такова цена внешней имитации стиля, при том, что в оригинальном Fizbo оптимизация на навороченной ОФ с акцентами, в частности, на активной игре короля и изумительных проходных, ни к какому снижению силы приводить не должна, хотя стиль сдвигается
и при сравнении результативности с движками без такого сдвига или со сдвигом в сторону ничейности (например из-за дополнительного внимания на уровне параметров ОФ по защите короля) мы будем получать как раз то, что получаем при сравнении Fizbo с движками с повышенной ничейностью (Fire и Shredder) |
|
|
номер сообщения: 54-31-5840 |
|
|
|
Из всех из них вроде бы самый drawmaster это Fire. Причём мне кажется, что это связано с тем, что это же движок из семейства Robolitto, как и Gull, который тоже считался мастером ничьих. |
|
|
номер сообщения: 54-31-5841 |
|
|
|
мысли о связи с ипполитообразностью да, возникают
еще Ginkgo и Booot с высокой ничейностью |
|
|
номер сообщения: 54-31-5842 |
|
|
|
здесь тестируется Wasp 2.5, надеюсь увидим в TCEC 10 и в свободном доступе |
|
|
номер сообщения: 54-31-5843 |
|
|
|
Jeweller: здесь тестируется Wasp 2.5, надеюсь увидим в TCEC 10 и в свободном доступе |
Ну Wasp в числе участников TCEC, так что увидим 2.5 или почти 2.5 (дедлайн чуть раньше был). |
|
|
номер сообщения: 54-31-5844 |
|
|
|
Неофициальный чемпионат мира среди компьютерных программ стартовал:
TCEC Сезон 10 |
|
|
номер сообщения: 54-31-5845 |
|
|
|
http://tcec.chessdom.com/archive.php?se=10&st=1&ga=2
Стокфиш зарабатывает первую победу в TCEC 10, причём не самый слабый противник был - Chiron :) |
|
|
номер сообщения: 54-31-5846 |
|
|
|
Уже некоторые проблемы выплыли с lower-tier движками - Arasan крашнулся, а у Laser поломан SMP и он играет на 2000k nps на 22 ядрах (у стокфиша где-то 25m, у Гудини - 30m, сам Laser имел в прошлом сезоне 10-14, очень печально, т.к. на одном ядре прогресс с прошлого сезона в районе 300 эло почти и я ждал от него не самых плохих игр). То же и у Nemorino - проблемы с мультипроцессингом. А Fizbo чёрными уступил Texel, причём какие-то у него явные проблемы тоже есть с логикой - скачки оценки между 0.00 и +50 вряд ли были задуманы автором. |
|
|
номер сообщения: 54-31-5847 |
|
|
|
Баадур Джобава считает, что эта партия - претендент на партию года. |
|
|
номер сообщения: 54-31-5849 |
|
|
|
Вы хоть контекст приводите, а то я не сразу сообразил, в чём дело (:
https://www.facebook.com/baadur.jobava/posts/10213951699404091?pnref=story
А вообще и из прошлого TCEC можно было набрать немало партий, которые вполне могли бы претендовать на "партию года". Но партии движков туда обычно не пускают |
|
|
номер сообщения: 54-31-5850 |
|
|
|
Очень красивая комбинация, даже жаль, что всё ради того, чтобы перейти в выигранный ладейник
http://tcec.chessdom.com/archive.php?se=10&st=1&ga=46
На один момент у белых не хватало ферзя и качества :) |
|
|
номер сообщения: 54-31-5864 |
|
|
|
|
|
|
|
|
Copyright chesspro.ru 2004-2024 гг. |
|
|
|