|
|
|
|
|
|
|
|
|
|
Вообще там в комментариях указали интересную и вероятную причину настолько сильных различий в значениях ценностей фигур-возможно, это связано с тем, что шахматисты сдаются раньше, чем шахматные программы, которых очень многие заставляют доигрывать партии до мата/табличных эндшпилей с оценками за 100. Не исключено, что если это учесть, различия будут меньше. |
|
|
номер сообщения: 54-31-5146 |
|
|
|
Ну давайте помотрим:
0) Кто как ставит играть движки не важно, важны только настройки, на которых считал для них веса автор. А он наверняка заставлял играть движки до упора, иначе эксперимент не чист.
1) Теперь заставим играть движки не до упора. Это как-нибудь разожмет сжатые человеческие веса? Никак, абсолютно :)
2) Это сожмет веса движков? Немного сожмет. Почему немного, а не до человечесвких? CM8 Human играет иначе(по человечески) сразу, иммитация человеческого стиля сразу, значит как минимум дебют и миттельшпить неплохо иммитируются. Но своему собрату с нормальными весами фигур он проигрывает. Значит, используемые сжатые веса (человеческие веса) не оптимальны.
3) Теперь сравним Карлсена и Ананда. Карлсен играет в среднем дольше Ананда, и нередко до самого упора, но веса фигур у него практически те же, не разжаты. Вот белковый игрок, играющий долго, веса практически не разживаются.
4) Смотрим на Андерсона. У него наоборот, много коротких партий, но веса у него полностью разжаты. |
|
|
номер сообщения: 54-31-5147 |
|
|
|
Ну вообще сам автор в комментариях говорит, что его модель сходится для, например, Морфи, к абсурдным значениям-отрицательной стоимости коня. Значит матмодель не вполне корректна, видимо
Во-вторых тут делается единая ценность материала для всей игры, что не так в любом современном движке. Матмодель, на основе которой вычислены стоимости фигур, этого никак не учитывает. Весьма вероятно, что это достаточно сильно влияет на собственно стоимость.
А СМ8 Human проигрывает по множеству причин, я думаю, и неоптимальные веса-лишь одна из них. Вообще эти веса даже у топовых программ разные. Как там сам автор статьи говорит - оценочные функции позиции и даже веса фигур плотно увязаны на принципы работы альфа-бета отсечения и функция вроде сила программы в зависимости от весов фигур и от степени отсечения перебора может иметь сколько угодно экстремумов. Поэтому можно иметь разные веса, чуть разные алгоритмы альфа-бета отсечения и получать равные по силе игры движки, только несколько стилистически различные.
Пример стоимостей от стокфиша в 1/256 пешки:
Midgame: 198, 817, 836, 1270, 2521
Endgame: 258, 846, 857, 1278, 2558
У Комодо в 2012 было вот так:
Opening
600 3100 3225 4350 9100
Ending
925 3100 3225 5475 9700
Разница очевидна в общем-то
При этом стокфиш более агрессивно отсекает лишние ветки и вообще из топовых движков самый агрессивный в плане pruning и его веса фигур на это завязаны, как и у любых других движков. Возможно, что наличие syzygy - таблиц тоже как-то влияет на веса фигур в Endgame, но тут я не уверен.
Это я всё к чему-чтиво, безусловно, любопытное. Я думаю, заниженная стоимость фигур у людей возникает из-за того, что они гораздо чаще, чем компы, жертвуют материал за сомнительную компенсацию+более ясную игру, тогда как противнику надо вести точную защиту, с чем любой движок, разумеется, справится лучше человека. Но факт и в том, что сама модель не вполне математически и логически корректна и может рассматриваться только как первое приближение, не более того. |
|
|
номер сообщения: 54-31-5148 |
|
|
|
Vizvezdenec: А СМ8 Human проигрывает по множеству причин, я думаю, и неоптимальные веса-лишь одна из них. | Имел в виду, проигрывает СМ8 Дефолтному, т.е. эксперимент чистый, все остальное кроме весов одинаково. На нескольких других движках с возможностью менять веса, так же, смотрел. В СМ8, кроме того, как и во всей серии СМ, веса постоянны для всех стадий, старые движки :)
Пример стоимостей от стокфиша в 1/256 пешки:
Midgame: 198, 817, 836, 1270, 2521
Endgame: 258, 846, 857, 1278, 2558
У Комодо в 2012 было вот так:
Opening
600 3100 3225 4350 9100
Ending
925 3100 3225 5475 9700
Разница очевидна в общем-то | Здесь интересно, что стоимость пешки ближе к концу повышается, а у людей она уже повышена, по результатам простой модели Медведева. Т.е. аргумент "люди раньше заканчивают, поэтому", снова не проходит - играли бы дольше, стоимость пешки, и соответственно сжатие, стало бы еще больше.
Но факт и в том, что сама модель не вполне математически и логически корректна и может рассматриваться только как первое приближение, не более того. | Да, согласен, простая модель может искажать, и раз вышла осечка с Морфи, точно искажает, есть пример)
Другое дело, само сжатие. Экспериментируя с CM давно (лет 10-15), заметил задолго до выхода статьи - сжатие весов приводит к очеловечиванию стиля в том смысле, как играют сейчас. Если мы хотим добиться имитации романтической игры середины 19в, наоборот, стоимость пешки надо занижать. Кстати, здесь может быть разгадка фокуса с Андерсеном. Сжатие весов, присущее в среднем человеку, наложилось у него на специфический романтический стиль со снижением веса пешки. И в среднем (так удачно совпало) вышло близко к оптимуму |
|
|
номер сообщения: 54-31-5149 |
|
|
|
Возможно, что и так.
А возможно, что веса фигур Андерсена-некая ошибка мат модели, как у Морфи, только в другую сторону. Автор предполагает, что модель по Морфи сбоит из-за малого количества партий+множества игр на фору, ну так у Андерсена тоже не слишком много партий записанных (по сравнению с современными шахматистами). |
|
|
номер сообщения: 54-31-5150 |
|
|
|
Хотя, если взглянуть на персоналии CM, для многих имитаций мастеров прошлого веса не сжаты, сжаты только для каждого пятого примерно. Среди "сжатых" Капабланка, Нимцович, Стейниц, Ботвинник, Решевский, Рубинштейн...
В целом, тенденция к сжатию у исторических персон есть, разжат кажется только Блэкберн.
В ProDeo зависит от персоны, стандартная настройка самого движка 100-300-320-480-1000. Для Каспарова и Ананда, стоимость пешки снижена до 95, т.е. наоборот - разжали шкалу. Для Алехина и Карпова соотношения не меняли. Для Таля снизили веса коней и слонов.
Интересно было бы посмотреть на настройки Crafty Classic 2004, но они к сожалению скрыты. Там старались добиться совпадения ходов персоналий с ходами оригиналов из реальных партий.
Интересны также различия Rybka 3 Human и обычной Rybka 3, но скрыто. Васик старался имитировать человеческий стиль, но чтобы раскрывал настройки, не слышал. |
|
|
номер сообщения: 54-31-5151 |
|
|
|
Vizvezdenec: А возможно, что веса фигур Андерсена-некая ошибка мат модели, как у Морфи, только в другую сторону. Автор предполагает, что модель по Морфи сбоит из-за малого количества партий+множества игр на фору, ну так у Андерсена тоже не слишком много партий записанных (по сравнению с современными шахматистами). | Да, вполне может быть.
Нет сомнений, что рано или поздно подобное исследование будет сделано более тщательно, и по лучшей модели. Лучше бы "рано", интересное дело. |
|
|
номер сообщения: 54-31-5152 |
|
|
|
А что насчет Giraffe? У него человекоподобный стиль игры? Кто-нибудь может оценить? Он же тренирован на человеческих партиях. Кроме того, его нейросетка вроде бы по определению должна быть гибче обычных таблиц параметров оценки у других движков.
Аналогично в игре го, сейчас для получения человекообразного стиля игры просто тренируют нейросети движков по базам партий людей. Причем если нужно получить скажем игрока уровня первого разряда, то тренируют сетку по базе партий игроков именно этого уровня. И вроде бы получается.
Наверно и в шахматах такое возможно. Мне по крайней мере кажется, что для знающего человека тренировать нейросеть будет проще, чем подбирать отдельные параметры. И результат должен получиться лучше, при должном умении. На низовом уровне, так по-моему такой подход просто необходим, потому что тот же Чессмастер, например, несмотря на все попытки, за слабых персонажей играет совсем не по-человечески. |
|
|
номер сообщения: 54-31-5153 |
|
|
|
Rom77: тот же Чессмастер, например, несмотря на все попытки, за слабых персонажей играет совсем не по-человечески. | Да, но при этом он это делает намного лучше, чем например, Ufim :) Давно пришел к выводу, что лучше брать слабые движки нужного уровня игры, чем ослаблять сильные.
Мне по крайней мере кажется, что для знающего человека тренировать нейросеть будет проще, чем подбирать отдельные параметры. | Для всех сильных, ручной подборки давно нет, все на автомате, человек вообще туда не лезет.
А что насчет Giraffe? У него человекоподобный стиль игры? Кто-нибудь может оценить? Он же тренирован на человеческих партиях. | Можно попробовать сравнить Жирафа с CM8 Human. Но если бы у него был человеческий или какой-то особо интересный стиль, об этом бы говорили, как о легендарном Phalanx, например. Где сразу в один голос - очень человеческий и очень интересный стиль, атаки на короля прекрасны и т.п.
Что касается тренировки, не очень много знаю про этот движок, но вроде он тренирован на комп партиях из CCRL, и основная тренировка на самом себе, про партии людей ничего не слышал:
Собственно, "обучается" оптимизируется ОФ, движок не учится с нуля, как делать ходы и т.д., он это уже все умеет. Оптимизация ОФ дает пару сотен пунктов. |
|
|
номер сообщения: 54-31-5154 |
|
|
|
Провел 4 партии CM8 Human - Giraffe 20161023, движки примерно равны, матч выиграл CM8 Human 2,5-1,5. Первые 2 партии играли с книжкой, потом без.
У Жирафа сильно сдвинутая ОФ. В начале партий он показывает +1,2 в пользу белых, потом поправляется. Стиль довольно агрессивный, рисковый, совершенно не человеческий. Несколько раз за партию впадает в паранойю, начиная оценивать совершенно неадекватно, за что бывает наказан, но иногда ему сходит с рук с равным соперником. Явно переоценивает превращение пешек (4-я партия).
Вот характерные оценки, 1 партия, оценки Giraffe синие, полный неадекват:
3 партия, оценки Giraffe синие:
4 партия, оценки Giraffe зеленые, CM8 Human спокойно отдал материал и ушел на ничью, Giraffe до конца считает что у него выиграно, показывает оценку +5-6:
3-я партия, Giraffe без книжки сам идет в сицилианку, много мы знаем таких движков?
CM8 Human начинает движение пешкой f, и красиво матует. Giraffe пропускает атаку белых, некоторое время еще не понимает что происходит:
[Date "2017.01.10"]
[Round "3"]
[White "CM8 Human"]
[Black "Giraffe 20161023"]
[Result "1-0"]
[ECO "B50"]
[Opening "Sicilian"]
[Variation "2.Nf3 d6 3.Nc3"]
[TimeControl "360+3"]
[WhiteType "program"]
[BlackType "program"]
1.e4 c5 2.Nf3 d6 3.Nc3 Nc6 4.d4 cxd4 5.Nxd4 g6 6.Bb5 Bd7 7.O-O Bg7 8.Be3 Nf6
9.f3 Nxd4 10.Qxd4 Bxb5 11.Nxb5 O-O 12.Qd2 a6 13.Nc3 Rc8 14.Rad1 Qc7 15.Rfe1 b5
16.Bd4 Qb7 17.Nd5 Nxd5 18.Bxg7 Kxg7 19.exd5 Rc5 20.c3 Rfc8 21.Re3 a5 22.a3 a4 23.Re2
Re8
24.f4 Kg8 25.f5 Ra8 26.Re3 Qa7 27.Kh1 Qd7 28.Rf1 Rc4 29.Rh3 Qa7 30.Qh6 Rh4
31.Rxh4 e6 32.f6 Qg1+ 33.Kxg1 Ra7 34.Qg7# {Мат} 1-0
|
|
|
номер сообщения: 54-31-5157 |
|
|
|
Оценочная функция прямо как у Jonny, видимо.
Тот тоже любит показывать какие-то +2,4 в позициях, где стокомодини показывают 0,5. |
|
|
номер сообщения: 54-31-5158 |
|
|
|
Jeweller: Да, но при этом он это делает намного лучше, чем например, Ufim :) Давно пришел к выводу, что лучше брать слабые движки нужного уровня игры, чем ослаблять сильные. |
Да, тоже считаю, что для каждого уровня нужен свой движок. Что касается человекообразности, то больше всего мне нравится движок из программы "Шахматы с Гарри Каспаровым". Приятно играть, правда стиль игры не сильно меняется от персонажа к персонажу.
Что касается тренировки, не очень много знаю про этот движок, но вроде он тренирован на комп партиях из CCRL, и основная тренировка на самом себе, про партии людей ничего не слышал: |
Да, точно, это я попутал. |
|
|
номер сообщения: 54-31-5159 |
|
|
|
Vizvezdenec: Оценочная функция прямо как у Jonny, видимо.
Тот тоже любит показывать какие-то +2,4 в позициях, где стокомодини показывают 0,5. | Вы имеете в виду Jonny 8 из последнего TCEC?
У меня Jonny 4.00, с CM11 Default сейчас сравнил - да, у него оценки бывают сильно завышены, до 1-1,5 пешек в паре партий. Но стиль аккуратный, адекватный, не как у Жирафа.
Кстати, у Jonny 4.00 можно менять материальные веса, дефолтные показывает 100-370-381-580-1160, они приняты за 100%. |
|
|
номер сообщения: 54-31-5160 |
|
|
|
Rom77: Приятно играть, правда стиль игры не сильно меняется от персонажа к персонажу. | На днях попробую выложить несколько разных по силе движков с персонажами. |
|
|
номер сообщения: 54-31-5161 |
|
|
|
Jeweller: Vizvezdenec: Оценочная функция прямо как у Jonny, видимо.
Тот тоже любит показывать какие-то +2,4 в позициях, где стокомодини показывают 0,5. | Вы имеете в виду Jonny 8 из последнего TCEC?
У меня Jonny 4.00, с CM11 Default сейчас сравнил - да, у него оценки бывают сильно завышены, до 1-1,5 пешек в паре партий. Но стиль аккуратный, адекватный, не как у Жирафа.
Кстати, у Jonny 4.00 можно менять материальные веса, дефолтные показывает 100-370-381-580-1160, они приняты за 100%. |
Ну я за Jonny 4 не наблюдал, видел 7.20, 7.30 и 8.00 на TCEC, там даже шутка ходила, что для получения оценки позиции стокфишем оценку джонни надо делить на 2 |
|
|
номер сообщения: 54-31-5162 |
|
|
|
Ну вообще сам автор в комментариях говорит, что его модель сходится для, например, Морфи, к абсурдным значениям-отрицательной стоимости коня. Значит матмодель не вполне корректна, видимо. |
- Мне, конечно, трудно… советовать вам, - начал он, глядя в глаза француза. - Вы чемпион… Если бы вы согласились выслушать мое мнение… Осмелюсь сказать… эта толстая штука, - Алехин показал пальцем на ладью, - она… только мешает… |
|
|
|
номер сообщения: 54-31-5163 |
|
|
|
Jeweller: Aegon 1997
Bronstein - Nimzo
Напротив Бронштейна Chrilly Donninger, автор Nimzo, который через несколько лет создаст Hydra |
Поздние версии Nimzo стали доступны и выложены здесь
NimzoWB 2000, 2000a, 2000b - Christian Donninger (WB)
~2530 Elo, тактический монстр своего времени, и сейчас превосходит многие движки в этом компоненте.
В файле настроек можно менять несколько параметров, меняя манеру игры, в частности стоимость материала (дефолтные веса 105-425-425-685-1240)
прямая ссылка - www.rwbc-chess.de/Downloads/Transfer/NimzoWB2000.zip
|
|
|
номер сообщения: 54-31-5164 |
|
|
|
Интересно, а какие движки первыми стали применять разные веса для фигур в миттельшпиле и эндшпиле? |
|
|
номер сообщения: 54-31-5165 |
|
|
|
Мне не известно, но предположу, с Рыбки все пошло. Васик тогда наворотил много нового. Стоимость слонов сделал разными. Веса (и ОФ в целом) в зависимости от стадии. Насколько помню те разговоры, когда стали разбираться, что в Рыбке внутри. |
|
|
номер сообщения: 54-31-5166 |
|
|
|
https://chessprogramming.wikispaces.com/Tapered+Eval
Нашёл вот такое, похоже, что популяризатором подхода, включающего в себя различные веса фигур для разных стадий игры, был Fruit. |
|
|
номер сообщения: 54-31-5167 |
|
|
|
O :)
Там еще говорят про The King(ЧессМастер) и Phalanx. И похоже у истоков ни Васик, ни Фабъен, а Йохан в 1991 году:
https://chessprogramming.wikispaces.com/The+King#Description
Description from Don Beal's WMCCC 1991 report:
Written by Johan de Koning, already known for his program which has competed for several years in Dutch tournaments. This latest version runs on the ARM2 RISC CPU and represents 2.5 man-years of development. The evaluation function is complex and hence a little slow. Positional scores can "easily exceed several Pawns". Separate evaluation terms are used for opening/middle/endgame with smooth transitions between them by using 3 weights which sum to 100%, giving a fuzzy definition of the phases. The search techniques include check extensions and chess-specific static rules for additional extensions. Singular extensions are not used, but lower bounds are computed to limit the search in the selective phase. Best moves from earlier iterations, history heuristic, killer heuristic, priority to captures, and a refutation table are all used to order moves, which are generated in the all-and-sort fashion. Specialized endgame knowledge is included and this is actively being expanded. |
|
|
|
номер сообщения: 54-31-5168 |
|
|
|
номер сообщения: 54-31-5169 |
|
|
|
номер сообщения: 54-31-5170 |
|
|
|
Интересно бы сейчас наоборот сделать-чтобы стокфиш на 1 ядре дал сеанс n-му количеству гроссмейстеров.
Интересно, что в 91 году у движка было 3 стадии, а сейчас во всех топовых движках их 2, подтверждая тезис Свешникова о том, что миттельшпиля нет, есть длинный дебют |
|
|
номер сообщения: 54-31-5171 |
|
|
|
Vizvezdenec: Интересно бы сейчас наоборот сделать-чтобы стокфиш на 1 ядре дал сеанс n-му количеству гроссмейстеров. |
Если грубо прикинуть, что Stockfish 8 64-bit на оном ядре примерно 3450, и сила падает на 60 пунктов при двукратном уменьшении процессорного времени, то сеанс на 1024 досках, это падение силы на 600 пунктов, до 2850.
И можно еще спокойно упасть до 2730 и сыграть сеанс с 4096 лучшими из людей |
|
|
номер сообщения: 54-31-5172 |
|
|
|
Jeweller И можно еще спокойно упасть до 2730 и сыграть сеанс с 4096 лучшими из людей |
Конечно можно, машина-то, ниже заявленного 2730 играть не будет, а люди вот, даже с 2800, иной раз могут в какой нибудь партии по силе и 2700 "выдать" |
|
|
номер сообщения: 54-31-5173 |
|
|
|
номер сообщения: 54-31-5174 |
|
|
|
Там еще говорят про The King(ЧессМастер) и Phalanx. И похоже у истоков ни Васик, ни Фабъен, а Йохан в 1991 году |
Вот он, крайний справа на фото, Johan de Koning, автор ChessMaster (The King):
Stefan Meyer-Kahlen (автор Shredder) и Johan de Koning:
|
|
|
номер сообщения: 54-31-5175 |
|
|
|
Roce 0.0390 - Roman Hartmann (UCI, 2011)
~1870 Elo
Есть возможность менять материальные веса за оба(!) цвета, что очень редко встречается в этом диапазоне силы. Дефолтные веса 100-300-300-500-950. Стиль адекватный, активный, нацелен на короля противника, ценит ферзей, любит играть. Поддерживает Chess960.
Версии 0,0390 и более ранние на сайте автора
Версия 0.0395(Win64) здесь - www.rocechess.ch/roce395.zip |
|
|
номер сообщения: 54-31-5176 |
|
|
|
"Super Tournament" от CCRL, участники-последние версии Houdini, Stockfish, Komodo, Shredder, Fizbo, Ginkgo, Fire, Nirvana, Andscacs и Chiron.
Более подробно - в теме (:
После 8 раундов положение следующее:
5.0 - Stockfish 100117 64-bit
5.0 - Houdini 5.01 64-bit
5.0 - Fizbo 1.9 64-bit
4.5 - Komodo 1788.00 64-bit
4.5 - Deep Shredder 13 64-bit
4.5 - Fire 5 64-bit
3.0 - Chiron 4 64-bit
3.0 - Nirvanachess 01102017 64-bit
3.0 - Ginkgo 1.9v 64-bit
2.5 - Andscacs 0.89070 64-bit |
|
|
номер сообщения: 54-31-5177 |
|
|
|
|
|
|
|
|
Copyright chesspro.ru 2004-2024 гг. |
|
|
|