|
|
|
|
|
|
|
|
|
|
Rom77: mesh67, хотя игра движка с самим собой не самый хороший метод тестирования из-за обилия ничьих, попробуйте ещё более скоростную версию Стокфиша - asmFish. Рекомендую версию от 22 мая, как наиболее проверенную, но возможно сойдет и последняя, от 10 июля. Компиляция bmi2 быстрее, но если не запустится, то используйте popcnt. |
Попробую взять asmFish вместо Стока для анализа движками следующей партии из цикла "партии прошлого", эксперимент)
По версии от 10 июля есть тесты, что она сильнее версии от 22 мая? |
|
|
номер сообщения: 54-31-5662 |
|
|
|
Jeweller: Попробую взять asmFish вместо Стока для анализа движками следующей партии из цикла "партии прошлого", эксперимент)
По версии от 10 июля есть тесты, что она сильнее версии от 22 мая? |
Поскольку у официального Стокфиша с тех пор прошло уже несколько улучшений, то и asm также должен быть сильнее. Теоретически. Но учитывая количество багов, которое отлавливают авторы asm, то не факт.
Про тесты или анализ в режиме Multi-PV ничего сказать не могу. |
|
|
номер сообщения: 54-31-5663 |
|
|
|
Rom77: Про тесты или анализ в режиме Multi-PV ничего сказать не могу. |
Спасибо. У меня всегда MultiPV = 1, т.к. разброс результатов анализа от раза к разу мне нужен минимальный.
С asm кажется не получится, смотрю он весь 64-битный, не пойдет у меня( |
|
|
номер сообщения: 54-31-5664 |
|
|
|
Jeweller: Rom77: Про тесты или анализ в режиме Multi-PV ничего сказать не могу. |
Спасибо. У меня всегда MultiPV = 1, т.к. разброс результатов анализа от раза к разу мне нужен минимальный.
С asm кажется не получится, смотрю он весь 64-битный, не пойдет у меня( | Если Вы занимаетесь анализами на очень длинном времени, то разницы между асм и обычной версией почти нету - чем больше времени, тем меньше эти 15% скорости решают. |
|
|
номер сообщения: 54-31-5665 |
|
|
|
Vizvezdenec: Если Вы занимаетесь анализами на очень длинном времени, то разницы между асм и обычной версией почти нету - чем больше времени, тем меньше эти 15% скорости решают. |
Вы правы, да и анализ то на глубину идет, а не на время, и небольшой выигрыш во времени не прибавит качества если коды идентичны, как-то не сообразил сразу |
|
|
номер сообщения: 54-31-5666 |
|
|
|
Jeweller: Vizvezdenec: Если Вы занимаетесь анализами на очень длинном времени, то разницы между асм и обычной версией почти нету - чем больше времени, тем меньше эти 15% скорости решают. |
Вы правы, да и анализ то на глубину идет, а не на время, и небольшой выигрыш во времени не прибавит качества если коды идентичны, как-то не сообразил сразу | Ну я уже писал по этому поводу пару страниц назад - чемпион мира по переписке 2016 использует Stockfish dev, т.к. он более оттестирован, а бонус скорости от asm нивелируется на таком времени большим числом багов и более долгим внесением изменений. |
|
|
номер сообщения: 54-31-5667 |
|
|
|
Эту настройку сделал несколько лет назад, не променяю на сотню движков. Из-за большого дисбаланса сильно ослаблена относительно дефолтных настроек, практическая сила в районе ~2500 Elo. Стиль - атакующий, бешеный. В полнолуния выдает комбинационные шедевры.
Spark 1.0 RGN (Rashid Gibiatovich Nezhmetdinov)
Настройки конфигурации:
mobility - 50
passedpawns - 150
pawnstructure - 75
kingattack - 500 |
Скачать Spark 1.0 |
|
|
номер сообщения: 54-31-5668 |
|
|
|
Jeweller: mesh67: мне хочется просто сравнить силу игры двух программ на Арене, не копаясь в настройках. |
Если в Арене, то
1) возьмите контроль с добавление не меньше секунды, с основным телом времени
50-100с, например контроль 60с+1с подойдет
2) поставьте обоим движкам хорошую книжку для тестирования, например HS-7moves
3) наиграйте 1000 партий |
Спасибо, но на тысячу партий у меня точно терпения не хватит. Буду верить на слово :) |
|
|
номер сообщения: 54-31-5669 |
|
|
|
mesh67: Jeweller: mesh67: мне хочется просто сравнить силу игры двух программ на Арене, не копаясь в настройках. |
Если в Арене, то
1) возьмите контроль с добавление не меньше секунды, с основным телом времени
50-100с, например контроль 60с+1с подойдет
2) поставьте обоим движкам хорошую книжку для тестирования, например HS-7moves
3) наиграйте 1000 партий |
Спасибо, но на тысячу партий у меня точно терпения не хватит. Буду верить на слово :) | Ну не обязательно верить нам, можно верить разрабам стока, которые гоняют пакеты по 40000 партий |
|
|
номер сообщения: 54-31-5670 |
|
|
|
Не прошло и года!!!
Главное событие 2017 в плане турнира движков, оно же TCEC season 10, анонсировано 30 минут назад! |
|
|
номер сообщения: 54-31-5671 |
|
|
|
Vizvezdenec: Не прошло и года!!!
Главное событие 2017 в плане турнира движков, оно же TCEC season 10, анонсировано 30 минут назад! | УУУРРРРАААААА!!!!! |
|
|
номер сообщения: 54-31-5672 |
|
|
|
Vizvezdenec: Не прошло и года!!!
Главное событие 2017 в плане турнира движков, оно же TCEC season 10, анонсировано 30 минут назад! |
Ждем массового обновления версий и фантастической игры, раздвигающей границы известного |
|
|
номер сообщения: 54-31-5673 |
|
|
|
Jeweller: Vizvezdenec: Не прошло и года!!!
Главное событие 2017 в плане турнира движков, оно же TCEC season 10, анонсировано 30 минут назад! |
Ждем массового обновления версий и фантастической игры, раздвигающей границы известного |
На самом деле мне было бы интересно, если бы в турнире поучаствовали Stockfish 6/Komodo 8 какие-нибудь вне конкурса. Смогли бы они пройти в 3 стадию, например? В прошлом году рыбка смогла, хоть и на грани, но в 3 стадии и рыбка, и Gull плелись в хвосте. |
|
|
номер сообщения: 54-31-5674 |
|
|
|
номер сообщения: 54-31-5675 |
|
|
|
Кстати по поводу Fizbo, вот индивидуальная статистика от Stefan Pohl. Несложно видеть, что, имея по этому рейтингу на 30~ эло меньше, чем Shredder, этот движок, тем не менее, имеет примерно в 1,5 раза больше побед над топовой троицей. |
|
|
номер сообщения: 54-31-5676 |
|
|
|
Vizvezdenec: Кстати по поводу Fizbo, вот индивидуальная статистика от Stefan Pohl. Несложно видеть, что, имея по этому рейтингу на 30~ эло меньше, чем Shredder, этот движок, тем не менее, имеет примерно в 1,5 раза больше побед над топовой троицей. |
в продолжение разговора выше о разном проценте очков разных движков в игре с соперниками ниже и выше, для себя ввел такое условное понятие, как "широкая и узкая диаграмма направленности", или "широкополосный" и "узкополосный" движок - по аналогии с антеннами, обладающими разной степенью широкополосности, в результате чего одни принимают широкий диапазон частот (широкополосные), а другие (узконаправленные, с узкой диаграммой направленности) "узкорезонируют" на близкую к своей частоту
Комодо, к примеру, - узкополосный движок, с "узкой диаграммой направленности", повышен процент вырубания всего что ниже, понижен процент сопротивления всему что выше, в результате в тесте на группе со средним рейтингом ниже (как сейчас), реальная сила завышается
в будущем, по мере выравнивания среднего рейта тестовой группы с собственным, будет снижаться до реальной
а Fizbo в такой терминологической шкале - пример широкополосного движка, с "широкой диаграммой направленности", понижен процент вырубания всего что ниже, но зато повышен процент сопротивления всему что выше (и существенно больше побед над соперниками сильнее)
также и к людям может быть применено |
|
|
номер сообщения: 54-31-5677 |
|
|
|
Jeweller:
а Fizbo в такой терминологической шкале - пример широкополосного движка, с "широкой диаграммой направленности", понижен процент вырубания всего что ниже, но зато повышен процент сопротивления всему что выше (и существенно больше побед над соперниками сильнее)
|
А я бы не был так уверен :)
Потому что % набранных очков-то ниже, чем у Shredder.
Вот, например, со Stockfish у Fizbo перформанс на -240 эло, у Shredder -223
С Комодо 208 и 199
С Гудини 203 и 179. На самом деле от 24 эло разницы в рейтинге/28 в личной встрече не сильно отличается. Просто Fizbo существенно больше выигрывает и больше проигрывает, даже если брать по числу побед и поражений над остальными 4 движками - у Shredder побед 477, у Fizbo 521, а вот поражений 1773 против 2002. Интересно было бы на таком поле результаты Fire посмотреть, т.к. по моему мнению на основе TCEC и разных рейтингов и турниров, среди группы движков второго тира он - самый "сушащий". |
|
|
номер сообщения: 54-31-5678 |
|
|
|
Vizvezdenec: А я бы не был так уверен :) | вот так хочешь быть проще, как завещал нам великий Будда, а не получается)
одной узко-широко-полостностью все многообразие наблюдаемых нами явлений не объясняется!
надо дополнить второй шкалой - степенью расслоения:
--->слабое расслоение - результаты концентрируются относительно "среднего" результата - ничьей
--->сильное расслоение - результаты расслаиваются на "либо пан, либо пропан"
чуть выше уже как раз по поводу Fizbo об этом говорил
и тогда более точно характеризовать его как движок с некоторым сдвигом в сторону широкополостности (очень умеренным сдвигом) + с достаточно сильным расслоением (относительно среднего) |
|
|
номер сообщения: 54-31-5679 |
|
|
|
но,
"расслоение" и "широкополостность" (в общем случае) связаны
одно влияет на другое в той или иной степени для разных движков и людей
как? - не волне ясный для меня вопрос |
|
|
номер сообщения: 54-31-5680 |
|
|
|
Ну я поэтому несколько и заостряю на нём внимание, т.к. остальные движки более чётко вписываются в концепцию "больше ничьих-сильнее играю против сильных-слабее против слабых".
А тут получается "мало ничьих-еле-еле сильнее играю против сильных-против слабых примерно так же", что является весьма необычным сочетанием. |
|
|
номер сообщения: 54-31-5681 |
|
|
|
эксперимент нужен, к счастью времени не требует, поставил и забыл
возьму
1) Spark 1.0 RGN (спекулятивные веса ОФ + хорошая тактика)
2) специально подготовленную персоналию CM с завышенной стоимостью своих фигур и примерной силой как у Spark 1.0 RGN
3) контрольную группу движков со стандартными настройками со средним рейтом примерно как у двух движков выше
Арена, контроль 1'+1", книжка у всех HS-7moves, таблицы включены (у кого они есть)
длину теста и число движков в контрольной группе пока назвать не могу
посмотрим, насколько похожим/непохожим Fizbo будет эффект |
|
|
номер сообщения: 54-31-5682 |
|
|
|
Детали TCEC 10. Начало в начале октября/конце сентября. |
|
|
номер сообщения: 54-31-5683 |
|
|
|
"Вот это мой размерчик"
4 процессора. 112 ядер. 275 миллионов позиций в секунду. Наконец-то кто-то обставил Дип Блю. |
|
|
номер сообщения: 54-31-5684 |
|
|
|
Rom77: "Вот это мой размерчик"
4 процессора. 112 ядер. 275 миллионов позиций в секунду. Наконец-то кто-то обставил Дип Блю. |
Стоит отметить всё-таки, что это весьма бесполезно, т.к. прирост эло между 16 и 32 ядрами составляет уже 1-3 эло, а дальше он так и вовсе символический. Lazy SMP хорош, но не настолько, а он используется во всех движках (конечно, это всё равно лучше YBWC, который дальше 8 ядер давал 0 прироста толком). Возможно, какую-то пользу из этого может извлечь Jonny, хоть и маловероятно - там сделан алгоритм работы на нескольких распределённых компьютерах, который позволяет играть на 2400 ядрах одновременно, но большого прироста силы он тоже не даёт (кстати, я думаю, Deep Blue на 2400 ядрах он легко обставит ). |
|
|
номер сообщения: 54-31-5685 |
|
|
|
Jeweller: посмотрим, насколько похожим/непохожим Fizbo будет эффект | оказалось, что "убить сразу двух зайцев" и совместить в одном эксперименте Spark 1.0 RGN и спец версию CM, невозможно - короткие тесты на специально подобранной группе движков показали, что я сильно занижал практическую силу Spark 1.0 RGN
эта персоналия бешеного таранного типа играет не на ~2500, как получал по старым тестам с низкой степенью корректности, а на ~2750-2800 !! (очень предварительно)
и нет возможности сделать под нее персоналию CM равной силы, CM играют намного слабее
это хорошая новость, т.к. позволила построить схему теста намного изящнее, и в чистом виде замерить эффект от двух вариантов изменения настроек, и схожести его с "эффектом Fizbo"
1 тест с CM10, 2 тест со Spark 1.0
схема 1 теста:
берутся 3 персоналии CM10 с силой ~2650:
1) CM10 Default - дефолтные настройки
2) CM10 Factor+ 1x - стоимость своих фигур увеличена, с одновременной "компенсацией" в сторону атаки
3) CM10 Factor– 1x - стоимость своих фигур уменьшена, с одновременной "компенсацией" в сторону защиты
каждая из трех персоналий независимо тестируется на контрольной группе старых добрых движков с разнообразным стилем, в интервале силы 2700-2820, и средней силой ~2765-2770
01 Rybka 1.0 Beta
02 Ktulu 9
03 Jonny 4.00
04 Glaurung 2.2 JA
05 SmarThink 1.20
06 Fruit 2.2.1
07 Hiarcs 10
08 Shredder 9.1
09 Junior 10.1
10 ProDeo 1.85
11 Chess Tiger 2007.1
12 Naum 2.0
13 Delfi 5.4
14 Alaric 707
длина теста - 40 кругов, 560 партий для каждой персоналии
сравниваем
затем очищаем от экстремумов, убираем для каждой персоналии два движка с лучшим показателем побед, и два движка с худшим - сравниваем еще раз |
|
|
номер сообщения: 54-31-5686 |
|
|
|
Vizvezdenec: Стоит отметить всё-таки, что это весьма бесполезно, т.к. прирост эло между 16 и 32 ядрами составляет уже 1-3 эло, а дальше он так и вовсе символический. Lazy SMP хорош, но не настолько, а он используется во всех движках (конечно, это всё равно лучше YBWC, который дальше 8 ядер давал 0 прироста толком). Возможно, какую-то пользу из этого может извлечь Jonny, хоть и маловероятно - там сделан алгоритм работы на нескольких распределённых компьютерах, который позволяет играть на 2400 ядрах одновременно, но большого прироста силы он тоже не даёт (кстати, я думаю, Deep Blue на 2400 ядрах он легко обставит ). |
Да, верно. На сей счет существует теоретический предел производительности, описываемый законом Амдала. У Lazy SMP реальный прирост производительности оказался просто превосходным:
1,9-кратным на 2-х ядрах;
3,5-кратным на 4-х ядрах;
6-кратным на 8-ми ядрах.
Для современных движков, в основе которых лежит последовательный (а значит трудно распараллеливаемый) алгоритм альфа-бета, такой результат просто невероятен.
Но, самое главное - оказалось, что эти числа идеально ложатся на кривую закона Амдала для 95-процентной доли параллельных вычислений. А значит, если этот закон справедлив для малого числа ядер в левой части графика (см. ниже), то он скорее всего справедлив и для большего числа ядер/процессоров. И только если в будущем удастся добиться лучшей распараллеливаемости, то можно будет рассчитывать на какой-то прогресс:
|
|
|
номер сообщения: 54-31-5687 |
|
|
|
Тут небольшой интересный трюк, т.к. Lazy SMP даёт 100% speedup, но при этом многие узлы просчитываются по несколько раз.
В итоге что выходит... Тут ось y графика корректнее обозвать не "speedup", а "elo gain converted to speedup", причём чем больше временной контроль, тем по идее меньше эло дают бонусные процессоры с текущими алгоритмами распараллеливания.
Кстати, если тест от 2016 года, то он должен давать несколько заниженные результаты по сравнению с реальностью, т.к. небольшие улучшения SMP были с того времени. http://tests.stockfishchess.org/tests/view/586722690ebc5903140c636d |
|
|
номер сообщения: 54-31-5688 |
|
|
|
Vizvezdenec: Тут небольшой интересный трюк, т.к. Lazy SMP даёт 100% speedup, но при этом многие узлы просчитываются по несколько раз.
В итоге что выходит... Тут ось y графика корректнее обозвать не "speedup", а "elo gain converted to speedup", |
Я заметил, что термин "speedup" многие понимают по разному. Так что да, нужно быть очень аккуратным, чтобы не появилось разночтений.
Vizvezdenec: Тут ось y графика корректнее обозвать не "speedup", а "elo gain converted to speedup", причём чем больше временной контроль, тем по идее меньше эло дают бонусные процессоры с текущими алгоритмами распараллеливания. |
При добавлении времени не только бонусные процессоры дают меньше эло, но и обычный нераспараллеленный перебор. Поэтому их отношение может оставаться постоянным.
Тест для Стокфиша 8 (кстати, ссылка у меня почему-то не открывается).
__________________________
не надо шутить с войной |
|
|
номер сообщения: 54-31-5689 |
|
|
|
Нужно убрать www, я его не писал Суть в том, что там 1 патч несколько улучшил распараллеливание по сравнению с SF8. |
|
|
номер сообщения: 54-31-5690 |
|
|
|
Начался тест последних патчей Стокфиша. Тестирование производится против старого Стокфиша 7. 10 тысяч партий, 2 потока:
nextchessmove.com |
|
|
номер сообщения: 54-31-5692 |
|
|
|
|
|
|
|
|
Copyright chesspro.ru 2004-2024 гг. |
|
|
|