Новости мира движков

29.10.2007 | 19:10:30

Страницы: [1] ... [35] [36] [37] [38] [39] ... [91]

1082	Jeweller 31.07.2017 \| 11:17:40 Сайт Email все его сообщения: за день, за месяц, за все время

Rom77: mesh67, хотя игра движка с самим собой не самый хороший метод тестирования из-за обилия ничьих, попробуйте ещё более скоростную версию Стокфиша - asmFish. Рекомендую версию от 22 мая, как наиболее проверенную, но возможно сойдет и последняя, от 10 июля. Компиляция bmi2 быстрее, но если не запустится, то используйте popcnt.

Попробую взять asmFish вместо Стока для анализа движками следующей партии из цикла "партии прошлого", эксперимент)
По версии от 10 июля есть тесты, что она сильнее версии от 22 мая?

номер сообщения: 54-31-5662

1083	Rom77 31.07.2017 \| 11:42:55 все его сообщения: за день, за месяц, за все время

Jeweller: Попробую взять asmFish вместо Стока для анализа движками следующей партии из цикла "партии прошлого", эксперимент)
По версии от 10 июля есть тесты, что она сильнее версии от 22 мая?

Поскольку у официального Стокфиша с тех пор прошло уже несколько улучшений, то и asm также должен быть сильнее. Теоретически. Но учитывая количество багов, которое отлавливают авторы asm, то не факт.

Про тесты или анализ в режиме Multi-PV ничего сказать не могу.

номер сообщения: 54-31-5663

1084	Jeweller 31.07.2017 \| 12:46:59 Сайт Email все его сообщения: за день, за месяц, за все время

Rom77: Про тесты или анализ в режиме Multi-PV ничего сказать не могу.

Спасибо. У меня всегда MultiPV = 1, т.к. разброс результатов анализа от раза к разу мне нужен минимальный.
С asm кажется не получится, смотрю он весь 64-битный, не пойдет у меня(

номер сообщения: 54-31-5664

1085	Vizvezdenec Ниже нуля 31.07.2017 \| 13:56:12 все его сообщения: за день, за месяц, за все время

Jeweller:

Rom77: Про тесты или анализ в режиме Multi-PV ничего сказать не могу.

Если Вы занимаетесь анализами на очень длинном времени, то разницы между асм и обычной версией почти нету - чем больше времени, тем меньше эти 15% скорости решают.

номер сообщения: 54-31-5665

1086	Jeweller 31.07.2017 \| 18:05:27 Сайт Email все его сообщения: за день, за месяц, за все время

Vizvezdenec: Если Вы занимаетесь анализами на очень длинном времени, то разницы между асм и обычной версией почти нету - чем больше времени, тем меньше эти 15% скорости решают.

Вы правы, да и анализ то на глубину идет, а не на время, и небольшой выигрыш во времени не прибавит качества если коды идентичны, как-то не сообразил сразу

номер сообщения: 54-31-5666

1087	Vizvezdenec Ниже нуля 31.07.2017 \| 18:58:07 все его сообщения: за день, за месяц, за все время

Jeweller:

Ну я уже писал по этому поводу пару страниц назад - чемпион мира по переписке 2016 использует Stockfish dev, т.к. он более оттестирован, а бонус скорости от asm нивелируется на таком времени большим числом багов и более долгим внесением изменений.

номер сообщения: 54-31-5667

1088	Jeweller 31.07.2017 \| 19:27:54 Сайт Email все его сообщения: за день, за месяц, за все время

Эту настройку сделал несколько лет назад, не променяю на сотню движков. Из-за большого дисбаланса сильно ослаблена относительно дефолтных настроек, практическая сила в районе ~2500 Elo. Стиль - атакующий, бешеный. В полнолуния выдает комбинационные шедевры.

Spark 1.0 RGN (Rashid Gibiatovich Nezhmetdinov)

Настройки конфигурации:

mobility - 50
passedpawns - 150
pawnstructure - 75
kingattack - 500

Скачать Spark 1.0

номер сообщения: 54-31-5668

1089	mesh67 01.08.2017 \| 03:41:23 все его сообщения: за день, за месяц, за все время

Jeweller:

mesh67: мне хочется просто сравнить силу игры двух программ на Арене, не копаясь в настройках.

Если в Арене, то
1) возьмите контроль с добавление не меньше секунды, с основным телом времени
50-100с, например контроль 60с+1с подойдет
2) поставьте обоим движкам хорошую книжку для тестирования, например HS-7moves
3) наиграйте 1000 партий

Спасибо, но на тысячу партий у меня точно терпения не хватит. Буду верить на слово :)

номер сообщения: 54-31-5669

1090	Vizvezdenec Ниже нуля 01.08.2017 \| 08:50:49 все его сообщения: за день, за месяц, за все время

mesh67:

Jeweller:

mesh67: мне хочется просто сравнить силу игры двух программ на Арене, не копаясь в настройках.

Спасибо, но на тысячу партий у меня точно терпения не хватит. Буду верить на слово :)

Ну не обязательно верить нам, можно верить разрабам стока, которые гоняют пакеты по 40000 партий

номер сообщения: 54-31-5670

1091	Vizvezdenec Ниже нуля 12.08.2017 \| 15:54:50 все его сообщения: за день, за месяц, за все время

Не прошло и года!!!
Главное событие 2017 в плане турнира движков, оно же TCEC season 10, анонсировано 30 минут назад!

номер сообщения: 54-31-5671

1092	KomodoLove 1873 12.08.2017 \| 18:31:14 все его сообщения: за день, за месяц, за все время

Vizvezdenec: Не прошло и года!!!
Главное событие 2017 в плане турнира движков, оно же TCEC season 10, анонсировано 30 минут назад!

УУУРРРРАААААА!!!!!

номер сообщения: 54-31-5672

1093	Jeweller 13.08.2017 \| 22:36:21 Сайт Email все его сообщения: за день, за месяц, за все время

Ждем массового обновления версий и фантастической игры, раздвигающей границы известного

номер сообщения: 54-31-5673

1094	Vizvezdenec Ниже нуля 14.08.2017 \| 18:14:49 все его сообщения: за день, за месяц, за все время

Jeweller:

Ждем массового обновления версий и фантастической игры, раздвигающей границы известного

На самом деле мне было бы интересно, если бы в турнире поучаствовали Stockfish 6/Komodo 8 какие-нибудь вне конкурса. Смогли бы они пройти в 3 стадию, например? В прошлом году рыбка смогла, хоть и на грани, но в 3 стадии и рыбка, и Gull плелись в хвосте.

номер сообщения: 54-31-5674

1095	Vizvezdenec Ниже нуля 15.08.2017 \| 08:50:58 все его сообщения: за день, за месяц, за все время

Анонсирован Гудини 6 под новый сезон TCEC

номер сообщения: 54-31-5675

1096	Vizvezdenec Ниже нуля 16.08.2017 \| 10:22:25 все его сообщения: за день, за месяц, за все время

Кстати по поводу Fizbo, вот индивидуальная статистика от Stefan Pohl. Несложно видеть, что, имея по этому рейтингу на 30~ эло меньше, чем Shredder, этот движок, тем не менее, имеет примерно в 1,5 раза больше побед над топовой троицей.

номер сообщения: 54-31-5676

1097	Jeweller 16.08.2017 \| 11:22:30 Сайт Email все его сообщения: за день, за месяц, за все время

Vizvezdenec: Кстати по поводу Fizbo, вот индивидуальная статистика от Stefan Pohl. Несложно видеть, что, имея по этому рейтингу на 30~ эло меньше, чем Shredder, этот движок, тем не менее, имеет примерно в 1,5 раза больше побед над топовой троицей.

в продолжение разговора выше о разном проценте очков разных движков в игре с соперниками ниже и выше, для себя ввел такое условное понятие, как "широкая и узкая диаграмма направленности", или "широкополосный" и "узкополосный" движок - по аналогии с антеннами, обладающими разной степенью широкополосности, в результате чего одни принимают широкий диапазон частот (широкополосные), а другие (узконаправленные, с узкой диаграммой направленности) "узкорезонируют" на близкую к своей частоту

Комодо, к примеру, - узкополосный движок, с "узкой диаграммой направленности", повышен процент вырубания всего что ниже, понижен процент сопротивления всему что выше, в результате в тесте на группе со средним рейтингом ниже (как сейчас), реальная сила завышается
в будущем, по мере выравнивания среднего рейта тестовой группы с собственным, будет снижаться до реальной

а Fizbo в такой терминологической шкале - пример широкополосного движка, с "широкой диаграммой направленности", понижен процент вырубания всего что ниже, но зато повышен процент сопротивления всему что выше (и существенно больше побед над соперниками сильнее)

также и к людям может быть применено

номер сообщения: 54-31-5677

1098	Vizvezdenec Ниже нуля 16.08.2017 \| 11:42:19 все его сообщения: за день, за месяц, за все время

Jeweller:
а Fizbo в такой терминологической шкале - пример широкополосного движка, с "широкой диаграммой направленности", понижен процент вырубания всего что ниже, но зато повышен процент сопротивления всему что выше (и существенно больше побед над соперниками сильнее)

А я бы не был так уверен :)
Потому что % набранных очков-то ниже, чем у Shredder.
Вот, например, со Stockfish у Fizbo перформанс на -240 эло, у Shredder -223
С Комодо 208 и 199
С Гудини 203 и 179. На самом деле от 24 эло разницы в рейтинге/28 в личной встрече не сильно отличается. Просто Fizbo существенно больше выигрывает и больше проигрывает, даже если брать по числу побед и поражений над остальными 4 движками - у Shredder побед 477, у Fizbo 521, а вот поражений 1773 против 2002. Интересно было бы на таком поле результаты Fire посмотреть, т.к. по моему мнению на основе TCEC и разных рейтингов и турниров, среди группы движков второго тира он - самый "сушащий".

номер сообщения: 54-31-5678

1099	Jeweller 18.08.2017 \| 14:51:36 Сайт Email все его сообщения: за день, за месяц, за все время

Vizvezdenec: А я бы не был так уверен :)

вот так хочешь быть проще, как завещал нам великий Будда, а не получается)
одной узко-широко-полостностью все многообразие наблюдаемых нами явлений не объясняется!
надо дополнить второй шкалой - степенью расслоения:
--->слабое расслоение - результаты концентрируются относительно "среднего" результата - ничьей
--->сильное расслоение - результаты расслаиваются на "либо пан, либо пропан"

чуть выше уже как раз по поводу Fizbo об этом говорил
и тогда более точно характеризовать его как движок с некоторым сдвигом в сторону широкополостности (очень умеренным сдвигом) + с достаточно сильным расслоением (относительно среднего)

номер сообщения: 54-31-5679

1100	Jeweller 18.08.2017 \| 14:59:03 Сайт Email все его сообщения: за день, за месяц, за все время

но,
"расслоение" и "широкополостность" (в общем случае) связаны
одно влияет на другое в той или иной степени для разных движков и людей
как? - не волне ясный для меня вопрос

номер сообщения: 54-31-5680

1101	Vizvezdenec Ниже нуля 21.08.2017 \| 20:39:00 все его сообщения: за день, за месяц, за все время

Ну я поэтому несколько и заостряю на нём внимание, т.к. остальные движки более чётко вписываются в концепцию "больше ничьих-сильнее играю против сильных-слабее против слабых".
А тут получается "мало ничьих-еле-еле сильнее играю против сильных-против слабых примерно так же", что является весьма необычным сочетанием.

номер сообщения: 54-31-5681

1102	Jeweller 21.08.2017 \| 21:34:34 Сайт Email все его сообщения: за день, за месяц, за все время

эксперимент нужен, к счастью времени не требует, поставил и забыл
возьму
1) Spark 1.0 RGN (спекулятивные веса ОФ + хорошая тактика)
2) специально подготовленную персоналию CM с завышенной стоимостью своих фигур и примерной силой как у Spark 1.0 RGN
3) контрольную группу движков со стандартными настройками со средним рейтом примерно как у двух движков выше

Арена, контроль 1'+1", книжка у всех HS-7moves, таблицы включены (у кого они есть)

длину теста и число движков в контрольной группе пока назвать не могу

посмотрим, насколько похожим/непохожим Fizbo будет эффект

номер сообщения: 54-31-5682

1103	Vizvezdenec Ниже нуля 22.08.2017 \| 16:05:05 все его сообщения: за день, за месяц, за все время

Детали TCEC 10. Начало в начале октября/конце сентября.

номер сообщения: 54-31-5683

1104	Rom77 25.08.2017 \| 21:17:24 все его сообщения: за день, за месяц, за все время

"Вот это мой размерчик"

Nodes/second          CPU                             Cores/Threads

274 990 177    4xIntel Xeon Platinum 8180 4x28c/56t    224threads

www.ipmanchess.yolasite.com

4 процессора. 112 ядер. 275 миллионов позиций в секунду. Наконец-то кто-то обставил Дип Блю.

номер сообщения: 54-31-5684

1105	Vizvezdenec Ниже нуля 25.08.2017 \| 21:42:45 все его сообщения: за день, за месяц, за все время

Rom77: "Вот это мой размерчик"

Nodes/second          CPU                             Cores/Threads

274 990 177    4xIntel Xeon Platinum 8180 4x28c/56t    224threads

www.ipmanchess.yolasite.com

4 процессора. 112 ядер. 275 миллионов позиций в секунду. Наконец-то кто-то обставил Дип Блю.

Стоит отметить всё-таки, что это весьма бесполезно, т.к. прирост эло между 16 и 32 ядрами составляет уже 1-3 эло, а дальше он так и вовсе символический. Lazy SMP хорош, но не настолько, а он используется во всех движках (конечно, это всё равно лучше YBWC, который дальше 8 ядер давал 0 прироста толком). Возможно, какую-то пользу из этого может извлечь Jonny, хоть и маловероятно - там сделан алгоритм работы на нескольких распределённых компьютерах, который позволяет играть на 2400 ядрах одновременно, но большого прироста силы он тоже не даёт (кстати, я думаю, Deep Blue на 2400 ядрах он легко обставит

номер сообщения: 54-31-5685

1106	Jeweller 25.08.2017 \| 22:23:27 Сайт Email все его сообщения: за день, за месяц, за все время

Jeweller: посмотрим, насколько похожим/непохожим Fizbo будет эффект

оказалось, что "убить сразу двух зайцев" и совместить в одном эксперименте Spark 1.0 RGN и спец версию CM, невозможно - короткие тесты на специально подобранной группе движков показали, что я сильно занижал практическую силу Spark 1.0 RGN
эта персоналия бешеного таранного типа играет не на ~2500, как получал по старым тестам с низкой степенью корректности, а на ~2750-2800 !! (очень предварительно)
и нет возможности сделать под нее персоналию CM равной силы, CM играют намного слабее

это хорошая новость, т.к. позволила построить схему теста намного изящнее, и в чистом виде замерить эффект от двух вариантов изменения настроек, и схожести его с "эффектом Fizbo"

1 тест с CM10, 2 тест со Spark 1.0

схема 1 теста:
берутся 3 персоналии CM10 с силой ~2650:
1) CM10 Default - дефолтные настройки
2) CM10 Factor+ 1x - стоимость своих фигур увеличена, с одновременной "компенсацией" в сторону атаки
3) CM10 Factor– 1x - стоимость своих фигур уменьшена, с одновременной "компенсацией" в сторону защиты

каждая из трех персоналий независимо тестируется на контрольной группе старых добрых движков с разнообразным стилем, в интервале силы 2700-2820, и средней силой ~2765-2770
01 Rybka 1.0 Beta
02 Ktulu 9
03 Jonny 4.00
04 Glaurung 2.2 JA
05 SmarThink 1.20
06 Fruit 2.2.1
07 Hiarcs 10
08 Shredder 9.1
09 Junior 10.1
10 ProDeo 1.85
11 Chess Tiger 2007.1
12 Naum 2.0
13 Delfi 5.4
14 Alaric 707

длина теста - 40 кругов, 560 партий для каждой персоналии

сравниваем

затем очищаем от экстремумов, убираем для каждой персоналии два движка с лучшим показателем побед, и два движка с худшим - сравниваем еще раз

номер сообщения: 54-31-5686

1107	Rom77 25.08.2017 \| 22:25:50 все его сообщения: за день, за месяц, за все время

Vizvezdenec: Стоит отметить всё-таки, что это весьма бесполезно, т.к. прирост эло между 16 и 32 ядрами составляет уже 1-3 эло, а дальше он так и вовсе символический. Lazy SMP хорош, но не настолько, а он используется во всех движках (конечно, это всё равно лучше YBWC, который дальше 8 ядер давал 0 прироста толком). Возможно, какую-то пользу из этого может извлечь Jonny, хоть и маловероятно - там сделан алгоритм работы на нескольких распределённых компьютерах, который позволяет играть на 2400 ядрах одновременно, но большого прироста силы он тоже не даёт (кстати, я думаю, Deep Blue на 2400 ядрах он легко обставит

Да, верно. На сей счет существует теоретический предел производительности, описываемый законом Амдала. У Lazy SMP реальный прирост производительности оказался просто превосходным:

1,9-кратным на 2-х ядрах;
3,5-кратным на 4-х ядрах;
6-кратным на 8-ми ядрах.

Для современных движков, в основе которых лежит последовательный (а значит трудно распараллеливаемый) алгоритм альфа-бета, такой результат просто невероятен.

Но, самое главное - оказалось, что эти числа идеально ложатся на кривую закона Амдала для 95-процентной доли параллельных вычислений. А значит, если этот закон справедлив для малого числа ядер в левой части графика (см. ниже), то он скорее всего справедлив и для большего числа ядер/процессоров. И только если в будущем удастся добиться лучшей распараллеливаемости, то можно будет рассчитывать на какой-то прогресс:

номер сообщения: 54-31-5687

1108	Vizvezdenec Ниже нуля 25.08.2017 \| 23:36:31 все его сообщения: за день, за месяц, за все время

Тут небольшой интересный трюк, т.к. Lazy SMP даёт 100% speedup, но при этом многие узлы просчитываются по несколько раз.

В итоге что выходит... Тут ось y графика корректнее обозвать не "speedup", а "elo gain converted to speedup", причём чем больше временной контроль, тем по идее меньше эло дают бонусные процессоры с текущими алгоритмами распараллеливания.
Кстати, если тест от 2016 года, то он должен давать несколько заниженные результаты по сравнению с реальностью, т.к. небольшие улучшения SMP были с того времени. http://tests.stockfishchess.org/tests/view/586722690ebc5903140c636d

номер сообщения: 54-31-5688

1109	Rom77 25.08.2017 \| 23:51:42 все его сообщения: за день, за месяц, за все время

Vizvezdenec: Тут небольшой интересный трюк, т.к. Lazy SMP даёт 100% speedup, но при этом многие узлы просчитываются по несколько раз.

В итоге что выходит... Тут ось y графика корректнее обозвать не "speedup", а "elo gain converted to speedup",

Я заметил, что термин "speedup" многие понимают по разному. Так что да, нужно быть очень аккуратным, чтобы не появилось разночтений.

Vizvezdenec: Тут ось y графика корректнее обозвать не "speedup", а "elo gain converted to speedup", причём чем больше временной контроль, тем по идее меньше эло дают бонусные процессоры с текущими алгоритмами распараллеливания.

При добавлении времени не только бонусные процессоры дают меньше эло, но и обычный нераспараллеленный перебор. Поэтому их отношение может оставаться постоянным.

Vizvezdenec: Кстати, если тест от 2016 года, то он должен давать несколько заниженные результаты по сравнению с реальностью, т.к. небольшие улучшения SMP были с того времени. http://tests.stockfishchess.org/tests/view/586722690ebc5903140c636d

Тест для Стокфиша 8 (кстати, ссылка у меня почему-то не открывается).

__________________________
не надо шутить с войной

номер сообщения: 54-31-5689

1110	Vizvezdenec Ниже нуля 25.08.2017 \| 23:53:12 все его сообщения: за день, за месяц, за все время

Нужно убрать www, я его не писал

Суть в том, что там 1 патч несколько улучшил распараллеливание по сравнению с SF8.

номер сообщения: 54-31-5690

1111	Rom77 26.08.2017 \| 17:21:08 все его сообщения: за день, за месяц, за все время

Начался тест последних патчей Стокфиша. Тестирование производится против старого Стокфиша 7. 10 тысяч партий, 2 потока:

nextchessmove.com

номер сообщения: 54-31-5692

Страницы: [1] ... [35] [36] [37] [38] [39] ... [91]