ChessPro online

Новости мира движков

вернуться в форум

29.10.2007 | 19:10:30

Главная  -  Поговорим?  -  Железный марш

962

Rom77

18.05.2017 | 18:55:16

все его сообщения:
за день, за месяц,
за все время
Vizvezdenec: Там упоминалось то, что скорость одинакова (возможно, использовался ultimaiq compile, который и есть такой "специальный" и на 7-8% быстрее), а значит, разница и есть эти самые 25~ эло, т.е. из матча из 4 игр дев версия должна набирать ~2.15 очка, т.е. 4 ничьих-наиболее вероятный результат.

Ну, не знаю. Это только kozel64 может прояснить. По крайней мере в цитате у него прямая ссылка только на девелопмент-версию.

P.S. Про вероятности я в курсе.
номер сообщения: 54-31-5442

963

Jeweller

22.05.2017 | 00:30:12
Сайт Email

все его сообщения:
за день, за месяц,
за все время
Frank Quisinsky продолжает творить добро.
Теперь он освободил Ruffian 202-210 - Frank's Chess Page

В те далекие годы мне очень нравился стиль Ruffian, солидный и сбалансированный, мне он казался тогда очень таким "взрослым".
Кажется это был первый движок, покусившийся в своих первых бесплатных версиях, на полную тогда доминацию коммерческих монстров Shredder, Fritz, Hiarcs, Junior. А позже и сам стал коммерческим. Усиления относительно бесплатных версий, правда, практически не было.
До появления Рыбки оставалось еще года полтора-два.
номер сообщения: 54-31-5443

964

Vizvezdenec

Ниже нуля

23.05.2017 | 16:54:05

все его сообщения:
за день, за месяц,
за все время
Первое тестирование Komodo 11. Из-за встроенного contempt я ожидаю не слишком хороший перформанс против прямых конкурентов, зато набор большого процента очков против Gull, Fritz и т.д.
номер сообщения: 54-31-5444

965

Vizvezdenec

Ниже нуля

24.05.2017 | 16:24:58

все его сообщения:
за день, за месяц,
за все время
Гудини Комодо даже обыгрывает в личной встрече, а вот со стокфишем же...
Komodo 11.01 - Stockfish 8 (3293) 92.0 - 120.0
номер сообщения: 54-31-5445

966

Vizvezdenec

Ниже нуля

24.05.2017 | 18:55:48

все его сообщения:
за день, за месяц,
за все время
http://inwoba.de/index.html
Впереди в топ-16 листе, позади в полном, в личной встрече разгром. И это против 8 версии полугодичной давности! Учитывая, что Stockfish 7 был существенно слабее версии Комодо того времени, скачок он с 7 по 8 версию сделал просто феноменальный, полгода догоняли-догоняли, да ещё и не догнали.
номер сообщения: 54-31-5446

967

Jeweller

24.05.2017 | 22:19:14
Сайт Email

все его сообщения:
за день, за месяц,
за все время
Интересно было бы получать все таки объективную картину без очковтирательства, для этого в тесте нужно сделать обязательным одно условие: contempt=0
боюсь только, тогда желающие вообще уберут этот параметр из настроек и начнут зашивать положительный contempt "во внутрь" с невозможностью обнулить
номер сообщения: 54-31-5447

968

Vizvezdenec

Ниже нуля

24.05.2017 | 22:21:44

все его сообщения:
за день, за месяц,
за все время
Jeweller: Интересно было бы получать все таки объективную картину без очковтирательства, для этого в тесте нужно сделать обязательным одно условие: contempt=0
боюсь только, тогда желающие вообще уберут этот параметр из настроек и начнут зашивать положительный contempt "во внутрь" с невозможностью обнулить
Ну contempt=10 в прямом противостоянии проигрывает в районе 5~ эло максимум, что никак не перекроет перформанс в -45 А насколько сильно там Комодо перформит против откровенно старых или слабых движков-мне лично не особо интересно. Пока честный матч у стокфиша 8 он выиграть не смог.
А так contempt=0 ставят разные тестеры, вот пример:
http://talkchess.com/forum/viewtopic.php?topic_view=threads&p=716164&t=64056
67 эло, да, против asm версии стокфиша, но тут аж 14 ядер, то есть это фактически VLTC, пусть и 3+2.
номер сообщения: 54-31-5448

969

Vizvezdenec

Ниже нуля

24.05.2017 | 23:29:00

все его сообщения:
за день, за месяц,
за все время
http://talkchess.com/forum/viewtopic.php?topic_view=threads&p=716242&t=64054
Из интересного. Примерно то же самое раньше писал Houdart. "По непонятным причинам Гудини против стокфиша выглядит хуже, чем положено по рейтингу".
Теперь и с Комодо такая же ситуация выходит.
номер сообщения: 54-31-5449

970

tahoma

болельщик

25.05.2017 | 18:31:05

все его сообщения:
за день, за месяц,
за все время
Jeweller:потолку силы движков в районе 4800-4900 (примем этот уровень приблизительно, т.к. он еще может уточняться)

Подскажите непосвящённому, пожалуйста, откуда такая оценка, как её получают? Я пойму только на популярном языке.
номер сообщения: 54-31-5450

971

Jacob08

Копенгаген

26.05.2017 | 08:54:43

все его сообщения:
за день, за месяц,
за все время
Who is the Master?

Jean-Marc Alliot

IRIT, Toulouse University, CNRS, France
номер сообщения: 54-31-5451

972

Vizvezdenec

Ниже нуля

26.05.2017 | 09:08:43

все его сообщения:
за день, за месяц,
за все время
Jacob08: Who is the Master?

Jean-Marc Alliot

IRIT, Toulouse University, CNRS, France

Наискосок пробежался, в глаза бросаются некоторые странности.
Ну, например, то, что при куче математики и т.д. люди не умеют в элементарное округление, гляньте таблицу 9 на странице 39, я всё понимаю, но как вы умудряетесь округлять так, что у вас игроки друг с другом в личных встречах набирают 101-102% очков?
номер сообщения: 54-31-5452

973

Vizvezdenec

Ниже нуля

26.05.2017 | 09:11:55

все его сообщения:
за день, за месяц,
за все время
tahoma:
Jeweller:потолку силы движков в районе 4800-4900 (примем этот уровень приблизительно, т.к. он еще может уточняться)

Подскажите непосвящённому, пожалуйста, откуда такая оценка, как её получают? Я пойму только на популярном языке.

Это, разумеется, всё крайне приблизительно, методология примерно такая.
Брался Стокфиш (вроде бы) на 1 ядре, потом он же на ядре более мощном, ещё более мощном, строилась зависимость прибавки эло от % прироста скорости, аппроксимировалась, смотрелся предел при переходе в бесконечность...
Но это делалось только для одного движка, к сожалению, было бы интересно посмотреть, зависит ли этот предел от изначальной силы движка, но увы.
номер сообщения: 54-31-5453

974

Vizvezdenec

Ниже нуля

26.05.2017 | 09:13:46

все его сообщения:
за день, за месяц,
за все время
http://talkchess.com/forum/viewtopic.php?topic_view=threads&p=716424&t=64079
We lose to SF8 by about 32 elo, and we barely beat Houdini (average plus 1 elo).
Ну по крайней мере разработчик Комодо перестал заливать про то, что он должен выиграть матч у стокфиша, начиная с определённого времени и т.д. Хотя отставать на 32 эло от версии полугодичной давности... А dev версия ещё и на 30+ эло сильнее...
номер сообщения: 54-31-5454

975

tahoma

болельщик

26.05.2017 | 13:02:42

все его сообщения:
за день, за месяц,
за все время
Vizvezdenec:
tahoma:
Jeweller:потолку силы движков в районе 4800-4900 (примем этот уровень приблизительно, т.к. он еще может уточняться)

Подскажите непосвящённому, пожалуйста, откуда такая оценка, как её получают? Я пойму только на популярном языке.

Это, разумеется, всё крайне приблизительно, методология примерно такая.
Брался Стокфиш (вроде бы) на 1 ядре, потом он же на ядре более мощном, ещё более мощном, строилась зависимость прибавки эло от % прироста скорости, аппроксимировалась, смотрелся предел при переходе в бесконечность...
Но это делалось только для одного движка, к сожалению, было бы интересно посмотреть, зависит ли этот предел от изначальной силы движка, но увы.

Понятно, спасибо.

Если так, то выходит, я бы сказал, даже более, чем крайне приблизительно. Впрочем, здорово, конечно, что можно ориентироваться пусть на очень условную, но конкретную цифру. Для таких профанов как я знание таких цифр даёт ощущение законченности моего поверхностного кругозора в любой предметной области. Теперь можно спать спокойно.
номер сообщения: 54-31-5455

976

Jeweller

26.05.2017 | 14:54:38
Сайт Email

все его сообщения:
за день, за месяц,
за все время
Чуть дополню Vizvezdenec'а.
Расчеты такие делались вероятно много раз, вот последний попадавшийся на глаза.
Брался Houdini 3. Замерялись приращения в силе в игре против самого себя с удвоением скорости. По этим точкам строилась функция с экстраполяцией на бесконечную скорость.
Приведу полностью первый пост , из него ясно все (в сожалению картинки умерли, но и без них понятно):
Kai Laskos: With Houdini 3 I played large number of games on 2x nodes versus 1x nodes per move level, or effective doubling time control:
Code:

w l d Elo

1) 4k nodes vs 2k nodes +3862 -352 =786 +303
2) 8k nodes vs 4k nodes +3713 -374 =913 +280
3) 16k nodes vs 8k nodes +3399 -436 =1165 +237
4) 32k nodes vs 16k nodes +3151 -474 =1374 +208
5) 64k nodes vs 32k nodes +2862 -494 =1641 +179
6) 128k nodes vs 64k nodes +2613 -501 =1881 +156
7) 256k nodes vs 128k nodes +942 -201 =855 +136
8) 512k nodes vs 256k nodes +900 -166 =930 +134
9) 1024k nodes vs 512k nodes +806 -167 =1026 +115
10) 2048k nodes vs 1024k nodes +344 -83 =572 +93
11) 4096k nodes vs 2048k nodes +307 -85 =607 +79

The gain from doubling the nodes I fitted with a/(b*x^c + 1), where x is the number of doublings, getting the correlation 0.99
The plot is here:

The 40/4', 40/40' and 40/120' CCRL and CEGT levels are shown, and the resulting gain from doubling in this extrapolation is ~70 points at 40/4', ~55 points at 40/40' and ~45 points at 40/120'. The limiting value I get by summing up to infinity over all doublings (infinite time control), and is 1707 points above the Houdini 3 40/40' CCRL level. So, I get 4877 Elo points on CCRL the rating of the perfect engine, similar to what I remember Don got some time ago.

The draw ratio I fitted with a shifted logistic, getting the correlation 0.999. In self play we can expect a very high percentage of draws going to very long time controls.
The plot is here:

The hardest to quantify to me was the win/loss ratio, which I somehow assumed to be constant at longer TC. It seems not to be the case, win/loss ratio seems to decrease with time control (or nodes). I fitted it with 1 + 1/(a*x + b), getting a correlation 0.96.
The plot is here:
номер сообщения: 54-31-5456

977

Jeweller

26.05.2017 | 15:12:18
Сайт Email

все его сообщения:
за день, за месяц,
за все время
Хорошо бы, чтобы на последних версиях Стока, Комодо и Гудини так кто-нибудь сделал. Сила у них примерно одна (в пределах 100 пунктов). Интересно посмотреть, что получится по трем независимым расчетам, насколько предел зависит от движка.
номер сообщения: 54-31-5457

978

Vizvezdenec

Ниже нуля

26.05.2017 | 16:12:38

все его сообщения:
за день, за месяц,
за все время
Jeweller: Хорошо бы, чтобы на последних версиях Стока, Комодо и Гудини так кто-нибудь сделал. Сила у них примерно одна (в пределах 100 пунктов). Интересно посмотреть, что получится по трем независимым расчетам, насколько предел зависит от движка.
Надо бы отписать Kai Laskos, он вроде бы обычно таким занимается. Но у меня нет аккаунта на talkchess
номер сообщения: 54-31-5458

979

tahoma

болельщик

27.05.2017 | 14:13:27

все его сообщения:
за день, за месяц,
за все время
Если представить себе условный движок вообще без отсечений, который считает все 100% позиций. Интуитивно выглядит так, что для такого движка предел (при таком способе его расчёта) будет заметно выше или вообще бесконечный. Нет?
номер сообщения: 54-31-5459

980

manowar


Минск

27.05.2017 | 14:20:06

все его сообщения:
за день, за месяц,
за все время
tahoma: Если представить себе условный движок вообще без отсечений, который считает все 100% позиций. Интуитивно выглядит так, что для такого движка предел (при таком способе его расчёта) будет заметно выше или вообще бесконечный. Нет?

Пределом такого движка будет просчет шахмат полностью.
номер сообщения: 54-31-5460

981

tahoma

болельщик

27.05.2017 | 15:07:05

все его сообщения:
за день, за месяц,
за все время
Ну да, отсюда и мой вопрос. Хотя я имел в виду именно реальный движок и обычную математику.

Вы же, как я понимаю, задаёте вопрос: "верно ли равенство (5000 Эло)=(полный просчёт игры)?"
номер сообщения: 54-31-5461

982

Vizvezdenec

Ниже нуля

27.05.2017 | 16:18:56

все его сообщения:
за день, за месяц,
за все время
tahoma: Ну да, отсюда и мой вопрос. Хотя я имел в виду именно реальный движок и обычную математику.

Вы же, как я понимаю, задаёте вопрос: "верно ли равенство (5000 Эло)=(полный просчёт игры)?"

Ну начальная позиция в шахматах, скорее всего, ничейна, так что бесконечности эло не выйдет.
номер сообщения: 54-31-5462

983

tahoma

болельщик

27.05.2017 | 23:05:08

все его сообщения:
за день, за месяц,
за все время
Да, возможно, что математическая эквивалентность этих вопросов для присутствующих очевидна. Но я профан, так что для меня нет.
номер сообщения: 54-31-5463

984

Big_Buddha

27.05.2017 | 23:06:40

все его сообщения:
за день, за месяц,
за все время
Всё смешалось в доме Облонских...
На скорую руку провёл 4-круговой турнир движков с контролем 2+0.
Участники: Komodo 11.01 64-bit, Houdini 5.01 Pro x64-pext, Stockfish 8 64 BMI2, Stockfish 260517 BMI2.
Как и ожидал, победителем стал(а) Stockfish Development Version (7,5/12).
Новый Komodo отстал на очко, но... обыграл победителя при трёх ничьих, со Stocfish 8 обменялся баранками при двух ничьих, а с Houdini во всех партиях заключил мировую.
Houdini стал основным поставщиком очков победителю (+0-3=1), зато разок обыграл стабильную восьмёрку (+1-0=3).
Эта стабильная проиграла разрабатываемой (+0-1=2), зато, как уже писал выше, стала единственной участницей, которая смогла выиграть хоть одну партию у Komodo 11.01!
Такие вот дела...
номер сообщения: 54-31-5464

985

Vizvezdenec

Ниже нуля

27.05.2017 | 23:35:47

все его сообщения:
за день, за месяц,
за все время
Big_Buddha: Всё смешалось в доме Облонских...
На скорую руку провёл 4-круговой турнир движков с контролем 2+0.
Участники: Komodo 11.01 64-bit, Houdini 5.01 Pro x64-pext, Stockfish 8 64 BMI2, Stockfish 260517 BMI2.
Как и ожидал, победителем стал(а) Stockfish Development Version (7,5/12).
Новый Komodo отстал на очко, но... обыграл победителя при трёх ничьих, со Stocfish 8 обменялся баранками при двух ничьих, а с Houdini во всех партиях заключил мировую.
Houdini стал основным поставщиком очков победителю (+0-3=1), зато разок обыграл стабильную восьмёрку (+1-0=3).
Эта стабильная проиграла разрабатываемой (+0-1=2), зато, как уже писал выше, стала единственной участницей, которая смогла выиграть хоть одну партию у Komodo 11.01!
Такие вот дела...
Ну дистанция около отсутствующей.
Я вот за этим слежу http://www.talkchess.com/forum/viewtopic.php?topic_view=threads&p=716559&t=64077, в острых позициях Комодо 11 просто беспомощен пока против SFdev.
номер сообщения: 54-31-5465

986

Jeweller

28.05.2017 | 17:42:53
Сайт Email

все его сообщения:
за день, за месяц,
за все время
Vizvezdenec:
Jeweller: Хорошо бы, чтобы на последних версиях Стока, Комодо и Гудини так кто-нибудь сделал. Сила у них примерно одна (в пределах 100 пунктов). Интересно посмотреть, что получится по трем независимым расчетам, насколько предел зависит от движка.
Надо бы отписать Kai Laskos, он вроде бы обычно таким занимается. Но у меня нет аккаунта на talkchess

У меня тоже нет, чукча там читатель...
Думаю, новый расчет неизбежен, Kai или кто-то еще скоро не выдержит :)

Интересно, что Kai упоминает близкий результат предельной силы, полученный до него Доном. Очевидно, что Дон смотрел на Комодо (на чем же еще?), а значит кое какой момент сравнения по разным движкам имеется - Гудини и (вероятно)Комодо тогда дали близкий результат.
До этого высказывался Васик, и вряд ли брал цифры с потолка, думаю смотрел на одной из первых Рыбок:
Году в 2006-м Райлих говорил, что хочет увидеть усиление до 4000 Elo в ближайшие 10 лет.
в реальности оказалось чуть медленнее.
номер сообщения: 54-31-5466

987

Big_Buddha

29.05.2017 | 19:25:03

все его сообщения:
за день, за месяц,
за все время
Знающим немецкий будет легче:
«NIGHTMARE II»
25. AUGUST 2016
In 2005 I published a collection of test positions for chess engines, called «Nightmare». It was a set of 30 very difficult Puzzles. Today, more than ten years later, the modern engines are much stronger. So I created a new collection with 30 new hard positions. I found them in books, in chess forums, in studies databases a.o. (You can download all 30 positions as a EPD-File for your own experiments; with a fairly fast CPU, you should try 60 seconds per puzzle/engine ). Have fun with «Nightmare II»!

EPD-Download

Online nachspielen
См. также:
Nolot
номер сообщения: 54-31-5468

988

Jeweller

29.05.2017 | 21:43:18
Сайт Email

все его сообщения:
за день, за месяц,
за все время
благодарю! ищу "кошмарные" позиции, пока посмотрел это:
См. также:
Nolot
с большинством команда Stockfish + Critter 1.6a справляются за несколько секунд, кроме "проблемы 3" - не видят оба, и "проблемы 9" - возможно неверна
номер сообщения: 54-31-5469

989

Vizvezdenec

Ниже нуля

30.05.2017 | 00:45:50

все его сообщения:
за день, за месяц,
за все время
Jeweller: благодарю! ищу "кошмарные" позиции, пока посмотрел это:
См. также:
Nolot
с большинством команда Stockfish + Critter 1.6a справляются за несколько секунд, кроме "проблемы 3" - не видят оба, и "проблемы 9" - возможно неверна
Думаю, что в проблеме 3 при достаточной глубине стокфиш должен увидеть, тут как бы нет "прямого" выигрыша за белых, просто "очень сильная" компенсация за ферзя, а компы любят ферзей.
номер сообщения: 54-31-5470

990

Jeweller

30.05.2017 | 22:05:17
Сайт Email

все его сообщения:
за день, за месяц,
за все время
Vizvezdenec: Думаю, что в проблеме 3 при достаточной глубине стокфиш должен увидеть, тут как бы нет "прямого" выигрыша за белых, просто "очень сильная" компенсация за ферзя, а компы любят ферзей.
да, на глубине 33 берет, и дальше поднимает оценку:
номер сообщения: 54-31-5471

991

Vizvezdenec

Ниже нуля

31.05.2017 | 00:14:11

все его сообщения:
за день, за месяц,
за все время
Ну как я примерно и сказал. Такие жертвы ферзей за компенсацию компы видят, но не особо любят, пока не видят чёткого перевеса в вариантах. Если он там реально есть-рано или поздно досчитывают.
Так было и с жертвой от Каруаны против Накамуры, и тут вот тоже.
Более того, думаю, что стадию реализации комп проведёт куда точнее
номер сообщения: 54-31-5472