|
|
|
|
|
|
|
|
|
|
Vizvezdenec: Там упоминалось то, что скорость одинакова (возможно, использовался ultimaiq compile, который и есть такой "специальный" и на 7-8% быстрее), а значит, разница и есть эти самые 25~ эло, т.е. из матча из 4 игр дев версия должна набирать ~2.15 очка, т.е. 4 ничьих-наиболее вероятный результат. |
Ну, не знаю. Это только kozel64 может прояснить. По крайней мере в цитате у него прямая ссылка только на девелопмент-версию.
P.S. Про вероятности я в курсе. |
|
|
номер сообщения: 54-31-5442 |
|
|
|
Frank Quisinsky продолжает творить добро.
Теперь он освободил Ruffian 202-210 - Frank's Chess Page
В те далекие годы мне очень нравился стиль Ruffian, солидный и сбалансированный, мне он казался тогда очень таким "взрослым".
Кажется это был первый движок, покусившийся в своих первых бесплатных версиях, на полную тогда доминацию коммерческих монстров Shredder, Fritz, Hiarcs, Junior. А позже и сам стал коммерческим. Усиления относительно бесплатных версий, правда, практически не было.
До появления Рыбки оставалось еще года полтора-два. |
|
|
номер сообщения: 54-31-5443 |
|
|
|
Первое тестирование Komodo 11. Из-за встроенного contempt я ожидаю не слишком хороший перформанс против прямых конкурентов, зато набор большого процента очков против Gull, Fritz и т.д. |
|
|
номер сообщения: 54-31-5444 |
|
|
|
Гудини Комодо даже обыгрывает в личной встрече, а вот со стокфишем же...
Komodo 11.01 - Stockfish 8 (3293) 92.0 - 120.0 |
|
|
номер сообщения: 54-31-5445 |
|
|
|
http://inwoba.de/index.html
Впереди в топ-16 листе, позади в полном, в личной встрече разгром. И это против 8 версии полугодичной давности! Учитывая, что Stockfish 7 был существенно слабее версии Комодо того времени, скачок он с 7 по 8 версию сделал просто феноменальный, полгода догоняли-догоняли, да ещё и не догнали. |
|
|
номер сообщения: 54-31-5446 |
|
|
|
Интересно было бы получать все таки объективную картину без очковтирательства, для этого в тесте нужно сделать обязательным одно условие: contempt=0
боюсь только, тогда желающие вообще уберут этот параметр из настроек и начнут зашивать положительный contempt "во внутрь" с невозможностью обнулить |
|
|
номер сообщения: 54-31-5447 |
|
|
|
Jeweller: Интересно было бы получать все таки объективную картину без очковтирательства, для этого в тесте нужно сделать обязательным одно условие: contempt=0
боюсь только, тогда желающие вообще уберут этот параметр из настроек и начнут зашивать положительный contempt "во внутрь" с невозможностью обнулить | Ну contempt=10 в прямом противостоянии проигрывает в районе 5~ эло максимум, что никак не перекроет перформанс в -45 А насколько сильно там Комодо перформит против откровенно старых или слабых движков-мне лично не особо интересно. Пока честный матч у стокфиша 8 он выиграть не смог.
А так contempt=0 ставят разные тестеры, вот пример:
http://talkchess.com/forum/viewtopic.php?topic_view=threads&p=716164&t=64056
67 эло, да, против asm версии стокфиша, но тут аж 14 ядер, то есть это фактически VLTC, пусть и 3+2. |
|
|
номер сообщения: 54-31-5448 |
|
|
|
http://talkchess.com/forum/viewtopic.php?topic_view=threads&p=716242&t=64054
Из интересного. Примерно то же самое раньше писал Houdart. "По непонятным причинам Гудини против стокфиша выглядит хуже, чем положено по рейтингу".
Теперь и с Комодо такая же ситуация выходит. |
|
|
номер сообщения: 54-31-5449 |
|
|
|
Jeweller:потолку силы движков в районе 4800-4900 (примем этот уровень приблизительно, т.к. он еще может уточняться) |
Подскажите непосвящённому, пожалуйста, откуда такая оценка, как её получают? Я пойму только на популярном языке. |
|
|
номер сообщения: 54-31-5450 |
|
|
|
номер сообщения: 54-31-5451 |
|
|
|
Наискосок пробежался, в глаза бросаются некоторые странности.
Ну, например, то, что при куче математики и т.д. люди не умеют в элементарное округление, гляньте таблицу 9 на странице 39, я всё понимаю, но как вы умудряетесь округлять так, что у вас игроки друг с другом в личных встречах набирают 101-102% очков? |
|
|
номер сообщения: 54-31-5452 |
|
|
|
tahoma: Jeweller:потолку силы движков в районе 4800-4900 (примем этот уровень приблизительно, т.к. он еще может уточняться) |
Подскажите непосвящённому, пожалуйста, откуда такая оценка, как её получают? Я пойму только на популярном языке. |
Это, разумеется, всё крайне приблизительно, методология примерно такая.
Брался Стокфиш (вроде бы) на 1 ядре, потом он же на ядре более мощном, ещё более мощном, строилась зависимость прибавки эло от % прироста скорости, аппроксимировалась, смотрелся предел при переходе в бесконечность...
Но это делалось только для одного движка, к сожалению, было бы интересно посмотреть, зависит ли этот предел от изначальной силы движка, но увы. |
|
|
номер сообщения: 54-31-5453 |
|
|
|
http://talkchess.com/forum/viewtopic.php?topic_view=threads&p=716424&t=64079
We lose to SF8 by about 32 elo, and we barely beat Houdini (average plus 1 elo).
Ну по крайней мере разработчик Комодо перестал заливать про то, что он должен выиграть матч у стокфиша, начиная с определённого времени и т.д. Хотя отставать на 32 эло от версии полугодичной давности... А dev версия ещё и на 30+ эло сильнее... |
|
|
номер сообщения: 54-31-5454 |
|
|
|
Vizvezdenec: tahoma: Jeweller:потолку силы движков в районе 4800-4900 (примем этот уровень приблизительно, т.к. он еще может уточняться) |
Подскажите непосвящённому, пожалуйста, откуда такая оценка, как её получают? Я пойму только на популярном языке. |
Это, разумеется, всё крайне приблизительно, методология примерно такая.
Брался Стокфиш (вроде бы) на 1 ядре, потом он же на ядре более мощном, ещё более мощном, строилась зависимость прибавки эло от % прироста скорости, аппроксимировалась, смотрелся предел при переходе в бесконечность...
Но это делалось только для одного движка, к сожалению, было бы интересно посмотреть, зависит ли этот предел от изначальной силы движка, но увы. |
Понятно, спасибо.
Если так, то выходит, я бы сказал, даже более, чем крайне приблизительно. Впрочем, здорово, конечно, что можно ориентироваться пусть на очень условную, но конкретную цифру. Для таких профанов как я знание таких цифр даёт ощущение законченности моего поверхностного кругозора в любой предметной области. Теперь можно спать спокойно. |
|
|
номер сообщения: 54-31-5455 |
|
|
|
Чуть дополню Vizvezdenec'а.
Расчеты такие делались вероятно много раз, вот последний попадавшийся на глаза.
Брался Houdini 3. Замерялись приращения в силе в игре против самого себя с удвоением скорости. По этим точкам строилась функция с экстраполяцией на бесконечную скорость.
Приведу полностью первый пост , из него ясно все (в сожалению картинки умерли, но и без них понятно):
Kai Laskos: With Houdini 3 I played large number of games on 2x nodes versus 1x nodes per move level, or effective doubling time control:
Code:
w l d Elo
1) 4k nodes vs 2k nodes +3862 -352 =786 +303
2) 8k nodes vs 4k nodes +3713 -374 =913 +280
3) 16k nodes vs 8k nodes +3399 -436 =1165 +237
4) 32k nodes vs 16k nodes +3151 -474 =1374 +208
5) 64k nodes vs 32k nodes +2862 -494 =1641 +179
6) 128k nodes vs 64k nodes +2613 -501 =1881 +156
7) 256k nodes vs 128k nodes +942 -201 =855 +136
8) 512k nodes vs 256k nodes +900 -166 =930 +134
9) 1024k nodes vs 512k nodes +806 -167 =1026 +115
10) 2048k nodes vs 1024k nodes +344 -83 =572 +93
11) 4096k nodes vs 2048k nodes +307 -85 =607 +79 |
The gain from doubling the nodes I fitted with a/(b*x^c + 1), where x is the number of doublings, getting the correlation 0.99
The plot is here:
The 40/4', 40/40' and 40/120' CCRL and CEGT levels are shown, and the resulting gain from doubling in this extrapolation is ~70 points at 40/4', ~55 points at 40/40' and ~45 points at 40/120'. The limiting value I get by summing up to infinity over all doublings (infinite time control), and is 1707 points above the Houdini 3 40/40' CCRL level. So, I get 4877 Elo points on CCRL the rating of the perfect engine, similar to what I remember Don got some time ago.
The draw ratio I fitted with a shifted logistic, getting the correlation 0.999. In self play we can expect a very high percentage of draws going to very long time controls.
The plot is here:
The hardest to quantify to me was the win/loss ratio, which I somehow assumed to be constant at longer TC. It seems not to be the case, win/loss ratio seems to decrease with time control (or nodes). I fitted it with 1 + 1/(a*x + b), getting a correlation 0.96.
The plot is here: |
|
|
|
номер сообщения: 54-31-5456 |
|
|
|
Хорошо бы, чтобы на последних версиях Стока, Комодо и Гудини так кто-нибудь сделал. Сила у них примерно одна (в пределах 100 пунктов). Интересно посмотреть, что получится по трем независимым расчетам, насколько предел зависит от движка. |
|
|
номер сообщения: 54-31-5457 |
|
|
|
Jeweller: Хорошо бы, чтобы на последних версиях Стока, Комодо и Гудини так кто-нибудь сделал. Сила у них примерно одна (в пределах 100 пунктов). Интересно посмотреть, что получится по трем независимым расчетам, насколько предел зависит от движка. | Надо бы отписать Kai Laskos, он вроде бы обычно таким занимается. Но у меня нет аккаунта на talkchess |
|
|
номер сообщения: 54-31-5458 |
|
|
|
Если представить себе условный движок вообще без отсечений, который считает все 100% позиций. Интуитивно выглядит так, что для такого движка предел (при таком способе его расчёта) будет заметно выше или вообще бесконечный. Нет? |
|
|
номер сообщения: 54-31-5459 |
|
|
|
tahoma: Если представить себе условный движок вообще без отсечений, который считает все 100% позиций. Интуитивно выглядит так, что для такого движка предел (при таком способе его расчёта) будет заметно выше или вообще бесконечный. Нет? |
Пределом такого движка будет просчет шахмат полностью. |
|
|
номер сообщения: 54-31-5460 |
|
|
|
Ну да, отсюда и мой вопрос. Хотя я имел в виду именно реальный движок и обычную математику.
Вы же, как я понимаю, задаёте вопрос: "верно ли равенство (5000 Эло)=(полный просчёт игры)?" |
|
|
номер сообщения: 54-31-5461 |
|
|
|
tahoma: Ну да, отсюда и мой вопрос. Хотя я имел в виду именно реальный движок и обычную математику.
Вы же, как я понимаю, задаёте вопрос: "верно ли равенство (5000 Эло)=(полный просчёт игры)?" |
Ну начальная позиция в шахматах, скорее всего, ничейна, так что бесконечности эло не выйдет. |
|
|
номер сообщения: 54-31-5462 |
|
|
|
Да, возможно, что математическая эквивалентность этих вопросов для присутствующих очевидна. Но я профан, так что для меня нет. |
|
|
номер сообщения: 54-31-5463 |
|
|
|
Всё смешалось в доме Облонских...
На скорую руку провёл 4-круговой турнир движков с контролем 2+0.
Участники: Komodo 11.01 64-bit, Houdini 5.01 Pro x64-pext, Stockfish 8 64 BMI2, Stockfish 260517 BMI2.
Как и ожидал, победителем стал(а) Stockfish Development Version (7,5/12).
Новый Komodo отстал на очко, но... обыграл победителя при трёх ничьих, со Stocfish 8 обменялся баранками при двух ничьих, а с Houdini во всех партиях заключил мировую.
Houdini стал основным поставщиком очков победителю (+0-3=1), зато разок обыграл стабильную восьмёрку (+1-0=3).
Эта стабильная проиграла разрабатываемой (+0-1=2), зато, как уже писал выше, стала единственной участницей, которая смогла выиграть хоть одну партию у Komodo 11.01!
Такие вот дела... |
|
|
номер сообщения: 54-31-5464 |
|
|
|
Big_Buddha: Всё смешалось в доме Облонских...
На скорую руку провёл 4-круговой турнир движков с контролем 2+0.
Участники: Komodo 11.01 64-bit, Houdini 5.01 Pro x64-pext, Stockfish 8 64 BMI2, Stockfish 260517 BMI2.
Как и ожидал, победителем стал(а) Stockfish Development Version (7,5/12).
Новый Komodo отстал на очко, но... обыграл победителя при трёх ничьих, со Stocfish 8 обменялся баранками при двух ничьих, а с Houdini во всех партиях заключил мировую.
Houdini стал основным поставщиком очков победителю (+0-3=1), зато разок обыграл стабильную восьмёрку (+1-0=3).
Эта стабильная проиграла разрабатываемой (+0-1=2), зато, как уже писал выше, стала единственной участницей, которая смогла выиграть хоть одну партию у Komodo 11.01!
Такие вот дела... | Ну дистанция около отсутствующей.
Я вот за этим слежу http://www.talkchess.com/forum/viewtopic.php?topic_view=threads&p=716559&t=64077, в острых позициях Комодо 11 просто беспомощен пока против SFdev. |
|
|
номер сообщения: 54-31-5465 |
|
|
|
Vizvezdenec: Jeweller: Хорошо бы, чтобы на последних версиях Стока, Комодо и Гудини так кто-нибудь сделал. Сила у них примерно одна (в пределах 100 пунктов). Интересно посмотреть, что получится по трем независимым расчетам, насколько предел зависит от движка. | Надо бы отписать Kai Laskos, он вроде бы обычно таким занимается. Но у меня нет аккаунта на talkchess |
У меня тоже нет, чукча там читатель...
Думаю, новый расчет неизбежен, Kai или кто-то еще скоро не выдержит :)
Интересно, что Kai упоминает близкий результат предельной силы, полученный до него Доном. Очевидно, что Дон смотрел на Комодо (на чем же еще?), а значит кое какой момент сравнения по разным движкам имеется - Гудини и (вероятно)Комодо тогда дали близкий результат.
До этого высказывался Васик, и вряд ли брал цифры с потолка, думаю смотрел на одной из первых Рыбок:
Году в 2006-м Райлих говорил, что хочет увидеть усиление до 4000 Elo в ближайшие 10 лет. | в реальности оказалось чуть медленнее. |
|
|
номер сообщения: 54-31-5466 |
|
|
|
Знающим немецкий будет легче:«NIGHTMARE II»
25. AUGUST 2016
In 2005 I published a collection of test positions for chess engines, called «Nightmare». It was a set of 30 very difficult Puzzles. Today, more than ten years later, the modern engines are much stronger. So I created a new collection with 30 new hard positions. I found them in books, in chess forums, in studies databases a.o. (You can download all 30 positions as a EPD-File for your own experiments; with a fairly fast CPU, you should try 60 seconds per puzzle/engine ). Have fun with «Nightmare II»!
EPD-Download
Online nachspielen | См. также:
Nolot |
|
|
номер сообщения: 54-31-5468 |
|
|
|
благодарю! ищу "кошмарные" позиции, пока посмотрел это:
с большинством команда Stockfish + Critter 1.6a справляются за несколько секунд, кроме "проблемы 3" - не видят оба, и "проблемы 9" - возможно неверна |
|
|
номер сообщения: 54-31-5469 |
|
|
|
Jeweller: благодарю! ищу "кошмарные" позиции, пока посмотрел это:
с большинством команда Stockfish + Critter 1.6a справляются за несколько секунд, кроме "проблемы 3" - не видят оба, и "проблемы 9" - возможно неверна | Думаю, что в проблеме 3 при достаточной глубине стокфиш должен увидеть, тут как бы нет "прямого" выигрыша за белых, просто "очень сильная" компенсация за ферзя, а компы любят ферзей. |
|
|
номер сообщения: 54-31-5470 |
|
|
|
Vizvezdenec: Думаю, что в проблеме 3 при достаточной глубине стокфиш должен увидеть, тут как бы нет "прямого" выигрыша за белых, просто "очень сильная" компенсация за ферзя, а компы любят ферзей. | да, на глубине 33 берет, и дальше поднимает оценку:
|
|
|
номер сообщения: 54-31-5471 |
|
|
|
Ну как я примерно и сказал. Такие жертвы ферзей за компенсацию компы видят, но не особо любят, пока не видят чёткого перевеса в вариантах. Если он там реально есть-рано или поздно досчитывают.
Так было и с жертвой от Каруаны против Накамуры, и тут вот тоже.
Более того, думаю, что стадию реализации комп проведёт куда точнее |
|
|
номер сообщения: 54-31-5472 |
|
|
|
|
|
|
|
|
Copyright chesspro.ru 2004-2024 гг. |
|
|
|