Новости мира движков

29.10.2007 | 19:10:30

Страницы: [1] ... [31] [32] [33] [34] [35] ... [94]

962	Rom77 18.05.2017 \| 18:55:16 все его сообщения: за день, за месяц, за все время

Vizvezdenec: Там упоминалось то, что скорость одинакова (возможно, использовался ultimaiq compile, который и есть такой "специальный" и на 7-8% быстрее), а значит, разница и есть эти самые 25~ эло, т.е. из матча из 4 игр дев версия должна набирать ~2.15 очка, т.е. 4 ничьих-наиболее вероятный результат.

Ну, не знаю. Это только kozel64 может прояснить. По крайней мере в цитате у него прямая ссылка только на девелопмент-версию.

P.S. Про вероятности я в курсе.

номер сообщения: 54-31-5442

963	Jeweller 22.05.2017 \| 00:30:12 Сайт Email все его сообщения: за день, за месяц, за все время

Frank Quisinsky продолжает творить добро.
Теперь он освободил Ruffian 202-210 - Frank's Chess Page

В те далекие годы мне очень нравился стиль Ruffian, солидный и сбалансированный, мне он казался тогда очень таким "взрослым".
Кажется это был первый движок, покусившийся в своих первых бесплатных версиях, на полную тогда доминацию коммерческих монстров Shredder, Fritz, Hiarcs, Junior. А позже и сам стал коммерческим. Усиления относительно бесплатных версий, правда, практически не было.
До появления Рыбки оставалось еще года полтора-два.

номер сообщения: 54-31-5443

964	Vizvezdenec Ниже нуля 23.05.2017 \| 16:54:05 все его сообщения: за день, за месяц, за все время

Первое тестирование Komodo 11. Из-за встроенного contempt я ожидаю не слишком хороший перформанс против прямых конкурентов, зато набор большого процента очков против Gull, Fritz и т.д.

номер сообщения: 54-31-5444

965	Vizvezdenec Ниже нуля 24.05.2017 \| 16:24:58 все его сообщения: за день, за месяц, за все время

Гудини Комодо даже обыгрывает в личной встрече, а вот со стокфишем же...
Komodo 11.01 - Stockfish 8 (3293) 92.0 - 120.0

номер сообщения: 54-31-5445

966	Vizvezdenec Ниже нуля 24.05.2017 \| 18:55:48 все его сообщения: за день, за месяц, за все время

http://inwoba.de/index.html
Впереди в топ-16 листе, позади в полном, в личной встрече разгром. И это против 8 версии полугодичной давности! Учитывая, что Stockfish 7 был существенно слабее версии Комодо того времени, скачок он с 7 по 8 версию сделал просто феноменальный, полгода догоняли-догоняли, да ещё и не догнали.

номер сообщения: 54-31-5446

967	Jeweller 24.05.2017 \| 22:19:14 Сайт Email все его сообщения: за день, за месяц, за все время

Интересно было бы получать все таки объективную картину без очковтирательства, для этого в тесте нужно сделать обязательным одно условие: contempt=0
боюсь только, тогда желающие вообще уберут этот параметр из настроек и начнут зашивать положительный contempt "во внутрь" с невозможностью обнулить

номер сообщения: 54-31-5447

968	Vizvezdenec Ниже нуля 24.05.2017 \| 22:21:44 все его сообщения: за день, за месяц, за все время

Jeweller: Интересно было бы получать все таки объективную картину без очковтирательства, для этого в тесте нужно сделать обязательным одно условие: contempt=0
боюсь только, тогда желающие вообще уберут этот параметр из настроек и начнут зашивать положительный contempt "во внутрь" с невозможностью обнулить

Ну contempt=10 в прямом противостоянии проигрывает в районе 5~ эло максимум, что никак не перекроет перформанс в -45

А насколько сильно там Комодо перформит против откровенно старых или слабых движков-мне лично не особо интересно. Пока честный матч у стокфиша 8 он выиграть не смог.
А так contempt=0 ставят разные тестеры, вот пример:
http://talkchess.com/forum/viewtopic.php?topic_view=threads&p=716164&t=64056
67 эло, да, против asm версии стокфиша, но тут аж 14 ядер, то есть это фактически VLTC, пусть и 3+2.

номер сообщения: 54-31-5448

969	Vizvezdenec Ниже нуля 24.05.2017 \| 23:29:00 все его сообщения: за день, за месяц, за все время

http://talkchess.com/forum/viewtopic.php?topic_view=threads&p=716242&t=64054
Из интересного. Примерно то же самое раньше писал Houdart. "По непонятным причинам Гудини против стокфиша выглядит хуже, чем положено по рейтингу".
Теперь и с Комодо такая же ситуация выходит.

номер сообщения: 54-31-5449

970	tahoma болельщик 25.05.2017 \| 18:31:05 все его сообщения: за день, за месяц, за все время

Jeweller:потолку силы движков в районе 4800-4900 (примем этот уровень приблизительно, т.к. он еще может уточняться)

Подскажите непосвящённому, пожалуйста, откуда такая оценка, как её получают? Я пойму только на популярном языке.

номер сообщения: 54-31-5450

971	Jacob08 Копенгаген 26.05.2017 \| 08:54:43 все его сообщения: за день, за месяц, за все время

Who is the Master?

Jean-Marc Alliot

IRIT, Toulouse University, CNRS, France

номер сообщения: 54-31-5451

972	Vizvezdenec Ниже нуля 26.05.2017 \| 09:08:43 все его сообщения: за день, за месяц, за все время

Jacob08: Who is the Master?

Jean-Marc Alliot

IRIT, Toulouse University, CNRS, France

Наискосок пробежался, в глаза бросаются некоторые странности.
Ну, например, то, что при куче математики и т.д. люди не умеют в элементарное округление, гляньте таблицу 9 на странице 39, я всё понимаю, но как вы умудряетесь округлять так, что у вас игроки друг с другом в личных встречах набирают 101-102% очков?

номер сообщения: 54-31-5452

973	Vizvezdenec Ниже нуля 26.05.2017 \| 09:11:55 все его сообщения: за день, за месяц, за все время

tahoma:

Jeweller:потолку силы движков в районе 4800-4900 (примем этот уровень приблизительно, т.к. он еще может уточняться)

Это, разумеется, всё крайне приблизительно, методология примерно такая.
Брался Стокфиш (вроде бы) на 1 ядре, потом он же на ядре более мощном, ещё более мощном, строилась зависимость прибавки эло от % прироста скорости, аппроксимировалась, смотрелся предел при переходе в бесконечность...
Но это делалось только для одного движка, к сожалению, было бы интересно посмотреть, зависит ли этот предел от изначальной силы движка, но увы.

номер сообщения: 54-31-5453

974	Vizvezdenec Ниже нуля 26.05.2017 \| 09:13:46 все его сообщения: за день, за месяц, за все время

http://talkchess.com/forum/viewtopic.php?topic_view=threads&p=716424&t=64079
We lose to SF8 by about 32 elo, and we barely beat Houdini (average plus 1 elo).
Ну по крайней мере разработчик Комодо перестал заливать про то, что он должен выиграть матч у стокфиша, начиная с определённого времени и т.д.

Хотя отставать на 32 эло от версии полугодичной давности... А dev версия ещё и на 30+ эло сильнее...

номер сообщения: 54-31-5454

975	tahoma болельщик 26.05.2017 \| 13:02:42 все его сообщения: за день, за месяц, за все время

Vizvezdenec:

tahoma:

Jeweller:потолку силы движков в районе 4800-4900 (примем этот уровень приблизительно, т.к. он еще может уточняться)

Понятно, спасибо.

Если так, то выходит, я бы сказал, даже более, чем крайне приблизительно. Впрочем, здорово, конечно, что можно ориентироваться пусть на очень условную, но конкретную цифру. Для таких профанов как я знание таких цифр даёт ощущение законченности моего поверхностного кругозора в любой предметной области. Теперь можно спать спокойно.

номер сообщения: 54-31-5455

976	Jeweller 26.05.2017 \| 14:54:38 Сайт Email все его сообщения: за день, за месяц, за все время

Чуть дополню Vizvezdenec'а.
Расчеты такие делались вероятно много раз, вот последний попадавшийся на глаза.
Брался Houdini 3. Замерялись приращения в силе в игре против самого себя с удвоением скорости. По этим точкам строилась функция с экстраполяцией на бесконечную скорость.
Приведу полностью первый пост , из него ясно все (в сожалению картинки умерли, но и без них понятно):

Kai Laskos: With Houdini 3 I played large number of games on 2x nodes versus 1x nodes per move level, or effective doubling time control:
Code:

w l d Elo

1) 4k nodes vs 2k nodes +3862 -352 =786 +303
2) 8k nodes vs 4k nodes +3713 -374 =913 +280
3) 16k nodes vs 8k nodes +3399 -436 =1165 +237
4) 32k nodes vs 16k nodes +3151 -474 =1374 +208
5) 64k nodes vs 32k nodes +2862 -494 =1641 +179
6) 128k nodes vs 64k nodes +2613 -501 =1881 +156
7) 256k nodes vs 128k nodes +942 -201 =855 +136
8) 512k nodes vs 256k nodes +900 -166 =930 +134
9) 1024k nodes vs 512k nodes +806 -167 =1026 +115
10) 2048k nodes vs 1024k nodes +344 -83 =572 +93
11) 4096k nodes vs 2048k nodes +307 -85 =607 +79

The gain from doubling the nodes I fitted with a/(b*x^c + 1), where x is the number of doublings, getting the correlation 0.99
The plot is here:

The 40/4', 40/40' and 40/120' CCRL and CEGT levels are shown, and the resulting gain from doubling in this extrapolation is ~70 points at 40/4', ~55 points at 40/40' and ~45 points at 40/120'. The limiting value I get by summing up to infinity over all doublings (infinite time control), and is 1707 points above the Houdini 3 40/40' CCRL level. So, I get 4877 Elo points on CCRL the rating of the perfect engine, similar to what I remember Don got some time ago.

The draw ratio I fitted with a shifted logistic, getting the correlation 0.999. In self play we can expect a very high percentage of draws going to very long time controls.
The plot is here:

The hardest to quantify to me was the win/loss ratio, which I somehow assumed to be constant at longer TC. It seems not to be the case, win/loss ratio seems to decrease with time control (or nodes). I fitted it with 1 + 1/(a*x + b), getting a correlation 0.96.
The plot is here:

номер сообщения: 54-31-5456

977	Jeweller 26.05.2017 \| 15:12:18 Сайт Email все его сообщения: за день, за месяц, за все время

Хорошо бы, чтобы на последних версиях Стока, Комодо и Гудини так кто-нибудь сделал. Сила у них примерно одна (в пределах 100 пунктов). Интересно посмотреть, что получится по трем независимым расчетам, насколько предел зависит от движка.

номер сообщения: 54-31-5457

978	Vizvezdenec Ниже нуля 26.05.2017 \| 16:12:38 все его сообщения: за день, за месяц, за все время

Jeweller: Хорошо бы, чтобы на последних версиях Стока, Комодо и Гудини так кто-нибудь сделал. Сила у них примерно одна (в пределах 100 пунктов). Интересно посмотреть, что получится по трем независимым расчетам, насколько предел зависит от движка.

Надо бы отписать Kai Laskos, он вроде бы обычно таким занимается. Но у меня нет аккаунта на talkchess

номер сообщения: 54-31-5458

979	tahoma болельщик 27.05.2017 \| 14:13:27 все его сообщения: за день, за месяц, за все время

Если представить себе условный движок вообще без отсечений, который считает все 100% позиций. Интуитивно выглядит так, что для такого движка предел (при таком способе его расчёта) будет заметно выше или вообще бесконечный. Нет?

номер сообщения: 54-31-5459

980	manowar Минск 27.05.2017 \| 14:20:06 все его сообщения: за день, за месяц, за все время

tahoma: Если представить себе условный движок вообще без отсечений, который считает все 100% позиций. Интуитивно выглядит так, что для такого движка предел (при таком способе его расчёта) будет заметно выше или вообще бесконечный. Нет?

Пределом такого движка будет просчет шахмат полностью.

номер сообщения: 54-31-5460

981	tahoma болельщик 27.05.2017 \| 15:07:05 все его сообщения: за день, за месяц, за все время

Ну да, отсюда и мой вопрос. Хотя я имел в виду именно реальный движок и обычную математику.

Вы же, как я понимаю, задаёте вопрос: "верно ли равенство (5000 Эло)=(полный просчёт игры)?"

номер сообщения: 54-31-5461

982	Vizvezdenec Ниже нуля 27.05.2017 \| 16:18:56 все его сообщения: за день, за месяц, за все время

tahoma: Ну да, отсюда и мой вопрос. Хотя я имел в виду именно реальный движок и обычную математику.

Вы же, как я понимаю, задаёте вопрос: "верно ли равенство (5000 Эло)=(полный просчёт игры)?"

Ну начальная позиция в шахматах, скорее всего, ничейна, так что бесконечности эло не выйдет.

номер сообщения: 54-31-5462

983	tahoma болельщик 27.05.2017 \| 23:05:08 все его сообщения: за день, за месяц, за все время

Да, возможно, что математическая эквивалентность этих вопросов для присутствующих очевидна. Но я профан, так что для меня нет.

номер сообщения: 54-31-5463

984	Big_Buddha 27.05.2017 \| 23:06:40 все его сообщения: за день, за месяц, за все время

Всё смешалось в доме Облонских...
На скорую руку провёл 4-круговой турнир движков с контролем 2+0.
Участники: Komodo 11.01 64-bit, Houdini 5.01 Pro x64-pext, Stockfish 8 64 BMI2, Stockfish 260517 BMI2.
Как и ожидал, победителем стал(а) Stockfish Development Version (7,5/12).
Новый Komodo отстал на очко, но... обыграл победителя при трёх ничьих, со Stocfish 8 обменялся баранками при двух ничьих, а с Houdini во всех партиях заключил мировую.
Houdini стал основным поставщиком очков победителю (+0-3=1), зато разок обыграл стабильную восьмёрку (+1-0=3).
Эта стабильная проиграла разрабатываемой (+0-1=2), зато, как уже писал выше, стала единственной участницей, которая смогла выиграть хоть одну партию у Komodo 11.01!
Такие вот дела...

номер сообщения: 54-31-5464

985	Vizvezdenec Ниже нуля 27.05.2017 \| 23:35:47 все его сообщения: за день, за месяц, за все время

Big_Buddha: Всё смешалось в доме Облонских...
На скорую руку провёл 4-круговой турнир движков с контролем 2+0.
Участники: Komodo 11.01 64-bit, Houdini 5.01 Pro x64-pext, Stockfish 8 64 BMI2, Stockfish 260517 BMI2.
Как и ожидал, победителем стал(а) Stockfish Development Version (7,5/12).
Новый Komodo отстал на очко, но... обыграл победителя при трёх ничьих, со Stocfish 8 обменялся баранками при двух ничьих, а с Houdini во всех партиях заключил мировую.
Houdini стал основным поставщиком очков победителю (+0-3=1), зато разок обыграл стабильную восьмёрку (+1-0=3).
Эта стабильная проиграла разрабатываемой (+0-1=2), зато, как уже писал выше, стала единственной участницей, которая смогла выиграть хоть одну партию у Komodo 11.01!
Такие вот дела...

Ну дистанция около отсутствующей.
Я вот за этим слежу http://www.talkchess.com/forum/viewtopic.php?topic_view=threads&p=716559&t=64077, в острых позициях Комодо 11 просто беспомощен пока против SFdev.

номер сообщения: 54-31-5465

986	Jeweller 28.05.2017 \| 17:42:53 Сайт Email все его сообщения: за день, за месяц, за все время

Vizvezdenec:

Надо бы отписать Kai Laskos, он вроде бы обычно таким занимается. Но у меня нет аккаунта на talkchess

У меня тоже нет, чукча там читатель...
Думаю, новый расчет неизбежен, Kai или кто-то еще скоро не выдержит :)

Интересно, что Kai упоминает близкий результат предельной силы, полученный до него Доном. Очевидно, что Дон смотрел на Комодо (на чем же еще?), а значит кое какой момент сравнения по разным движкам имеется - Гудини и (вероятно)Комодо тогда дали близкий результат.
До этого высказывался Васик, и вряд ли брал цифры с потолка, думаю смотрел на одной из первых Рыбок:

Году в 2006-м Райлих говорил, что хочет увидеть усиление до 4000 Elo в ближайшие 10 лет.

в реальности оказалось чуть медленнее.

номер сообщения: 54-31-5466

987	Big_Buddha 29.05.2017 \| 19:25:03 все его сообщения: за день, за месяц, за все время

Знающим немецкий будет легче:

«NIGHTMARE II»
25. AUGUST 2016
In 2005 I published a collection of test positions for chess engines, called «Nightmare». It was a set of 30 very difficult Puzzles. Today, more than ten years later, the modern engines are much stronger. So I created a new collection with 30 new hard positions. I found them in books, in chess forums, in studies databases a.o. (You can download all 30 positions as a EPD-File for your own experiments; with a fairly fast CPU, you should try 60 seconds per puzzle/engine ). Have fun with «Nightmare II»!

EPD-Download

Online nachspielen

См. также:
Nolot

номер сообщения: 54-31-5468

988	Jeweller 29.05.2017 \| 21:43:18 Сайт Email все его сообщения: за день, за месяц, за все время

благодарю! ищу "кошмарные" позиции, пока посмотрел это:

См. также:
Nolot

с большинством команда Stockfish + Critter 1.6a справляются за несколько секунд, кроме "проблемы 3" - не видят оба, и "проблемы 9" - возможно неверна

номер сообщения: 54-31-5469

989	Vizvezdenec Ниже нуля 30.05.2017 \| 00:45:50 все его сообщения: за день, за месяц, за все время

Jeweller: благодарю! ищу "кошмарные" позиции, пока посмотрел это:

См. также:
Nolot

Думаю, что в проблеме 3 при достаточной глубине стокфиш должен увидеть, тут как бы нет "прямого" выигрыша за белых, просто "очень сильная" компенсация за ферзя, а компы любят ферзей.

номер сообщения: 54-31-5470

990	Jeweller 30.05.2017 \| 22:05:17 Сайт Email все его сообщения: за день, за месяц, за все время

Vizvezdenec: Думаю, что в проблеме 3 при достаточной глубине стокфиш должен увидеть, тут как бы нет "прямого" выигрыша за белых, просто "очень сильная" компенсация за ферзя, а компы любят ферзей.

да, на глубине 33 берет, и дальше поднимает оценку:

номер сообщения: 54-31-5471

991	Vizvezdenec Ниже нуля 31.05.2017 \| 00:14:11 все его сообщения: за день, за месяц, за все время

Ну как я примерно и сказал. Такие жертвы ферзей за компенсацию компы видят, но не особо любят, пока не видят чёткого перевеса в вариантах. Если он там реально есть-рано или поздно досчитывают.
Так было и с жертвой от Каруаны против Накамуры, и тут вот тоже.
Более того, думаю, что стадию реализации комп проведёт куда точнее

номер сообщения: 54-31-5472

Страницы: [1] ... [31] [32] [33] [34] [35] ... [94]