|
|
|
|
|
|
|
|
|
|
Chess960 - % очков белых по множеству позиций
Минимум - BBRKQNRN - белые набирают 53,2% (преимущество белых 22 Elo)
Максимум - QNBBRKRN - 73,05% (преимущество белых 173 Elo)
Среднее - зеленая точка в центре - 63,56% (преимущество белых 97 Elo)
Классическая позиция обозначена зеленой точкой в самой левой части распределения - 54,1% (преимущество белых 29 Elo). В рамках погрешности при небольшом количестве партий (342 партии) это совпадает с известными данными.
Классическая позиция находится ближе всего к равновесию белых и черных, ближе только одна позиция (BBRKQNRN), но она несимметрична.
Всего в распределении 193 300 партий и среднее определено с высокой точностью. Оно существенно сдвинуто в сторону белых (+97 Elo), по сравнению с классической позицией (+29 Elo).
____________
Огромный перепад баланса сил сторон по множеству позиций (19,85% и 151 Elo между наиболее и наименее равновесной), на мой взгляд, делает невозможным использование Chess960 в человеческих шахматах, в режиме, привычном для классической позиции, если случайным образом выбирать одну из 960. На короткой дистанции в несколько партий, характерной для человеческих шахмат, участники турнира или матча будут иметь отличающиеся в широких пределах мат ожидания результата. Одним попадется больше позиций с большим перевесом белых, другим меньше. Это возвращает в игру сильный случайный фактор, делающий честное (в смысле отсутствия внешних, независимых от участников, шумов) соревнование невозможным. |
|
|
номер сообщения: 8-505-81649 |
|
|
|
Можно предложить несколько вариантов, возвращающих возможность использования Chess960 среди людей.
1) Разбиение множества из 960 позиций на 8 групп по 120 позиций:
A - 1-120 - среднее 57,86%, перепад в группе 6,35%
B - 121-240- 60,41%, 1,65%
C - 241-360 - 61,87%, 1,25%
D - 361-480 - 63,02%, 1,05%
E - 481-600 - 64,10%, 1,10%
F - 601-720 - 65,19%, 1,15%
G - 721-840 - 66,69%, 1,80%
H - 841-960 - 69,37%, 5,40%
Разбиение позволяет уменьшить перепад мат ожиданий, и использовать в одном соревновании позиции только из одной группы. Как видно из таблички выше, наименее пригодны группы A (в которой находится классическая позиция) и H, перепад мат ожиданий по позициям в этих группах максимальный. На мой взгляд, делающий их малопригодными(непригодными) для практики. А вот остальные 6 групп, особенно 4 центральные группы C, D, E, F, с минимальным перепадом чуть больше 1% внутри, для практического использования пригодны.
Для достоверного определения персонального состава групп, имеющаяся статистика CCRL недостаточна из-за малого числа партий. Для определения % очков белых с точностью 0,1% (или около 1 Elo), по грубым расчетам необходимо наиграть ~1/2 миллиона партий для каждой из 960 позиций. Группа компов с движками, поддерживающими Chess960, может это сделать за обозримое время.
2) Перейти на игру пары партий в день по одной позиции с переменой цвета (в одной паре людей). Для этого нужно уменьшить классический контроль времени на партию в 2 раза. Это позволяет, во-первых, установить абсолютный баланс в паре играющих - мат ожидание всегда будет 50/50 для любой позиции. Во-вторых, абсолютно уравнять все пары в турнире - мат ожидание для всех пар всегда будет 50/50. В третьих, вновь сделать возможным практическое использование всех 960 позиций на равных основаниях. |
|
|
номер сообщения: 8-505-81650 |
|
|
|
Желательно, чтобы одинаковые движки играли позиции. На самом деле, на основании статистики партий, пока вообще почти ничего про позиции сказать нельзя. Так как с таким малым количеством партий на позицию будет разброс и при полностью равных позициях. То есть, играем две равные позиции с одинаковым небольшим перевесом белых, в одной будет в пользу белых 55-45, в другой - 60-40, а позиции полностью равные. На самом деле, практически все они очень сильно ничейные, так как играют расстановки равной силы. |
|
|
номер сообщения: 8-505-81651 |
|
|
|
Programmist: На самом деле, на основании статистики партий, пока вообще почти ничего про позиции сказать нельзя. Так как с таким малым количеством партий на позицию будет разброс и при полностью равных позициях. То есть, играем две равные позиции с одинаковым небольшим перевесом белых, в одной будет в пользу белых 55-45, в другой - 60-40, а позиции полностью равные. | Да, погрешность по каждой отдельной позиции очень велика при 200 партиях в среднем на каждую. Это не важно, мне важно было посмотреть картину в целом. Одну позицию качнуло влево, другую вправо, но распределение прорисовывается четко, среднее по 960 позициям статистически достоверно, и намного больше известного для классической позиции:Среднее - зеленая точка в центре - 63,56% (преимущество белых 97 Elo) | Левая и правая части распределения симметричны, классическая позиция находится там где и должна - все эти вещи говорят о достаточном правдоподобии картины.
На самом деле, практически все они очень сильно ничейные, так как играют расстановки равной силы. | Тезис о ничейности одинаковых расстановок для меня сейчас не очевиден. Даже если он верен, практическое значение для человеческих шахмат имеет область 1400-2800. В области, близкой к пределу силы, где-нибудь в районе 4500-4900, распределение действительно может выродиться в две группы позиций - ничейных и выигрышных для белых. Но на уровне 1500-3600 CCRL, на котором движки наигрывали с контролем 40/4, имеем непрерывную функцию. В человеческом диапазоне распределение должно быть похожим/таким же. |
|
|
номер сообщения: 8-505-81652 |
|
|
|
Вы не совсем обратили внимание, если провести 960 серий бросания одной монетки 200 раз, то каждый раз не будет 50%, а будет то больше, то меньше, и получится распределение, очень похожее на то, которое вы привели. То есть, за разницы баланса позиций во многом принят просто статистический разброс. Можно смоделировать 960 серий по 200 партий со средним набором очков 63%, и увидеть сходное распределение. |
|
|
номер сообщения: 8-505-81653 |
|
|
|
Такой контраргумент естественно возник и у меня. Это проверяется достоверностью крайних точек. Классическая позиция слева достоверно в районе 55%, мы это знаем по большой статистике. Крайняя точка справа, это можно (нужно) проверить - наиграть там несколько тысяч позиций.
Вывод о том, что распределение не искусственно разжато из-за маленького числа партий, а естественно, я пока делаю на основании неслучайности левого края, и симметрии левой и правой частей. |
|
|
номер сообщения: 8-505-81654 |
|
|
|
Можно просто кинуть 960 раз серию из 200 бросков монеты с 63% перекоса и посмотреть, что получится. |
|
|
номер сообщения: 8-505-81655 |
|
|
|
Классическая позиция наигрывалась с дебютной базой с каких-то дебютных вариантов после 6-8 проанализированных ходов, так что это не совсем точное сравнение, и однозначно сказать нельзя.
Скорее всего, разница средних по Фишеру и по классике объясняется разностью проведения испытаний. Плюс, движки твикнуты на классическую позицию. |
|
|
номер сообщения: 8-505-81656 |
|
|
|
Необходимо обратить внимание, что, если разыгрывать позицию в блиц не после 12 хороших дебютных ходов, а с самого начала, то преимущество будет больше, так как легче попасть случайно в не очень корректный трудный вариант и проиграть. |
|
|
номер сообщения: 8-505-81658 |
|
|
|
Пока думаю, как лучше наиграть для нескольких позиций из крайней правой области. Если там будет подтвержден перекос ~70-73%, это снимает вопросы. |
|
|
номер сообщения: 8-505-81659 |
|
|
|
Я кину 960 раз по 200 одинаковую монету с 63% и покажу статистику, классическая позиция тестировалась в других условиях. |
|
|
номер сообщения: 8-505-81660 |
|
|
|
Programmist: Необходимо обратить внимание, что, если разыгрывать позицию в блиц не после 12 хороших дебютных ходов, а с самого начала, то преимущество будет больше, так как легче попасть случайно в не очень корректный трудный вариант и проиграть. |
Небольшой тест с игрой с самого начала делался месяц назад, блиц 1'+1'', увеличение перекоса не происходит, наоборот, он немного уменьшается:
Тест 1.d4 - Белые набрали 52,8% очков:
Games : 200 (finished)
White Wins : 65 (32.5 %)
Black Wins : 54 (27.0 %)
Draws : 81 (40.5 %)
Unfinished : 0
White Perf. : 52.8 %
Black Perf. : 47.2 % |
|
1.e4 также немного смотрел, картина та же, перекос уменьшается. |
|
|
номер сообщения: 8-505-81661 |
|
|
|
Я нагенерил 960 серий одной и той же монеты, распределение очень похожее. Полно "позиций" с 0.55 и хвостов в верх в 0.725 |
|
|
номер сообщения: 8-505-81662 |
|
|
|
Так это другой контроль, а не ccrl. В ccrl играли разные движки разной силы, а у вас матч одного движка наверное. То есть, вообще другие условия. Поставьте ему фишеровскую позицию, может быть похоже. Дело еще в том, что некоторые фишеровские позиции требуют чуть более точной игры вначале, чем классическая, так что от контроля многое зависит. Движок просто не видит варианта с перевесом или равеноством с таким коротким контролем. |
|
|
номер сообщения: 8-505-81663 |
|
|
|
Jeweller: Programmist: На самом деле, на основании статистики партий, пока вообще почти ничего про позиции сказать нельзя. Так как с таким малым количеством партий на позицию будет разброс и при полностью равных позициях. То есть, играем две равные позиции с одинаковым небольшим перевесом белых, в одной будет в пользу белых 55-45, в другой - 60-40, а позиции полностью равные. | Да, погрешность по каждой отдельной позиции очень велика при 200 партиях в среднем на каждую. Это не важно, мне важно было посмотреть картину в целом. Одну позицию качнуло влево, другую вправо, но распределение прорисовывается четко, среднее по 960 позициям статистически достоверно, и намного, больше известного для классической позиции:Среднее - зеленая точка в центре - 63,56% (преимущество белых 97 Elo) | Левая и правая части распределения симметричны, классическая позиция находится там где и должна - все эти вещи говорят о достаточном правдоподобии картины.
На самом деле, практически все они очень сильно ничейные, так как играют расстановки равной силы. | Тезис о ничейности одинаковых расстановок для меня сейчас не очевиден. Даже если он верен, практическое значение для человеческих шахмат имеет область 1400-2800. В области, близкой к пределу силы, где-нибудь в районе 4500-4900, распределение действительно может выродиться в две группы позиций - ничейных и выигрышных для белых. Но на уровне 1500-3600 CCRL, на котором движки наигрывали с контролем 40/4, имеем непрерывную функцию. В человеческом диапазоне распределение должно быть похожим/таким же. |
С точки зрения человеческих шахмат, такая бито-ничейность в стиле классической позиции выльется в то, что уже на мастерском и гроссмейстерском уровне шахматисты будут все менять и соглашаться на ничью. Тем более, есть много таких шахматистов, как Сергей Юрьевич, которые не любят играть в незнакомых позициях, и которые будут сразу сворачивать игру при первых признаках. Мне не интересно. Мне тогда уж больше нравится Fractal Random Chess с игрой на два результата. |
|
|
номер сообщения: 8-505-81664 |
|
|
|
Среднее - зеленая точка в центре - 63,56% (преимущество белых 97 Elo) |
У себя в базе нашел 46 партий по Chess960 в Майнце: +19-7=20 (статистика мизерная)
Белые набрали 29/46 = 63,04%
Это близко к среднему по распределению на графике, и далеко от среднего по классике |
|
|
номер сообщения: 8-505-81666 |
|
|
|
Классическая позиция испытывалась в совсем других условиях. Тут можно говорить только о неком "человеческом" перевесе. То есть, некоторые расстановки требуют немного более точной игры, чем другие. Но пока распределение соответствует одинаковой монете. |
|
|
номер сообщения: 8-505-81667 |
|
|
|
Jeweller: Programmist: Необходимо обратить внимание, что, если разыгрывать позицию в блиц не после 12 хороших дебютных ходов, а с самого начала, то преимущество будет больше, так как легче попасть случайно в не очень корректный трудный вариант и проиграть. |
Небольшой тест с игрой с самого начала делался месяц назад, блиц 1'+1'', увеличение перекоса не происходит, наоборот, он немного уменьшается:
Тест 1.d4 - Белые набрали 52,8% очков:
Games : 200 (finished)
White Wins : 65 (32.5 %)
Black Wins : 54 (27.0 %)
Draws : 81 (40.5 %)
Unfinished : 0
White Perf. : 52.8 %
Black Perf. : 47.2 % |
|
1.e4 также немного смотрел, картина та же, перекос уменьшается. |
А что, ув Jeweller, оказывается, вы смотрели 1.е4 на движках!... Что же помешало вам привести результат теста, как вы это сделали для прочих ходов?! Ведь, я, буквально, упрашивал вас об этом. Но, получается как всегда: когда результат говорит не в вашу пользу, то лучше отмолчаться. Жаль, конечно... |
|
|
номер сообщения: 8-505-81668 |
|
|
|
Programmist: Классическая позиция испытывалась в совсем других условиях. Тут можно говорить только о неком "человеческом" перевесе. То есть, некоторые расстановки требуют немного более точной игры, чем другие. Но пока распределение соответствует одинаковой монете. | Это понятно, что похоже на естественное распределение. Однако есть два факта:
среднее этого распределения статистически достоверно на уровне 63-64, и классическая позиция статистически достоверно на уровне 55.
1. В какие условия нужно поставить классику, чтобы она дала 63-64? (Если Вы говорите, что 55 получено совсем в других)
2. Если распределение естественное, с увеличением статистики оно должно сжиматься, и классика обязана подтянуться к 63-64.
3. Испытания крайних справа позиций также должно дать результат 63-64.
Все это проверяется, постепенно, надеюсь, истину выясним. |
|
|
номер сообщения: 8-505-81669 |
|
|
|
AGUSA96: А что, ув Jeweller, оказывается, вы смотрели 1.е4 на движках!... | Нет, начал смотреть вместе с 1.d4, пока не определился на каком одном остановиться. У меня и написано "немного смотрел". Процент там был близкий к d4, но партий всего несколько штук, недостоверные выводы. |
|
|
номер сообщения: 8-505-81670 |
|
|
|
Про крайние справа, там есть несколько позиций с перевесом за счет быстрой атаки на слабые пункты. Скорее, эта статистика может отражать характер позиции. Более спокойная, как, возможно, классическая, или более счетная, как некоторые, где движкам на коротком контроле больше возможности ошибиться.
Устойчивые 55% классика дает с базой партий и игрой после дебютных вариантов. |
|
|
номер сообщения: 8-505-81671 |
|
|
|
Programmist: Устойчивые 55% классика дает с базой партий и игрой после дебютных вариантов. | Насколько понимаю, в рейтинге CCRL 40/4 FRC никакие базы и книжки не используются, движки с самого начал играют сами, и 54,1% классики получены тогда естественно.
Какое у Вас предположение, классика должна 63-64 давать без книг, правильно? |
|
|
номер сообщения: 8-505-81672 |
|
|
|
О, я ошибся! 3 недели затмения, элементарная ошибка, как можно было этого 3 недели не видеть?? :)
Chess960 возможно спасен, и нет там никакой проблемы. |
|
|
номер сообщения: 8-505-81673 |
|
|
|
Jeweller: Programmist: Устойчивые 55% классика дает с базой партий и игрой после дебютных вариантов. | Насколько понимаю, в рейтинге CCRL 40/4 FRC никакие базы и книжки не используются, движки с самого начал играют сами, и 54,1% классики получены тогда естественно.
Какое у Вас предположение, классика должна 63-64 давать без книг, правильно? |
Так пока они еще не стабильны, так как мало партий, а наиграть 1000 различных на смеси разных движков разной силы не так просто.
И какая же это идея? |
|
|
номер сообщения: 8-505-81674 |
|
|
|
Нелепая ошибка исправлена (неправильно посчитал % белых). Вот правильное распределение:
Минимум - RNBQKBNR (классическая позиция, зеленая точка слева) - белые набирают 40,8% (преимущество белых -65 Elo)
Дальше большой "разрыв" в 3,7%, и следующая позиция - RNKBBRNQ - белые набирают 44,5%.
Максимум - NBQNBRKR - 62,6% (преимущество белых 89 Elo)
Простое среднее - зеленая точка в центре - 52,61% (преимущество белых 18 Elo)
1) Все нормально со средним - это очень важный факт. Статистика 193 300 партий делает его статистически достоверным. Значит, по партиям CCRL, в Chess960 нет большого перекоса в сторону белых, нет "системного дисбаланса"
2) По мере наигрывания партий, распределение должно начать сжиматься к среднему значению. Это нужно проверить. Возможно, найдется несколько позиций с дисбалансом, которые не сожмутся, но их должно быть совсем немного.
Интересен "обратный перекос" классической позиции. Тестировали без книг, 342 партии не мало. |
|
|
номер сообщения: 8-505-81675 |
|
|
|
Нижняя грань при симуляции с этим средним получается как раз такой величины. |
|
|
номер сообщения: 8-505-81676 |
|
|
|
То есть Вы ошиблись, прибавив к набранному белыми еще и ничьи белых ? Сразу показалось, что какая-то грубая ошибка, но проверять не стал. Также ошибка скорее всего и по классической расстановке в шахматах Фишера ( но она одна и это не важно).
Но смотреть нужно не на это. Более показателен процент ничьих. А он заметно ниже , чем в современной классике. То есть боевых партий значительно больше даже у движков (которые "безгрешнее" ).
То, что это простое и мало что показывающее статистическое распределение на очень малой выборке -понятно хотя бы по тому, что почти в половине партий черные набирают больше. Это "нонсенс", если бы данных было достаточно. Либо на небольшом количестве партий по каждой из расстановок был перекос по этим расстановка в сторону сильных программ за черный цвет, либо равные программы сильно различаются в понимании разных структур.. |
|
|
номер сообщения: 8-505-81677 |
|
|
|
Мал процент ничьих у движков, шахматисты всегда найдут возможность согласиться на ничью. |
|
|
номер сообщения: 8-505-81678 |
|
|
|
xajik: Также ошибка скорее всего и по классической расстановке в шахматах Фишера ( но она одна и это не важно). |
С классической расстановкой на CCRL ошибки нет (скачал, проверил):
Games : 342 (finished)
White Wins : 94 (27.5 %)
Black Wins : 157 (45.9 %)
Draws : 91 (26.6 %)
Unfinished : 0
White Perf. : 40.8 %
Black Perf. : 59.2 % | Белые начинали e4, d4, Kf3, Kc3, и 40,8% без книг - упрямый факт. Много лет назад я проводил турниры без книг, но ничего подобного не получал. Может быть, переключение движков на режим Chess960, что-то меняет в них так, что они проваливают начало без книг. На 342 партиях 40,8 все же слишком большое отклонение.
Более показателен процент ничьих. А он заметно ниже , чем в современной классике. То есть боевых партий значительно больше даже у движков (которые "безгрешнее" ) |
CCRL 40/4 - 45,50% ничьих для первой десятки
CCRL 40/4 FRC - 27,23% ничьих для первой десятки, на 40% меньше.
Но, с увеличением контроля и силы % ничьих быстро растет:
CCRL 40/40 - уже 59,01% ничьих для первой десятки
Последний Regression test Стокфиша - уже около 80%
Chess960 (на человеческом уровне) пока освоен мало, будет иметь пониженный % ничьих относительно классики, но постепенно (имхо) разница будет уменьшаться. Это все таки не сёги, где % ничьих близок к нулю и вообще такой проблемы не существует.
добавлено: другое дело, что режим "пока освоен мало", или "относительно мало", может продолжаться очень долго |
|
|
номер сообщения: 8-505-81679 |
|
|
|
Jeweller: 2) По мере наигрывания партий, распределение должно начать сжиматься к среднему значению. Это нужно проверить. Возможно, найдется несколько позиций с дисбалансом, которые не сожмутся, но их должно быть совсем немного. | Схема проверки пока выглядит так: взять несколько десятков позиций с наибольшим отклонением из крайней левой области. Взять 10-20 сильных движков близких по силе, умеющих играть в Chess960, и прогнать их по набору позиций - так наиграть 1000-10000 партий и посмотреть.
То же самое сделать для крайней правой области.
Если в обоих случаях будет получен % очков белых, равный (в пределах погрешности) среднему значение для всего набора 960 позиций - с Chess960 все хорошо.
Тест начну, скорее всего, через несколько недель. Если у кого есть идеи, как сделать его лучше, поделитесь, можно в приват. |
|
|
номер сообщения: 8-505-81681 |
|
|
|
|
|
|
|
|
Copyright chesspro.ru 2004-2024 гг. |
|
|
|