|
|
|
|
|
|
|
|
|
|
Evgeny Gleizerov: vov:Была публикация про последние 10 секунд (или сколько там было секунд, не помню, там где Наварра в топ 1 попал). |
Просто для порядка: в топ-1 попал не Навара (с одним "р"), а Гольцев. С шахматной точки зрения критерий осмыслен, хотя желательно как-то отсеять позиции, где цена хода близка к нулю. Вроде бы Крамник это делает, это должно легко формализоваться. О статистической корректности судить не могу. |
Да, виноват, Навара на третьем месте, не на первом. Просто Навара публично отреагировал, очевидно обиделся и ммм, скажем так, расстроился. А про реакцию Гольцева мне неизвестно. Поэтому запомнился именно Навара
А о статистической корректности не только вы не можете судить. Никто не может. Нет данных. Ничего непонятно из этих цифр. Как их интерпретировать? Все, у кого среднее меньше 1,0 под подозрением, а остальные нет? Или граница 1,5? Или надо считать статзначимость отличия от среднего по всей выборке? Или вообще цифры сами по себе не важны, а просто все, кто лучше Карлсена - уже под подозрением? Или еще надо рейтинг как-то учитывать (исходя из предположения, что рейтинг зависит от силы игры, в том числе на последних секундах). Ничего нет. Просто enjoy. Но при этом, никакой интерпретации нет, а осадочек остался |
|
|
номер сообщения: 8-575-132768 |
|
|
|
Гольцев записал какое-то видео в свою защиту, может даже несколько, но кто ж его смотрит. |
|
|
номер сообщения: 8-575-132770 |
|
|
|
Почитатель: Roger: Vizvezdenec: Roger: Vizvezdenec: По стрикам я же даже сам моделирование делал.
У меня там получилось, что раз в 500 жизней примерно так и получится - что действительно не очень вероятно. Это вот именно данные, где были указаны конкретные цифры. |
А можно сказать, конкретно по какому стрику? |
Где-то в этой теме было, страниц 50 назад.
Ну там где какой-то 2600 или что-то в этом роде набрал 12/13 против игроков 2700+. |
Если это здесь, то я хотел бы сначала увидеть, что и где это такое. |
Роджер, ответьте мне, пожалуйста, вы: прогон этого скрипта (единичный прогон) имеет все права именоваться "моделированием" ? |
Вообще да, учитывая, что Vizvezdenec там не один прогон делал, а несколько, чтобы понять масштаб. Теоретическая вероятность в 2000 партиях на беспроигрышный стрик длиной 10 партий против оппозиции +240 - около 0.3% (для сравнения - набрать 7.5/10 на порядок проще).
Но это всё опять сферический конь в вакууме, потому что:
- такие редкие события плохо описываются вероятностями на границах распределений,
- что там в табличке, нам так и не сказали (спойлер: это не viih_sou на чесскоме). |
|
|
номер сообщения: 8-575-132774 |
|
|
|
номер сообщения: 8-575-132777 |
|
|
|
FIBM:Как я понимаю Viz имел в виду следующее: если 2600 играет против 2700+ 2000 партий, то с вероятностью 1/500 он сумеет один раз набрать 12/13. Это означает, что либо этому 2600 нужно сыграть 2000х500 партий, либо нужно, чтобы у нас было 500 шахматистов, играющих каждый 2000 партий, и тогда одному из них должен выпасть «счастливый билет».
(Конкретные числа, которые сильнейшим образом зависят от того какой рейтинг вы используете, я не проверял, разумеется). |
Ага, уже понятнее. Если там используются рейтинги Эло, то таких должно быть на порядок меньше 500. Но интересно, сколько именно и какая вероятность получается с учётом этого.
Далее, интересно, а это единственный, уникальный такой стрик или нет? Потому что если не уникальный, то вероятности же перемножаются и уходят совсем куда-то в область практически невозможного? Или я всё перепутал?
Я имею в виду не у этого игрока, а вообще, у всех таких игроков. Если такие стрики, сами по себе маловероятные, имеются у разных игроков, то единственное разумное объяснение - что эти игроки однотипно (в смысле поставленной задачи) читерят? Правильно? |
|
|
номер сообщения: 8-575-132781 |
|
|
|
A striking discovery, though, was that cheaters also performed worse on their own when they knew they'd be the ones using engine assistance. "The increase in the quality of the games was coming from the cheating moves, but for the rest of the time, they were just so distracted (...) and also feeling a bit guilty."
This finding puts in question the notion that players could gain a considerable amount of rating points by getting just a few suggestions per game. Smerdon mentioned this idea makes sense if everything else remains equal, but in practice, playing while cheating is not the same as playing clean. |
Тут есть одна проблема: некорректно делать выводы об игре профессионалов и тем более топ-игроков на основе эксперимента, в котором участвовали любители с рейтингами 1600-2300. Очень странно, что гроссмейстер Смердон не делает эту важную оговорку. Там дальше описывается другой эксперимент, в котором участвовали и профессионалы, включая Каруану. Но это другой.
А так-то и без эксперимента понятно, что если привык подсматривать, то со временем начинаешь играть хуже, когда подсмотреть не получается. Но весь вопрос, с каким временем, то есть как долго может продержаться классный профессионал без снижения качества самостоятельной игры. На игре любителей это не определишь. |
|
|
номер сообщения: 8-575-132783 |
|
|
|
vov: Или вообще цифры сами по себе не важны, а просто все, кто лучше Карлсена - уже под подозрением? |
Исходя из просто здравого смысла, без математики - безусловно. Если игрок, не относящийся к топу, стабильно играет лучше Карлсена на последних секундах, это весьма подозрительно. Но подозрения могут оказаться и неоправданными, разумеется. |
|
|
номер сообщения: 8-575-132784 |
|
|
|
vov:
А о статистической корректности не только вы не можете судить. Никто не может. Нет данных. Ничего непонятно из этих цифр. Как их интерпретировать? Все, у кого среднее меньше 1,0 под подозрением, а остальные нет? Или граница 1,5? Или надо считать статзначимость отличия от среднего по всей выборке? Или вообще цифры сами по себе не важны, а просто все, кто лучше Карлсена - уже под подозрением? Или еще надо рейтинг как-то учитывать (исходя из предположения, что рейтинг зависит от силы игры, в том числе на последних секундах). Ничего нет. Просто enjoy. Но при этом, никакой интерпретации нет, а осадочек остался |
1. Если не просто говорить «никто не может», а попытаться разобраться, что мы знаем или можем предположить для статистической обработки базы данных, то у нас есть РЕЙТИНГ и зависимость результатов партий от разницы в рейтингах. Разумеется, обсуждаемо какой рейтинг нужно брать для анализа-онлайн, фиде, или др.
2. Мы знаем, что вероятности результатов статистически хорошо описываются соотношениями рейтингов (проверка этого предположения есть у Розенталя)
Поэтому каждый критерий (предложенный Крамником, Васей Пупкиным, или другими) нужно также проверять на соответствие рейтингам. Если выяснится, что выбранный критерий статистически хорошо описывается рейтингом, то -«аномалии по этому критерию» становятся значимы для красного флага. Чем больше мы найдем критериев, которые статистически хорошо описываются рейтингом, тем больше у нас будет значимых аномалий для определения читер/не читер.
3. Предложение «критериев» это дело сильных шахматистов. Проверка критериев на соответствие рейтингам это дело специалистов по работе с базами данных, и примкнувших к ним профессионалов смежных специальностей.
П.С. «Стрики» хороший критерий, потому что это результат партии, и мы ЗНАЕМ, что результаты партий соответствуют рейтингам. О других критериях мы этого не знаем, а можем только догадываться. |
|
|
номер сообщения: 8-575-132786 |
|
|
|
Как изменилась в наше время роль рейтинга! Раньше, его величина указывала на шахматную силу игрока. Теперь же с его помощью определяют меру жульничества.
__________________________
Спасение там, где опасность. |
|
|
номер сообщения: 8-575-132787 |
|
|
|
Evgeny Gleizerov: FIBM:Как я понимаю Viz имел в виду следующее: если 2600 играет против 2700+ 2000 партий, то с вероятностью 1/500 он сумеет один раз набрать 12/13. Это означает, что либо этому 2600 нужно сыграть 2000х500 партий, либо нужно, чтобы у нас было 500 шахматистов, играющих каждый 2000 партий, и тогда одному из них должен выпасть «счастливый билет».
(Конкретные числа, которые сильнейшим образом зависят от того какой рейтинг вы используете, я не проверял, разумеется). |
Ага, уже понятнее. Если там используются рейтинги Эло, то таких должно быть на порядок меньше 500. Но интересно, сколько именно и какая вероятность получается с учётом этого.
Далее, интересно, а это единственный, уникальный такой стрик или нет? Потому что если не уникальный, то вероятности же перемножаются и уходят совсем куда-то в область практически невозможного? Или я всё перепутал?
Я имею в виду не у этого игрока, а вообще, у всех таких игроков. Если такие стрики, сами по себе маловероятные, имеются у разных игроков, то единственное разумное объяснение - что эти игроки однотипно (в смысле поставленной задачи) читерят? Правильно? |
Смотрите как это делается. У на есть разница в рейтингах игроков, которая определяет вероятность результата одной партии. После этого считая результаты партий независимыми событиями ищется вероятность « стрика» определенной длины. Но это только начало . После этого нужно смотреть сколько партий ( в примере Viz это 2000) сыграл конкретный игрок с соперниками (с такой разницей в рейтингах), и определить вероятность найти такой стрик среди всех сыгранных этим конкретным игроком партий. Эта вероятность будет заведомо больше чем, найденная в начале. Если эта вероятность порядка 1, то такой стрик аномалией не является, но если существенно меньше единицы (скажем 0.1), то аномалия -значима (и здесь совершенно не важно, что в «выдуманном мире» есть 500 игроков сыгравших по 2000 партий с такой разницей в рейтинге и у которых со 100% найдется такая аномалия).
Разумеется, вся эта «кухня» основана на предположении, что разница в рейтингах «статистически точно» определяет результат партии. |
|
|
номер сообщения: 8-575-132788 |
|
|
|
Это я вроде бы понимаю. Я спрашивал о другом: целесообразно ли смотреть не только этого игрока, но и других близких по рейтингу игроков? Потому что если допустить, что 500 игроков, сыгравших по 2000 партий с такой разницей в рейтинге, существуют не в выдуманном, а в реальном мире, то изменит ли это оценку данного стрика как аномалии? А если таких игроков в реальном мире не 500, а 100, увеличит ли это вероятность данного стрика с 1/500 до 1/5? Я имею в виду не вероятность данного стрика у данного конкретного игрока, а вероятность у какого-нибудь из этих игроков, всё равно какого?
Потому что где-то мне попадалось, что вероятность рождения каждого конкретного человека, вот именно с таким набором генов, практически неотличима от нуля - если брать за исходную точку мир за несколько поколений до его рождения. Но, тем не менее... |
|
|
номер сообщения: 8-575-132789 |
|
|
|
1. мы живём в вероятностном мире
2. вероятность и теория об ней крайне контринтуитивна (мне сложно подобрать пример чего-то более контринтуитивного)
3. куда смотрит еволюция?? |
|
|
номер сообщения: 8-575-132796 |
|
|
|
номер сообщения: 8-575-132797 |
|
|
|
Evgeny Gleizerov: Это я вроде бы понимаю. Я спрашивал о другом: целесообразно ли смотреть не только этого игрока, но и других близких по рейтингу игроков? . |
Не просто целесообразно, а обязательно. В нашем примере исследователь «аномалий» должен в базе найти всех «чудаков» сыгравших примерно 2000 партий с соперниками на 100 единиц больше, и выяснить сколько таких стриков среди всех «чудаков», и сравнить с расчетами. В реальности, разумеется, все несколько сложнее.
Однако такую процедуру используют только в том случае, если поставлена задача объективно обосновать (или отказаться) от используемого «критерия». Если же задача в том, чтобы показать некомпетентность оппонента, то используют сильно упрощенную процедуру . |
|
|
номер сообщения: 8-575-132798 |
|
|
|
Спасибо. Тогда такой вопрос: проводил ли такую процедуру Крамник? Или просто выхватил один отдельно взятый стрик одного отдельно взятого игрока? |
|
|
номер сообщения: 8-575-132799 |
|
|
|
О чём вы вообще разговариваете, можно узнать? |
|
|
номер сообщения: 8-575-132800 |
|
|
|
Evgeny Gleizerov: Спасибо. Тогда такой вопрос: проводил ли такую процедуру Крамник? Или просто выхватил один отдельно взятый стрик одного отдельно взятого игрока? |
1. Нет не проводил.
2. Имхо. Это, вообще, не дело шахматиста проводить объективный статистический анализ «критерия». Задача шахматиста предложить «критерий» (критерии) для определения статистических аномалий (маловероятных событий), которые ВЫГЛЯДЯТ разумно. .
3. Дальнейшим обоснованием значимости (не значимости) критерия должны заниматься профессионалы. В пункте 3 большая проблема, так как здесь процедура совсем не такая быстрая (и однозначная) как в пункте Тем более, что и интерес профессионалов к этой проблеме в данный момент достаточно низок. Так что задача шахматного сообщества заинтересовать профессионалов в этой деятельности. Пока это получается очень плохо. |
|
|
номер сообщения: 8-575-132802 |
|
|
|
FIBM: 3. Дальнейшим обоснованием значимости (не значимости) критерия должны заниматься профессионалы. |
и пока все известные нам ответы профессионалов были про незначимость предложенных критериев. прошел, напоминаю, годик. тем не менее, весь этот бред продолжает обсуждаться с серьезными лицами.
как-то вот именно так и выглядит "торговля званием". зрелище то еще |
|
|
номер сообщения: 8-575-132803 |
|
|
|
Уж не знаю, сойду ли я за профессионала, но считаю, что предложенные Крамником критерии значимы, и говорил здесь об этом не раз. И это мнение отнюдь не маргинальное. |
|
|
номер сообщения: 8-575-132804 |
|
|
|
Осталось выяснить, каких профессионалов имел в виду FIBM. |
|
|
номер сообщения: 8-575-132806 |
|
|
|
Определять значимость критериев - это дело именно шахматистов. Дело математиков - определять степень корректности работы с данными, вытекающими из этих критериев. Нешахматист никак не может судить о значимости, допустим, качества игры на последних десяти секундах по сравнению с иным отрезком партии. |
|
|
номер сообщения: 8-575-132807 |
|
|
|
Тут опущен важный этап - откуда вообще эти критерии берутся. А то вдруг окажется, что они специально настроены так, чтобы указывать на какого-нибудь условного Гольцева? |
|
|
номер сообщения: 8-575-132808 |
|
|
|
я в етом месте поддержу Евгения (с огромной кучей оговорок, но фиг с ними) что шахматные профессионалы важны для определения критериев и их критики. Но во-первых тогда нужно честно опрашивать не активистов - а именно что первую тыщу хотя бы (в которую я не вхожу давно) для представления о единстве шахматно-профессионального мира, во-вторых как-то грамотно делать поправку на заинтересованность тех профессионалов (не обязательно материальную), а в третьих-нулевых по важности как уже говорилось - как-то заинтересовать профессиональных математиков - и тоже точно не одного-двух, а десятки - чтобы не принять за профессиональное мнение чьё-то ангажированное-предвзятое.
А по "вопросу Гольцева" всё просто - какой бы ни был в итоге консенсусный критерий - по нему в принципе нельзя проверять одного - нужно обязательно сразу всех (ну хотя бы опять же первую тыщу). |
|
|
номер сообщения: 8-575-132809 |
|
|
|
Evgeny Gleizerov: Определять значимость критериев - это дело именно шахматистов. Дело математиков - определять степень корректности работы с данными, вытекающими из этих критериев. Нешахматист никак не может судить о значимости, допустим, качества игры на последних десяти секундах по сравнению с иным отрезком партии. |
1. Я, наверное, неаккуратно выразился. Разумеется только шахматист понимает, что качество игры на последних секундах это может быть важным показателем для определения читерства. И, только шахматист понимает, что, наверное, должна быть корреляция силы игры на последних секундах с рейтингом. Из этих двух «может быть» и «наверное» шахматист делает вывод об «аномалиях». Так вот доказательство (или опровержение) этих «может быть», и «наверное» как раз и есть дело профессионалов.
2. Кто такие эти «профессионалы»? В этой теме нужны «профи» по работе с базами данных и по анализу различных статистических закономерностей в случайных системах. Так что осталось только «уговорить королеву» |
|
|
номер сообщения: 8-575-132810 |
|
|
|
Roger: Тут опущен важный этап - откуда вообще эти критерии берутся. А то вдруг окажется, что они специально настроены так, чтобы указывать на какого-нибудь условного Гольцева? |
Это возможно, но в рамках "брать последние 10 секунд или 9, или 11". В данном случае число круглое, так что специальная настройка маловероятна.
В принципе, если нас интересует один из многих рациональных способов читерства "играю сам, на последних секундах подключаю движок", то этот критерий значим. Разумеется, при других, не менее рациональных способах читерства он оказывается незначимым. Способов читерства много, соответственно и критериев должно быть много. Общее одно - возможность выявления и, главное, формализации тех или иных аномалий. Хотя задача это крайне трудная, не уверен, что вообще разрешимая. В частности, при обсуждаемом критерии достаточно трудно формализовать само понятие "качества игры". Например, при определённой манере игры исход партии чаще решается в конкретных тактических стычках, при другой - в тягучих окончаниях с невысокой ценой хода. Ясно, что игрок со второй манерой будет иметь более высокое качество игры на последних секундах - просто потому, что задачи, стоящие перед ним, будут гораздо легче. И т. д. и т. п.
Короче, всё это очень сложно и, естественно, любые попытки найти подходы к такой трудной проблеме уязвимы для критики. Иначе и быть не может. Это тот самый случай, когда не ошибается тот, кто ничего не делает. |
|
|
номер сообщения: 8-575-132811 |
|
|
|
ну и кстати удивительно много говорят о статистике и удивительно мало о криминалистике. А ведь частный сыщик куда дешевле хорошего математика (другое дело что для некоторых задач можно и студента нанять). |
|
|
номер сообщения: 8-575-132813 |
|
|
|
Почитатель: Vladimir Kramnik
@VBkramnik
Just have recorded quite tough conversation with Greg Mustreader, will be very interesting, I promise
Thank you Gregory that dared to invite me,the only one so far, to share points with audience |
|
И очередной скандал в результате. Ещё один враг. |
|
|
номер сообщения: 8-575-132814 |
|
|
|
номер сообщения: 8-575-132815 |
|
|
|
если у василия п. проблемы со всеми, проблемой, скорее всего, является василий п. |
|
|
номер сообщения: 8-575-132816 |
|
|
|
Критерий игры на последних секундах очень интересный.
Недавно тоже играл с чуваком на 200+ пунктов слабее, переиграл, но в эндшпиле произошло чудесное преображение, было полное ощущение что стал играть кто-то другой. Уверенно, быстро, даже не без ошибок уже на добавке, но полное ощущение что это не тот игрок, что играл дебют и миттельшпиль.
Конечно, всё бывает... |
|
|
номер сообщения: 8-575-132820 |
|
|
|
|
|
|
|
|
Copyright chesspro.ru 2004-2024 гг. |
|
|
|