|
|
|
|
|
|
|
|
|
|
Evgeny Gleizerov: Я, конечно, далеко не математик, но, по-моему, рейтинг в количествах, вызывающих дефляцию, уносят не Накамуры, а игроки с 1500, массово прекращающие играть в турнирах. |
Это если они, скажем, поднялись с 1000. Но еще раз подчеркиваю: 1000 - это не "начальный рейтинг". Начальный рейтинг шахматист получает по итогам первых выступлений, он может быть и 1000, и 1500, и 2000, и даже выше 2500, как у Трушникова. Если шахматист сначала получил 1800, потом упал до 1500 и прекратил выступления, то он внес в копилку инфляции (а не дефляции) 300 очков (на самом деле может быть меньше или больше, зависит от К его и его соперников). |
|
|
номер сообщения: 150-9-28805 |
|
|
|
А вообще: неужели не найдется кто-то, кто напишет диссертацию на тему рейтингов ФИДЕ: их стабильности, инфляции, дефляции, влияния на них разных факторов и т.п.? Или это как научная тема никому не интересно? |
|
|
номер сообщения: 150-9-28806 |
|
|
|
У такой работы нет перспективы практического применения, она не имеет "прикладного значения" - уже по этой причине никто диссертации писать не станет.
Хотя по спортивным рейтингам, включая "рейтинг Эло", какая-то диссертация, возможно, уже и написана давно - не знаю, на соискание степени кандидата каких наук, вероятно - педагогических.
Чистой науки здесь вроде бы никакой, вообще нет.
Вот работы К.Ригана по "алгоритмической поимке" читеров практическое применение нашли (если ещё и ФИДЕ возьмет их на вооружение, то всем - амба, но кто-то один может оформить и диссертацию), но где там наука ?
(Я же сам пытался когда-то читать их совместную с К.Митонем работу по рейтингам - неужели это была статья в научном журнале? Не помню.) |
|
|
номер сообщения: 150-9-28807 |
|
|
|
По-моему, тут никакой диссертации не требуется, а нужно просто взять лежащие в свободном доступе в формате XML рейтинг-листы и обработать их простой программкой, которую может написать любой математик. Я сам некогда баловался любительским программированием, но тут нужно быть именно математиком, разбираться в матстатистике. А собственно программистская часть работы крайне проста, по моему.
И тогда сразу станет видна и инфляция, и дефляция, и как это коррелирует с изменениями рейтинг-системы. Работы тут для специалиста, думаю, на несколько часов. Только это почему-то никому не надо. |
|
|
номер сообщения: 150-9-28808 |
|
|
|
mickey: Evgeny Gleizerov: Я, конечно, далеко не математик, но, по-моему, рейтинг в количествах, вызывающих дефляцию, уносят не Накамуры, а игроки с 1500, массово прекращающие играть в турнирах. |
Это если они, скажем, поднялись с 1000. Но еще раз подчеркиваю: 1000 - это не "начальный рейтинг". Начальный рейтинг шахматист получает по итогам первых выступлений, он может быть и 1000, и 1500, и 2000, и даже выше 2500, как у Трушникова. Если шахматист сначала получил 1800, потом упал до 1500 и прекратил выступления, то он внес в копилку инфляции (а не дефляции) 300 очков (на самом деле может быть меньше или больше, зависит от К его и его соперников). |
А разве для расчета рейтинга после первого выступления не надо задавать некий начальный рейтинг? А от того как его задать будут зависеть все остальные. В штатах если нет никакого рейтинга задают по возрасту, и он может быть от 100 до 1300. Про ФИДЕ не знаю. |
|
|
номер сообщения: 150-9-28809 |
|
|
|
Pigeon:
А разве для расчета рейтинга после первого выступления не надо задавать некий начальный рейтинг? |
Нет, ничего не задается. Рейтинг после выступления рассчитывается по соответствующей формуле, учитывающей результат и средний рейтинг соперников (могу даже описать: при результате 50% и ниже - перформанс, при результате выше 50% - средний рейтинг соперников плюс по 20 единиц за каждые пол-очка свыше 50%). Все.
Соперникам в большинстве случаев партии с безрейтинговым участником просто не считаются. В круговиках (хотя круговики с безрейтинговыми участниками встречаются крайне редко) - считаются после обсчета рейтинга этого участника, по его обсчитанному таким образом рейтингу после выступления. Никакой "начальный рейтинг до выступления" нигде не фигурирует.
Ага, 1000 - это просто порог, минимально возможное значение рейтинга. Если игрок должен получить рейтинг ниже этого значения, он просто не получает рейтинга, а если должен понизить ниже этого порога - исключается из рейтинг-листа. |
|
|
номер сообщения: 150-9-28810 |
|
|
|
Evgeny Gleizerov: По-моему, тут никакой диссертации не требуется, а нужно просто взять лежащие в свободном доступе в формате XML рейтинг-листы и обработать их простой программкой, которую может написать любой математик. |
Хе, тут весь вопрос в том, что понимать под "обработать".
Начинать надо с определений. Не на языке математики (поскольку вы не математик), а на языке "пользователя" - но строгих определений.
Я, например, не уверен в том, что ваше определение инфляции рейтинга (или дефляции рейтинга) совпадёт с определением, которое даст mickey. А когда вы с ним придете к согласованному (и по возможности строгому) определению, выяснится, что с ним не согласится plotkin. И т.д.
Следующая проблема - "перевести" ваше "пользовательское" определение на математический язык. С этим тоже могут возникнуть проблемы. И только после этого следует переход к постановке задачи. А когда задача на математическом языке сформулирована (и решаема), то, конечно, программку напишет любой. Даже если это никому не надо. |
|
|
номер сообщения: 150-9-28811 |
|
|
|
Кстати, да. Само определение инфляции или дефляции - большой вопрос, его пытались решить Риган и Мачея (их работу мы как-то обсуждали, но сейчас уже не найду). В частности, Риган пытался сравнить игроков, имеющих одинаковые рейтинги в разные эпохи, по качеству игры, определяемом с помощью движков, но этот критерий приводил к абсолютно парадоксальным результатам (например, к тому, что игрок с гораздо более низким рейтингом - в то же время! - играл "лучше", чем игрок с гораздо более высоким рейтингом, и т.п.). Так что формализовать ощущение, что, мол, "нынешние трехсотники играют сильнее, чем 10 лет назад" и т.п., видимо, невозможно.
А тем временем молодежь растет, старики деградируют, так что лучших критериев, чем, типа, "количество семисотников", или "рейтинг сотого номера", или еще какие-нибудь чисто статистические данные, мы вряд ли придумаем. |
|
|
номер сообщения: 150-9-28812 |
|
|
|
Почитатель: У такой работы нет перспективы практического применения, она не имеет "прикладного значения" - уже по этой причине никто диссертации писать не станет.
Хотя по спортивным рейтингам, включая "рейтинг Эло", какая-то диссертация, возможно, уже и написана давно - не знаю, на соискание степени кандидата каких наук, вероятно - педагогических.
Чистой науки здесь вроде бы никакой, вообще нет.
|
Скорее всего это не так. В далеком 1993 у М. Гликмана (УРС рейтинг) диссертация была, именно, по рейтинговым системам. И на «вскидку» видно, что это интересная МАТЕМАТИЧЕСКАЯ задача в стохастических динамических системах. «Прикладное значение» сомнительно, разумеется.
Чтобы не звучало голословно-научный журнал, недавняя научная статья (хорошо написанная,ИМХО).
Mathematics > Statistics Theory
[Submitted on 2 Oct 2019]
Understanding and Pushing the Limits of the Elo Rating Algorithm.
Leszek Szczecinski, Aymen Djebbi |
|
|
номер сообщения: 150-9-28813 |
|
|
|
Фраза моя (набранная курсивом), вероятно, не очень аккуратна - если её можно истолковать так, будто бы тема рейтингов вообще не имеет отношения к математике.
Михаил спросил: "неужели не найдется кто-то, кто напишет диссертацию на тему рейтингов ФИДЕ?" Вот тема рейтингов ФИДЕ (и связанных с ним проблем), отвечаю я, "не диссертационна" (и к науке имеет мало отношения).
Марк Гликман - разработчик Glicko system, которая сложнее Elo system (в частности, учитывает активность игроков - на это я уже обращал внимание ЕГ). К безобразию под названием УРС-рейтинг он, слава богу, отношения не имеет.
Профессор Гарвардского университета и, надо полагать, настоящий ученый - статистик (хоть и гитарист ). Вот его персональный сайт: http://www.glicko.net/index.html
Там ниже этого фрагмента тоже интересно. В частности, он, оказывается, с 1992 по 2019 был председателем US Chess Ratings Committee.
Да, а тема докторской диссертации 1993 года - foundational probability models for rating competitors with time-varying abilities |
|
|
номер сообщения: 150-9-28814 |
|
|
|
mickey: В частности, Риган пытался сравнить игроков, имеющих одинаковые рейтинги в разные эпохи, по качеству игры, определяемом с помощью движков |
Что свидетельствует о его полном непонимании того, что такое рейтинг (к качеству игры он не имеет никакого отношения, а выражает лишь сравнительную практическую силу игроков, участвующих в одном пуле турниров). Иначе пришлось бы считать, что сейчас есть более сотни игроков, превосходящих по силе Карпова образца 1972 года.
Что такое инфляция/дефляция? Очевидно, изменение "стоимости рейтинга" - то есть места в рейтинг-листе, которое обеспечивает один и тот же номинальный рейтинг. При инфляции это значение падает (например, 2600 некогда была десятка, на рубеже тысячелетий сотня, а сейчас, по-моему, третья сотня), при дефляции - наоборот. Но это нужно считать именно на материале всего рейтинг-листа, а не только первой сотни. Потому что по бытовой нематематической логике дефляция должна ощущаться тем сильнее, чем дальше мы от топа. |
|
|
номер сообщения: 150-9-28815 |
|
|
|
Не знаю, как быстро посмотреть списком. Но подбором: Азаров std 2600, World Rank - All players: 259, Active players: 226. |
|
|
номер сообщения: 150-9-28816 |
|
|
|
Evgeny Gleizerov: mickey: В частности, Риган пытался сравнить игроков, имеющих одинаковые рейтинги в разные эпохи, по качеству игры, определяемом с помощью движков |
Что свидетельствует о его полном непонимании того, что такое рейтинг (к качеству игры он не имеет никакого отношения, а выражает лишь сравнительную практическую силу игроков, участвующих в одном пуле турниров).
|
А не свидетельствует ли это о полном непонимании ЕГ понимания рейтинга Риганом? Или, по крайней мере, цели его попытки?
Если принять оценку хода компьютерами за близкую к идеальной (к чему они потихоньку приближаются), то, сравнивая игру шахматиста с "идеалом", из относительного рейтинга можно сделать вполне обоснованные и реалистичные оценки качества игры. И, соответственно, корреляции рейтинга с "идеалом" в разные эпохи.
Здесь есть огромная проблема неравнозначности оценки отклонения от "идеала" в критические и "ровные" моменты партии, но это другая проблема. В целом же попытка вполне легитимна. |
|
|
номер сообщения: 150-9-28817 |
|
|
|
Почитатель:
Марк Гликман - разработчик Glicko system, которая сложнее Elo system (в частности, учитывает активность игроков - на это я уже обращал внимание ЕГ). К безобразию под названием УРС-рейтинг он, слава богу, отношения не имеет.
|
???
„The Universal Rating System (URS) is a system for rating chess players devised by Jeff Sonas, Mark Glickman, J. Isaac Miller and Maxime Rischard“ |
|
|
номер сообщения: 150-9-28818 |
|
|
|
FIBM:
???
„The Universal Rating System (URS) is a system for rating chess players devised by Jeff Sonas, Mark Glickman, J. Isaac Miller and Maxime Rischard“ |
Да, когда я увидел, что он был многолетним председателем Американского рейтинг-комитета, то подумал-таки, что без него обойтись не могло - однако перепропроверять поленился.
Но тогда я просто не знаю, что и думать - ни про Гликмана, ни про УРС-рейтинг, честно говоря. Потому что и по факту, и гораздо больше - по отсутствию за много лет хоть каких-то публикаций с разъяснениями метода не на словах (самых общих), а хоть с самыми минимальными "подробностями" - сильно смахивает на "халтуру" (прошу прощения).
Удивительно, что на его сайте среди всего перечисленного, им сделанного, нет никакого упоминания об URS. Я, правда, лишь пробежал глазами по тому, что "на поверхности" главной страницы и "Био", но в другие разделы не углублялся. |
|
|
номер сообщения: 150-9-28819 |
|
|
|
Да, ни в разделе Research, ни в разделе Consulting среди великого множества перечисляемого - ни одного упоминания про URS, поразительно.
В обширном перечне публикаций (CV) - единственная совместная работа с Сонасом:
Glickman ME, Sonas J (2015). "Introduction to the NCAA men's basketball prediction methods issue," Journal of Quantitative Analysis in Sports, 11(1), 1-3. |
|
|
номер сообщения: 150-9-28820 |
|
|
|
Evgeny Gleizerov: Очевидно, изменение "стоимости рейтинга" - то есть места в рейтинг-листе, которое обеспечивает один и тот же номинальный рейтинг. |
это не очевидно. в том смысле, что один и тот же условно средне-одаренный игрок будет иметь разное место в мире в зависимости от того, сколько вообще человек в игре. поэтому если у вас количество гроссмейстеров увеличивается непрерывно - нет ничего удивительного в том, что одна и та же практическая сила оставляет человека все дальше и дальше: это происходит просто потому, что появляется все больше игроков, которые играют лучше. при этом номинальный рейтинг падать автоматически совершенно не обязан, ибо людей, играющих хуже, появляется тоже все больше и больше. поэтому место в мире может быть показателем "инфляции" практической силы, а вовсе не рейтинга. мы сейчас на фирудже все это отчетливо видим в макромире: не то, что бы первая десятка стала хуже играть - но кто-то из нее теперь выпал просто потому, что появился чел, играющий несколько лучше.
а вообще, если бы в рейтинге было что-то очевидное, о нем бы не спорили через 50 лет после его изобретения. |
|
|
номер сообщения: 150-9-28821 |
|
|
|
Почитатель: Да, ни в разделе Research, ни в разделе Consulting среди великого множества перечисляемого - ни одного упоминания про URS, поразительно.
|
Пару лет назад на другом сайте я высказал свои (достаточно простые) соображения по поводу урс/эло рейтинга.
"1. К сожалению, научной (математической) статьи по поводу рейтинга УРС я найти не смог, поэтому любое популярное изложение системы УРС будет напоминать «испорченный телефон».
3. Зато есть точное понимание (математическое и гуманитарное) почему есть «серьезные» претензии к рейтингу ЭЛО, а следовательно можно понять зачем нужны другие типы рейтинга.
1. Любая рейтинговая система появляется как результат математической модели: куча игроков, играющие партии друг с другом, результат-1,0, 1/2. Нам нужно каждому игроку определить число (перед партией), чтобы соотношение чисел определяло вероятность результата.
2. Это общее для любой рейтинговой системы, а дальше начинаются различия (допущения).
У великого А. Эло- допущения были самые простые: все шахматисты-«равны как в бане», и не отличаются по возрасту, настроению, отношению к шахматам, и главное (с точки зрения математики, неустранимый произвол!): в каком проценте случаев будет результат ничья! Эло взял просто 50% и получил, то что мы имели 30 лет назад. Очевидно, что 50% ничьих будет в верхних рейтингах, а на уровне «начинающих» это неверно. Поэтому, надеяться на то, что Эло будет давать ну очень хорошую оценку на мелких рейтингах -математически неправильно (может, конечно, повезти и все будет хорошо). Это все хорошо описано в ссылке, что я дал в предыдущем сообщении.
3. Отмена ограничения «равны как в бане» называется Глико система (уточнённый ЭЛО), где учитывается как часто играет шахматист. Эта система используется на игровых серверах.
4. Автор системы Глико, г. Марк Гликман, один из авторов УРС системы. Главное отличие всем известно: взвешенный учёт игр с любым контролем. Цель понятная: развитие системы Глико, в массиве данных как можно точнее учесть индивидуальные особенности шахматиста, и вывести некую среднюю характеристику, которую и использовать для ранжирования шахматиста. « Хорошая» ли эта цель? Каждый решает для себя сам..." |
|
|
номер сообщения: 150-9-28822 |
|
|
|
BillyBones: В целом же попытка вполне легитимна. |
Но, как выяснилось, безуспешна. |
|
|
номер сообщения: 150-9-28823 |
|
|
|
Возможно, пока. Все-таки объем работы необъятен, и трудности в определении четких критериев оценки отклонения человеческой игры от компьютерной несомненны. |
|
|
номер сообщения: 150-9-28824 |
|
|
|
Ещё можно попробовать прикинуть средний рост игроков с близким номинальным рейтингом из разных эпох. Отношение к делу будет не меньшее. |
|
|
номер сообщения: 150-9-28825 |
|
|
|
FIBM: Почитатель: Да, ни в разделе Research, ни в разделе Consulting среди великого множества перечисляемого - ни одного упоминания про URS, поразительно.
|
Пару лет назад на другом сайте я высказал свои (достаточно простые) соображения по поводу урс/эло рейтинга.
"...
4. Автор системы Глико, г. Марк Гликман, один из авторов УРС системы. Главное отличие всем известно: взвешенный учёт игр с любым контролем. Цель понятная: развитие системы Глико, в массиве данных как можно точнее учесть индивидуальные особенности шахматиста, и вывести некую среднюю характеристику, которую и использовать для ранжирования шахматиста. « Хорошая» ли эта цель? Каждый решает для себя сам..." |
1) насчет "главного отличия". По памяти, но почти "буквально" - то, что было заявлено:
"результаты игры в рапид и блиц несут в себе информацию о силе игры в "классику". Наш метод расчета "классического" рейтинга (рейтинга игры в классические шахматы) эту информацию учитывет. Но каким образом учитывает - объяснять очень сложно и мы не будем этого делать"
То есть, понятно только, что блиц и рапид учитываются не "весами" (в линейной комбинации рейтингов), а как-то очень "умно".
Впоследствии к блицу и рапиду добавился ещё и учет "силы игры" в рэндом-шахматы...
Поначалу ежемесячный лист УРС-рейтинга очень походил на лист ФИДЕ, чему авторы радовались вслух (точнее - постоянно-анонимный автор сообщений на сайте URS-рейтинга). Но со временем неизменно второе место Накамуры в этих листах (листах классического рейтинга !!) стало удивлять и настораживать, а сейчас (и уже давно) это просто фарс.
2) У вас есть какое-то объяснение тому изумляющему меня факту, что на персональном сайте одного из авторов УРС нет ни одного упоминания об УРС? |
|
|
номер сообщения: 150-9-28826 |
|
|
|
Evgeny Gleizerov: Ещё можно попробовать прикинуть средний рост игроков с близким номинальным рейтингом из разных эпох. Отношение к делу будет не меньшее. |
Остроумие на букву Т. |
|
|
номер сообщения: 150-9-28827 |
|
|
|
А с какого периода считается, что началась дефляция?
Или с какого периода ФИДЕ стала уменьшать начальные рейтинги? |
|
|
номер сообщения: 150-9-28828 |
|
|
|
Почитатель:
2) У вас есть какое-то объяснение тому изумляющему меня факту, что на персональном сайте одного из авторов УРС нет ни одного упоминания об УРС? |
Взяли как «свадебного генерала»? |
|
|
номер сообщения: 150-9-28829 |
|
|
|
И что за проблемы с любого рода фляциями, если рейтинги призваны отображать только относительную силу игроков?
Необходимость объяснять чиновникам или благодетелям абсолютную бессмысленность рейтинговых milestones? |
|
|
номер сообщения: 150-9-28830 |
|
|
|
Именно! Больше по идее нет ни в чем разницы. Обычно интересует, кто лидер рейтинга, и на сколько обгоняет, а не какой именно в цифрах у него рейтинг.
Но идеальный рейтинг был бы сбалансирован и в этом смысле (т.е. в целом стационарен по времени), видимо, к чему хотели бы прийти обсуждающие рейтинг. |
|
|
номер сообщения: 150-9-28831 |
|
|
|
В том-то и дело, что он перестаёт адекватно отражать относительную силу игроков (на уровне опенов, естественно, в топе всё работает нормально). Причина этого - не дефляция, но тот же фактор, который порождает дефляцию - очень низкие начальные рейтинги, на что система ЭЛО не рассчитана. Особенно неадекватно в рапиде и блице, но и в классике тоже, хотя в меньшей степени. |
|
|
номер сообщения: 150-9-28832 |
|
|
|
Но ведь это только во время переходного периода, пока волна не прокатится до верха. Со временем всё стабилизируется, когда все переиграют со всеми. Поэтому, чем окукленнее некоторые группы игроков, тем печальнее для них будет встреча с такими "недооцененными по рейтингу".
И вообще, честно говоря, при условии, что не все играют со всеми, возможны разные аномалии рейтингов, даже без условий издевательства над начальными рейтингами. К примеру, все рейтинги советских игроков были заниженными, а также возможны попадания в топ неизвестных игроков из Бирмы, Румынии, Украины, России и прочих стран. |
|
|
номер сообщения: 150-9-28833 |
|
|
|
BillyBones: И что за проблемы с любого рода фляциями, если рейтинги призваны отображать только относительную силу игроков?
|
Я не успеваю реагировать (в т.ч., на предудущие посты).
Проблемы могут быть только у профессиональных игроков - их карьера находится в зависимости от величины текущего рейтинга. Не у меня, и не у вас. Часть ответа прозвучала - внешние "возмущения" (типа изменения нижнего порога, "игры" с коэффициентом К, ещё какие-то) приводят к тому (или могут приводить), что рейтинг перестает (начинает "хуже") отображать относительную силу игроков.
Какое-то время назад plotkin был ещё более конкретен (прав или нет - это не мне судить): дефляция, мол, приводит к неоправданному занижению рейтинга игрока, чья "практическая сила" и не думала начинать падать. Если так, то, конечно, для профессионалов это - проблема. |
|
|
номер сообщения: 150-9-28834 |
|
|
|
|
|
|
|
|
Copyright chesspro.ru 2004-2024 гг. |
|
|
|