Главная › Форумы › Шашечные программы › Шашечные программы › Рейтинги шашечных программ
- В этой теме 71 ответ, 9 участников, последнее обновление 19 лет назад сделано
Kallisto.
-
АвторСообщения
-
07.05.2007 в 20:39 #370658
Kallisto
УчастникЕсли будут считаться рейтинги по результатам таких матчей — народ будет бояться играть.
Народ и так боится играть.
Не хотите ли заодно ввести отдельные рейтинги на «5 секунд на ход», «10 секунд на ход» 😆 Результаты могут быть о-о-о-чень разные.
Нет, результаты будут похожими. Но чем больше времени, тем меньше будет разница между слабыми и сильными.
А до контроля «время на ход» мы не опустимся
08.05.2007 в 08:48 #370659Alkand
УчастникНо тут дело в том, что в турнирах выступали разные версии программ. Так что мы по-любому хорошего рейтинга не получим.
Зато это будет реальный турнирный рейтинг программ.
А то ведь как можно сделать. Сыграла программа плохо, заявляешь, что выступала тестовая версия. Сыграла удачно — значит самая последняя
08.05.2007 в 09:13 #370660NS
УчастникВарианта два (ЭлоСтат мне тоже не нравится)
1. Посчитать рейтинги Сонаса — тут результат расчета моей программой совпадает с результатом расчета программы Игоря.
2. Посчитать рейтинги Эло, у меня напиана программа, считает вместе с доверительными интервалами. Сейчас попробую её найти и посчитать…
Если кому интересно могу расписать математику расчета рейтингов Эло методом наибольшего правдоподобия. Максимизруемая функция очень простая. (это функция дает вероятность того что при данных рейтингах случится получившийся результат всех микроматчей)
Доверительные интервалы зависят от вероятности ничьи.08.05.2007 в 09:43 #370661Kallisto
УчастникА то ведь как можно сделать. Сыграла программа плохо, заявляешь, что выступала тестовая версия. Сыграла удачно — значит самая последняя

Обычно так и делают

Вот почему мне интересны только рейтинги программ с отрытым протоколом. Можно провести сколько будет угодно партий и для всех версий этой программы. И тогда объективная сила сила игры будет очевидна.NS wrote:Доверительные интервалы зависят от вероятности ничьи.Фиксированной вероятности ничьей нет. Она зависит, от силы соперников, или даже от их стиля.
08.05.2007 в 09:49 #370662NS
УчастникФиксированной вероятности ничьей нет. Она зависит, от силы соперников, или даже от их стиля.
то что я выкладывал счтает доверительные интервалы для худшего случая… прстейший способ — задается вероятность ничьи для равных соперников, при разнице в силе вероятность ничьи высчитывается. Примерно как в BayesElo, только у них кривая формула.
Вобще формула логарифма вероятности результата матча —
(КоличествоПобед*ln(ВероятностьПобеды)+КоличествоПоражений*ln(1-ВероятностьПобеды))*СГде С — константа для данной игры, и зависит от вероятности ничьи…
сами рейтинги от константы C не зависят, от неё зависят только доверительные интервалы.КоличествоПобед=Выиграли+Ничьих/2
КоличествоПоражений=Проиграли+Ничьих/2Худший случай доверительных интервалов, для случая когда ничья невозможна C=1
08.05.2007 в 11:21 #370663alemo
УчастникМне тут так и не ответили на вопрос — зачем нужны эти рейтинги ? Похоже никто над этим особо не задумывался. Для дела они могут нанести огромный вред. И если раньше «тренировочные» 😆 матчи игрались, то теперь врядли будут. Какая от этого польза ?
АЛЕМО
08.05.2007 в 11:31 #370664NS
УчастникРанжирование движков никакого вреда нанести не могут.
Во первых это интересное занятие для многих людей (проводить турниры между движками)
Во вторых многим интересно — какова всё-таки разница в силе между движками, и какова их иерархия.08.05.2007 в 11:33 #370665Kallisto
УчастникМне тут так и не ответили на вопрос — зачем нужны эти рейтинги ?
Ответ кажется очевиден. Чтобы знать в какую силу играет та или иная программа. Сейчас об этом судить просто невозможно.
08.05.2007 в 12:56 #370666plus600
Участник…Во вторых многим интересно — какова всё-таки разница в силе между движками, и какова их иерархия.
Простите, а сколько у нас есть ДВИЖКОВ? И сколько из них сильных настолько, чтобы они были интересны не только создателям?
08.05.2007 в 13:03 #370667NS
УчастникПростите, а сколько у нас есть ДВИЖКОВ? И сколько из них сильных настолько, чтобы они были интересны не только создателям?
Пользователям интересны не только сильные движки.
А движков — только под интерфейс Каллисто уже написаны движки четыремя авторами, а если добавить движок Александра Быкова — то получается уже пять авторов. Это русские шашки.
Я выложу еще версии в пул и бразильские, сейчас начал настраивать ОФ в чеккерс. Движков не так уж и мало, даже под этот протокол. Причем каждый движок имеет несколько версий.08.05.2007 в 13:11 #370668plus600
УчастникТо есть, ответ на мой второй вопрос — один.
08.05.2007 в 13:12 #370669NS
УчастникНет, ответ другой — пользователям интересны не только сильные движки.
08.05.2007 в 13:13 #370670alemo
Участниксейчас начал настраивать ОФ в чеккерс.
Otlichno !
Ne koristi radi … Pomosh trebuyetsya ? Mogu i poigrat s dvizhkom, kogda budet gotov. Koroche — budu rad pomoch chem mogu … esli nado 😆
Chem bolshe dvizhkov v checkers — tem luchshe ! Mozhet bit dazhe imeet smisl dobavit ego k CheckerBoard 💡 kogda vse budet gotovo.
Aleksandr
08.05.2007 в 13:17 #370671NS
УчастникOtlichno !
Ne koristi radi … Pomosh trebuyetsya ? Mogu i poigrat s dvizhkom, kogda budet gotov. Koroche — budu rad pomoch chem mogu … esli nado
Chem bolshe dvizhkov v checkers — tem luchshe ! Mozhet bit dazhe imeet smisl dobavit ego k CheckerBoard kogda vse budet gotovo.
Aleksandr
Пока я посчитаю оценку через баланс шашек. Выложить смогу только в конце июня. А потом уже, после первой версии начну думать о поиске позиционных признаков.
08.05.2007 в 13:42 #370672Kallisto
УчастникИ сколько из них сильных настолько, чтобы они были интересны не только создателям?
Какое это имеет значение? Неужели ответ на этот вопрос что-то меняет?
Ну допустим четверым это интересно. Или предположим четырем сотням. Что от этого изменится?
-
АвторСообщения
- Для ответа в этой теме необходимо авторизоваться.