Открылся сайт Каллисто

Просмотр 15 сообщений - с 16 по 30 (из 430 всего)
  • Автор
    Сообщения
  • #364070
    Kallisto
    Участник

    Использовалась жеребьевка начальных позиций. Так что повторов не было.

    И я старался следить, чтобы не было позиций с явным перевесом одной из сторон. Таких может быть было максимум 3 позиции.

    Действительно, игра против слабых соперников (уровне кмс покажет малый прирост силы), т.к. умения обыгрывать слабых не прибавилось.
    За то в игре с сильным соперником, новая версия вместо игры на равных может ощутимо выиграть.

    Проигрыш 4% партий против сильного соперника, имея всего несколько секунд на ход, считаю что это вполне нормальный результат.

    Но и новая версия проигрывает,то есть еще резервы для улучшения
    Улучшать будет интересно только в том случае, если появятся соперники.

    #364071
    plus600
    Участник

    Такой перевес значим настолько, что позволяет оценить силу игры новой версии на 13 пунктов ЭЛО выше.

    Опять же повторюсь, речь идет не о людях, а о программах и их алгоритмах. И более того не о двух разных программах, а о двух ее модификациях. Формальная процедура сравнения двух таких модификаций вещь математически не очень очевидная.

    #364072
    Kallisto
    Участник

    Исправил баг из-за которого не читались старые партии из games.pdn. Получалось, что матч всегда запускается заново, а не продолжается старый.
    Для тех, кого инересует проведение матчей движков лучше скачать заново (теперь версия оболочки 1.20). Остальным можно не беспокоиться.

    Plus600!
    Все никак не пойму Вы шутите или серьезно?

    #364073
    plus600
    Участник

    Plus600!
    Все никак не пойму Вы шутите или серьезно?

    Я абсолютно серьезно. С математикой шутить не привык.

    #364074
    Kallisto
    Участник

    Зря Вы так… Нарвались на математика :)

    Итак, имеем +79 -37 =806, т.е.

    мат. ожидание количества очков набранных первым движком = 0,522776573
    несмещенная дисперсия = 0,030968178
    сигма = 0,175977777

    Получаем доверительные интервалы для соотв. дов. вероятностей:

    95,0% — (0,51141757; 0,534135575)
    99,0% — (0,507848292; 0,537704853)
    99,7% — (0,505576908; 0,539976237)
    99,9% — (0,503706069; 0,541847077)

    Т.е. видим, что мат. ожидание количества очков первого движка набранного в партии со вторым выше 0,5 с очень большой вероятностью.
    Вероятность, что это не так около 0,0084%.

    А это и значит, что не может быть никаких сомнений, что первый движок сильнее :)

    Plus600!
    В Бабруйск! Учить матстатистику!

    ЗЫ. Сорри за жаргон :)

    #364075
    plus600
    Участник

    В Бабруйск я не поеду, считаю, что в МГУ матстатистику преподают лучше.
    Поясните, что такое «мат. ожидание количества очков набранных первым движком» и как Вы ее считали. Я из цифр ничего не понял.

    #364076
    Kallisto
    Участник

    79 * 1 + 806 * 0,5 = 482 очка набрано в матче первым движком.

    Мат. ожидание кол-ва очков в одной партии = 482 / 922 (это количество всех партий).

    #364077
    Kallisto
    Участник

    Сделал проверку в Excel. Теперь все могут сравнивать силу двух движков с математической точностью. Причем это касается не только шашек.

    #364078
    letas
    Участник

    Попробовал провести небольшой матчик между Каллисто2 и Каллисто1.У меня результат 10-0=10.Наверное с настройками намудрил.Дебюты из «летающих выбирали сами программы.»А как сделать чтобы возможен был матч в классику.

    #364079
    Kallisto
    Участник

    Результаты похожи на правду.
    Каллисто 1 — это версия почти 3-летней давности. Конечно, она значительно слабее.

    Начальные варианты берутся из fly.dat. Если в начале добавить пустых строк, то будет использоваться начальная расстановка шашек.

    Кстати, а какой контроль времени в шашках считается нормальным? Какой используется на чемпионатах мира?

    #364080
    Kallisto
    Участник

    Сделал страничку с описанием того, какие алгоритмы использует Каллисто 2. Может кому будет интересно.

    http://www.igorkorshunov.narod.ru

    #364081
    Kvadrat64
    Участник

    Игорь, нельзя ли добавить режим игры с указанием времени на ход:
    5 сек, 10, 15, 20, 30 и т.д. Это удобно при проведении турнирчиков :)

    #364082
    Kallisto
    Участник

    Нет. В каких турнирах Вы видели такой контроль?

    #364083
    Kallisto
    Участник

    Меня самого заинтересовало насколько последнее усиление ОФ скажется на игре со слабыми противниками. Вот результаты игр против Каллисто 1:

    Каллисто 2 — Каллисто 1 : +322 -11 =589
    Каллисто 1.61 — Каллисто 1 : +318 -15 =589

    Усиление едва заметно. Интересно было бы проверить в матче с другой сильной программой.

    #364084
    Kvadrat64
    Участник

    согласен, такого контроля в турнирах не бывает, но мне как оператору передающему ход от проги проге такой режим удобнее, особенно в конце партии, когда каллисто начинает играть в блиц. Отрицательно о контроле времени на ход высказывался и Старцев, но там особенности его программы. Если программа рещает что итерация не закончится за отведенное время, она заканчивается намного раньше, что зачастую идет во вред Plus600.
    1000 партий в автоматическом режиме я вам наиграть не могу, но по летающим с участием тундры, дамиры, каллисто и plus600 организовать могу.

Просмотр 15 сообщений - с 16 по 30 (из 430 всего)
  • Для ответа в этой теме необходимо авторизоваться.
140 запросов за 0,853 секунд.