Расскажите немного подробнее о Computer Poker Competition?
Эрик: Computer Poker Competition – это ежегодный конкурс для исследователей и любителей, заинтересованных в компьютерном покере. Этим летом мы закончили наше девятое соревнование. Традиционно мы проводим соревнования для хэдс-ап Limit Hold’em, хедс-ап No-Limit и 3-макс Limit. Недавно мы добавили в конкурс 3-макс Kuhn. Участники конкурса включают в себя смесь ученых и индустрии. Особенно активными на протяжении многих лет были Университеты Альберты и Карнеги-Меллона.
Соревнование пытается содействовать работе над различными типами ботов, включая статических, которые пытаются приблизиться к равновесию по Нэшу, как у меня, а также адаптивных ботов, которые направлены на моделирование и эксплоут своих оппонентов.
Kuhn покер? Версия 2-макс является специально разработанной игрушкой, для легкого решения. На самом ли деле это интересная задача с большим количеством игроков? Что стало основанием для того, чтобы ее включили в соревнование?
Эрик: Хоть эта игра и простая, мультиплеерная версия в техническом смысле остается «неразрешимой», т.е. бот, играя согласно равновесию Нэша, не застрахован от эксплоута – его можно победить, если двое других игроков выберут правильно скоординированные стратегии. Поэтому, на мой взгляд, цель состояла в подборе чрезвычайно малой и простой игры, чтобы специально сосредоточиться на различиях между 2-макс и мультиплеерными играми, например, на этой нехватке неэксплуатируемого равновесия и возможности негласного сговора. Хотя игра маленькая, далеко не ясно, как найти лучший способ для максимизации своего профита.
Говоря о решениях, мы недавно слышали, что Limit Hold’em был эффективно решен для хедс-апов. По моим предположениям, это не означает, что он потеряет свою привлекательность для конкурса. Какие события, на Ваш взгляд, могли бы его заменить?
Эрик: На самом деле, для каждой игры у нас есть два эффективных соревнования. Это конкурс равновесия, который награждает ботов, максимально приближенных к равновесию Нэша. Но есть также общий конкурс банкроллов, который измеряет общий размер профита и наград ботов, которые адаптируются и эксплоутят более слабых оппонентов. Поэтому для Limit Hold’em соревнование равновесия фактически бессмысленно, но я думаю, что общий конкурс банкроллов будет продолжаться.
Если бы мы должны были добавить новое событие, мне бы хотелось, чтобы это было что-то сложное и оригинальное, как фулл-ринговое или 6-макс No-Limit соревнование. Но существуют некоторые технические трудности, такие, как уверенность в том, что мы можем измерить результаты статистического значения.
Итак, одни попадают в неадаптивных ботов вроде Ваших, которые пытаются играть настолько «идеально», насколько это возможно (с точки зрения теории игр), а другие – в ботов, которые адаптируются в ходе игры и пытаются эксплоутить недостатки игры оппонента. Одна ли философия действует для неразрешимых игр (или тех, которые можно решить), или же с годами что-то последовательно или поочередно выходит на первый план?
Эрик: В Computer Poker Competition боты, играющие лучшее равновесное приближение, как правило, но выигрывают против адаптивных ботов, хотя идут почти на равных. Думаю, это сочетание нескольких факторов. Адаптация с одной стороны сложна, равновесные боты довольно хороши, и возможно, работа по адаптации находится в менее зрелом состоянии, чем работа по равновесным ботам. Кроме того, в Computer Poker Competition мы используем матчи только в 3000 рук. Возможно, этого количества недостаточно для того, чтобы многое узнать о сопернике, если только вы не делаете много предположений, и они не оказываются верными.
В играх, которые не решены, вроде No-Limit, насколько вы близки к решению? На самом ли деле равновесные боты практически идеальны или существует какой-то длинный путь к достижению этого?
Эрик: Помимо хедс-апов Limit Hold’em, единственные игры, которые были решены – это маленькие игрушки (вроде 2-макс Kuhn), которые людям не интересны. Единственным, что помогло решить Limit Hold’em, была возможность точного измерения эксплуатируемости. Мы не можем точно измерить эксплуатируемость наших No-Limit ботов тем же способом, но ребята из Университета Альберты, по крайней мере, могли вычислить нижнюю границу эксплуатируемости одного из своих недавних ботов, и оказалось, что бот был эксплуатируемым как минимум на 300ВВ на 100 рук! Хоть эти цифры вызывают шок – это в четыре раза хуже, чем просто фолдить каждую руку – имейте в виду, что эксплуатируемость является теоретически наихудшим показателем. В реальной игре против человека боту будет по-прежнему довольно сложно играть. Но хорошая новость для игроков заключается в том, что No-Limit Hold’em еще очень далек от решения.
Computer Poker Competition – игра исключительно ботов против ботов. Существуют ли подобные соревнования для ботов с сильным оппонентом в образе человека?
Эрик: Не то, чтобы я лично знаю об этом, но было несколько единичных случаев игры человека против машины для хедс-апов Limit Hold’em, до того как эта игра была решена.
Думаю, было бы очень интересно провести что-то подобное для No-Limit Hold’em. Это то, что мы уже обсуждали. Одно из препятствий заключается в том, что мы захотели бы сыграть достаточно рук, чтобы убедиться, что результаты являются статистически значимыми, но для этого мы должны найти такого человека, который будет готов сидеть и играть огромное количество тысяч рук.
Продолжение следует…
Источник: http://www.pokeroff.ru
Комментарии