Интервью с тактическим аналитиком Eurosport: «Бердыев сильнее Спаллетти»
Применение xG-моделей для прибыльных ставок, несколько важных сайтов для футбольных бетторов и анализ чемпионских шансов «Спартака» — в интервью с Никитой Васюхиным, который знает о футбольной тактике и статистике более-менее все.
Никита Васюхин — самый известный блогер рунета, рассказывающий о футбольной тактике и статистике. Чтобы убедиться в этом, достаточно посмотреть несколько его youtube-передач («Я — васюхинец» и «Подлейшие») и изучить паблик «Блокнот», ставший пристанищем всех российских тактических гиков.
Никита Васюхин был одним из первых в СНГ, кто заинтересовался новомодной системой оценки качества игры футбольных команд — xG-моделью. За пару лет с группой энтузиастов модель была улучшена, а в систему анализа добавлено несколько новых параметров. xG-модель объективнее оценивает силу команд, чем голые цифры итогового счета, и позволяет выявлять недооцененные и переоцененные клубы, из-за чего может активно использоваться в краткосрочных и долгосрочных ставках. В интервью betonmobile Никита Васюхин объяснил все тонкости модели и дал несколько важных советов для бетторов.
Когда ты увлекся xG-моделью и чем она тебя привлекла?
Все истории, когда мы пытаемся математикой описывать футбол, — это интересно. Да и вообще математика меня немножко увлекает. Где-то в середине 2015-го узнал об xG-модели, и она стала еще одним моим инструментом для анализа матчей.
А были ли какие-то подобные продвинутые аналитические системы до xG-модели?
Сюда можно отнести PDO, которая вычисляла степень отклонения реализации команды и соперников в матчах против нее на дистанции. Число забитых мячей делится на число произведенных ударов, это значение складывается с аналогичным показателем соперника и умножается на 100 или 1000 (считают по-разному, но особой роли это не играет). Итоговое число получается в районе 100 или 1000. Если меньше, то либо реализация команды ниже ожидаемой, либо реализация соперника выше ожидаемой, и наоборот. Но PDO уравнивала все удары, и в этом плане xG— гораздо более продвинутая система, где удары ранжируются по опасности.
Почему уровень реализации скорее связывают именно с удачей, а не с уровнем игроков, наносивших удар?
Даже ведущие игроки не могут показывать завышенную реализацию из сезона в сезон. За всю историю подсчетов, с сезона-2009/10, есть всего несколько футболистов, забивавших выше ожидаемого уровня. Если не брать последние два сезона, то таким человеком был Криштиану Роналду. Даже у такого фантастического игрока группы атаки и одного из лучших финишеров XXI века случился спад, поэтому говорить о значительном вкладе финишинга при оценке качества момента неправильно. Сейчас в топ-5 лигах есть только 3 человека, всю карьеру реализующие моменты выше ожидаемого уровня, — Месси, Суарес и Ляказетт.
Чтобы адекватно определить уровень реализации игрока, нужно рассмотреть его на большой дистанции. Криштиану Роналду — один из самых бьющих игроков европейского футбола, и в среднем за 90 минут он наносит 6-7 ударов. За сезон в чемпионате получается что-то около 220 ударов — это очень маленькая дистанция. А возьмем Стефена Карри из НБА. Вот сколько он делает бросков за 36 минут?
Думаю, 20-30.
Наверное, где-то 20. Регулярный сезон НБА — 82 игры. Вот и считай, у него получаются сильно больше попыток.
Ну да, 1600 — это уже совсем другие числа. Получается, такие всплески реализации, как у Диего Косты в нынешнем сезоне, можно списать на удачливость? И даже с учетом того, что общий уровень атакующих игроков «Челси» гораздо выше уровня игроков условного «Бернли», если матч закончился по xG со счетом 0,7:0,7, то команды имели равные шансы на победу?
Да, можно считать, что сыграли равно. Ведущий аналитик в области xG-моделей Майкл Кэйли задумывался над фактором реализации, он включал в формулу ударов поправочный коэффициент на конкретных игроков. Но чтобы под игрока была своя корректировка, брался порог в 75 голов с игры. Проблема в том, что в европейском футболе мало игроков, которые с сезона-2009/10 забили столько голов, без учета пенальти. Таких футболистов всего несколько десятков, а xG вычисляется для всех команд, и есть много людей, у кого за сезон максимум наберется 30 ударов. Не голов, а именно ударов.
Футбол сложнее для обсчета и наработки выборки, чем все популярные американские лиги, в которых больше игр и больше степень повторяемости событий. А для более-менее точных наблюдений нужна большая выборка.
xG-карта матча «Бернли» — «Челси» от Майкла Кэйли
Тогда какие есть варианты дальнейшего развития xG-модели, и сможет ли когда-нибудь анализ футбола приблизиться к тому уровню обсчета, который есть в том же бейсболе?
Бейсбол — игра статичная. Любой переход от атаки к нападению сопровождается паузой. Там игра, как сказали бы наши комментаторы, больше разбивается на эпизоды. В футболе мяч может переходить от одной команды к другой без паузы в игре.
Что касается совершенствования, то модель самообучаема. Возьмем заблокированные удары. При расчетах по xG-модели все наши знания об ударе заканчиваются на моменте удара. Мы не знаем, куда он пошел: в девятку, выше ворот или заблокирован. Если бы мы знали до удара, что он пойдет в створ, то оценивали бы его более опасным, и он имел бы больший вес. Майкл Кэйли со временем разобрался, что хоть наши знания об ударе и заканчиваются в момент удара, но все удары, которые оказываются заблокированными, изначально имеют меньший вес. Модель способна выявлять такие моменты. Мы уже думаем, как понижать вес заблокированных ударов. Например, в зависимости от того, на каком расстоянии между точкой удара и воротами находился заблокировавший мяч защитник. Это важная тема.
Не всегда удается правильно интерпретировать и другие моменты, например, пас на пустые ворота. Формула может не определить, что игрок бил по пустым воротам, если это не отражено в пасе. Если передача шла из опасной зоны или перед этим была обводка вратаря, или вратарь ошибся на выходе после кросса и получил отметку Error lead to goal, то мы это учтем, но если этого не было, то могут быть погрешности. Такие проблемы есть, но они достаточно редки. К тому же появляются non-shot модели, которые позволяют оценить число опасных подходов к воротам, в том числе тех, которые не закончились ударом.
Те самые deep completions? То, чем начал дополнять свои xG-карты 11tegen11?
Да, это точный пас в радиусе 25 (deep completions) и 15 (very deep completions) метров от ворот. Есть такой гениальный аналитик Дастин Уорд. Он больше сконцентрирован на передачах, а не ударах, и пытается оценить прессинг через цифры. Для оценки качества обороны он использует количество допущенных deep completions, но в его трактовке это пасы в радиусе 30 метров от ворот.
С другой стороны, если команда регулярно заходит в глубокие зоны, но не бьет по воротам, то речь уже о проблемах в атаке. «Спартак» неважно идет по xG, и его болельщики любят вспоминать матч с «Уралом», когда у Ивелина Попова было два выхода один на один под углом. Он мог бить, но пытался отдать на пустые ворота, а его партнеры не успевали замыкать.
xG-карта матча «Малага» — «Лас-Пальмас» от 11tegen11
Это к тому, что xG не учитывает подобные опасные моменты, поэтому неправильно трактует успехи «Спартака»?
Да, но это отдельный случай. И я не видел примеров, когда одна команда идет в отрыве от всех других по таким ситуациям. Подобные моменты возникают у всех, что на дистанции более-менее сглаживает этот недостаток модели.
Получается, сейчас вопрос в том, как объединить модели оценки качества ударов с моделями оценки передач в глубокие зоны и создать какую-то общую систему?
Не знаю, есть ли цель создать что-то общее. Во-первых, это достаточно сложно: создать такую нормировку, которая адекватно объединит два параметра. Во-вторых, ничего не мешает оценивать команды отдельно по ударам и отдельно по точным пасам в глубокие зоны. Изначально анализ — это разложение на составляющие, а вы хотите получить одну общую цифру, как рейтинг Whoscored. Будет полная каша. Но если у вас есть xG, deep completions и еще несколько показателей — это и есть анализ и попытка разложить игру.
Есть ли кроме перечисленных моделей, какие-нибудь еще, которые помогают оценить уровень игры команды?
Бывший полузащитник «Байера» и сборной Германии Штефан Райнарц летом презентовал Packing. Это подсчет отсеченных передачами игроков. Получается достаточно высокая корреляция с итоговым результатом.
Раз эти модели пошли в массы, то стоит предположить, что ими давно и активно пользуются многие клубы. Есть ли какие-то примеры того, как команды начали подстройку стиля игры под данные, вычисленные с помощью xG-моделей?
Есть давняя история про «Арсенал». Арсен Венгер — один из самых прогрессивных тренеров Европы, и в какой-то момент «Арсенал» стал бить из-за пределов штрафной меньше всех. Команда стремилась все атаки заканчивать ударом из штрафной, причем из центральных зон, ведь известно, что удар из-за пределов штрафной имеет вес максимум 0,05 xG. «Дортмунд» тоже в теме. Взгляните на карту ударов в матче с «Лейпцигом». У «Боруссии» 13 ударов общим весом 3,7 xG. Все удары кроме одного — из центральных зон штрафной. Идет подстройка стиля именно под завершение атак из этих зон.
Видимо, xG-модель не используется в «Тоттенхэме», где Кристиан Эриксен наносит умопомрачительное количество низкоэффективных дальних ударов. Мы можем только догадываться, что используют клубы, но уверен, что «Арсенал», «Вест Хэм», «Суонси», «Байер», дортмундская «Боруссия» работают с xG-моделями. Думаю, большинство команд пользуется ими.
На тренировочном поле «Байера» отмечена предпочтительная зона для ударов
А давняя история со спортивным директором Дамьеном Комолли в «Ливерпуле» — это из той же оперы? Когда покупался Стюарт Даунинг из-за высокого процента точности кроссов и Энди Кэрролл из-за отличной игры головой.
Тут немного другая история. Тогда за «Ливерпуль» взялся Джон Генри. Это владелец бейсбольной команды «Бостон Ред Сокс», несколько раз выигравшей Мировую лигу. Он пытался заполучить Билли Бина из «Окленд Атлетикс» (человек, по чьей истории написан MoneyBall и снят «Человек, который изменил все»), а потом позвал бейсбольного гуру Билла Джеймса. Они искали недооцененных игроков на основе статистики. Видимо, ту же схему хотели провернуть и в «Ливерпуле», но вышло не очень удачно. Покупали же не только Даунинга и Кэрролла, а еще много игроков на основе статистики, например, Яго Аспаса. Вряд ли тут речь об xG.
На бумаге попытка смотрелась неплохо, но те же кроссы — одна из самых неэффективных методик создания голевых ситуаций. Чтобы создавать по-настоящему опасные моменты, нужно отдавать передачи вразрез, постепенно продвигать мяч, желательно пасовать из штрафной. Быстрые комбинации создают более опасные ситуации, чем кроссы. Возможно, в «Ливерпуле» это не учли.
Раз уж пошла речь о конкретных клубах, кто-нибудь из российских заинтересовался моделью и обращался к тебе по этому вопросу?
Обращалась одна команда, но до конкретики не дошло. Не скажу, кто конкретно, а то будет смешно, но у них сейчас все хорошо. «Зенит» точно пользуется xG, у них вообще отличный аналитический отдел, хотя непонятно почему они летом подписали Новосельцева, а сейчас — Лунева. Про Новосельцева еще летом говорил, что трансфер странный, и с тех пор он так нормально и не поиграл, даже когда был здоров. Лунев — отдельная история. Оценивать вратаря на основании 10 матчей, все равно что покупать игрока за хорошие выступления на Евро или ЧМ— это очень короткая дистанция, и высока вероятность, что потом он провалится. Для вратаря важна стабильность, и Луневу нужно было, хотя бы как Селихову, отыграть год. С Селиховым уже более-менее ясно, что это за вратарь, а Лунев — человек совершенно непонятный. Возможно, он гений, и скауты «Зенита» обладают каким-то особым знанием. Например, в бейсболе скауты любили смотреть на задницу игрока, и если она им нравилась, то они могли посчитать игрока нереально перспективным. Но здесь пока непонятно.
Вполне возможно, что xG-модели использует «Краснодар». «Спартак» с приходом Карреры начал внедрять много инновационных методов, но конкретной информации нет. Вообще мне рассказывали, что в некоторых клубах РФПЛ нет даже специализированных статистических программ.
А что скажешь по Курбану Бердыеву? Прогрессивен ли он в этом плане? Его команды показывают отличные результаты при невысоком общем уровне игроков, и складывается впечатление, что он действительно знает чуть больше других.
Бердыев знает чуть больше, чем остальные, потому что это сильнейший тренер, который когда-либо работал в российской Премьер-лиге. Сильнее Спаллетти, Виллаш-Боаша, Адвокаата и Хуанде Рамоса. Не знаю точно, использует ли Бердыев что-то подобное, но не удивлюсь, ведь в «Ростове» большая обойма внештатных аналитиков и большое внимание к мелочам. Забыл про него, когда перечислял команды.
Ты и еще несколько человек, взялись обсчитывать xG самостоятельно и выводить на основе данных свои таблицы. Закупаете статистику у Opta или достаточно того, что предоставляет в открытый доступ Whoscored?
Статистики от Opta у нас нет, берем с Whoscored. Думаю, важно отметить, что гораздо больший вклад в развитие нашей модели вносит Андрей Кривоногов. Эта фамилия должна здесь прозвучать. Именно он создал нашу модель и совершенствует ее. Его задача — получить данные, а моя — уже как-то их интерпретировать. Андрей сейчас живет под Парижем, а учился в хорошем Новосибирском университете. Его вклад сложно переоценить.
В развернутой статистике на Whoscored можно найти все необходимые данные, вплоть до количества игроков, находившихся между бьющим и воротами?
Нет, количество игроков между бьющим и воротами — это как раз то, что сейчас сложно учесть. Но в формулу заложено, что при пасе вразрез между бьющим и вратарем игроков меньше, потому что разрезающая передача отсекает минимум двоих. Также формула определенным образом учитывает число игроков и при пасе из опасной зоны.
Но конкретных значений по количеству игроков между бьющим и вратарем нет. Проблема футбольной аналитики и статистики в том, что до сих пор не научились как-то обсчитывать действия игроков без мяча. Все что с мячом — делают хорошо, а без мяча — вообще никак. То, о чем мы сейчас говорим, это как раз история без мяча, и пока это очень сложно для оценки.
В своих таблицах вы используете кучу дополнительных параметров, которые не считают западные коллеги. Ту же разницу xG при равном счете.
Это как раз придумка Андрея Кривоногова. Есть и мои идеи — средний вес ударов команды и ударов противников. Или соотношения голов с игры к xG и пропущенных голов к допущенным xG — с помощью этого можно понять, за счет чего команда недобирает или перебирает очки. Мы понимаем, это сама команда плохо реализует, или противник реализует хорошо. Самый гениальный показатель — True Difference. Он показывает, сколько очков команда перебрала/недобрала без учета матчей, где команда выиграла/проиграла по xG с такой разницей, что при симуляции имела на победу/поражение больше 2/3 шансов и в итоге выиграла/проиграла – то есть более зашумленная разница.
Я все-таки с портала о ставках, поэтому пора немного поговорить и о них. Знаю, что не очень увлекаешься конкретно ставками, но при твоих знаниях и наличии аналитической модели, почему бы не начать обыгрывать букмекера?
Проблема в том, что на бигмаркетах много не заработаешь. Ты же понимаешь, что будешь там сидеть с ROI максимум 3%. Вряд ли по итогу выйдет больше, чем получаешь на основной работе. Но по чуть-чуть все-таки занимаюсь, причем меня больше привлекают ставки на угловые, ведь легче зарабатывать на самых повторяющихся в игре событиях. В футболе к ним относятся: пасы, потом ауты, затем фолы, ну и угловые. На пасы дают линию только в финалах крупных турниров, на фолы — в Лиге чемпионов и на какие-то топ-матчи уик-энда. Дистанции нет. А под угловые можно рассмотреть 50 матчей за выходные, причем тут понятно, от чего отталкиваться.
Например, попробуй у себя на сайте провести опрос, с чем больше всего коррелируют угловые. Люди до сих пор думают, что с подачами с фланга, хотя на самом деле корреляция между угловыми и подачами с фланга всего 0,08, а между ударами по воротам и угловыми — 0,26. Удар провоцирует угловой в среднем в три раза чаще, чем подача с фланга. Например, команда пробила по воротам 10 раз и не подала ни одного углового — в течение матча это можно рассмотреть как сигнал, что стоит прикупить несколько угловых. Мы же понимаем, что команда и дальше будет давить, хотя при этом может вообще не делать кроссов. Даже если просто понаблюдать за игрой, можно заметить, что удары провоцируют угловые гораздо чаще, чем кроссы.
Это как раз к разговору о том, что лайв-ставки предпочтительнее прематча?
Ну почему так однозначно? Тут палка о двух концах: в лайве выше маржа, ведь букмекеры не всегда успевают скорректировать линию, но зато против тебя сидит один человек, а не аналитическая бригада, как в прематче. Вопрос дискуссионный.
Если в бигмаркетах сложно иметь РОИ больше 3%, то почему бы не пойти в какие-то менее популярные лиги с меньшим количеством ставок?
Тут вся проблема в максимумах. Сложно найти букмекера, который даст много поставить на минорные лиги. С брокерами тоже сложно: они неохотно расписывают линии на статистику. Наверное, можно браться за смолмаркеты, но максимумы реально низкие. Ну сколько можно поставить? Тысяч 6000? Это очень мало.
Но в отличие от бигмаркетов тут можно выдавать гораздо более высокий ROI.
Я, конечно, видел в статистиках биржи ROI 25% на дистанции 4500 ставок на смолмаркетах, но не уверен, что она не рисуется. Биржа может быть в сговоре с игроком, рисовать ему завышенный ROI, чтобы больше людей пользовались платной подпиской, и иметь с этого процент. На смолмаркетах крутятся небольшие деньги, и на них вряд ли получится жить.
Есть ли какое-то прямое использование xG-моделей для вычисления выгодных ставок каждые выходные?
xG можно использовать в качестве описательного элемента. Например, мы знаем, что «Ницца» пропускает на 50% ниже ожидаемого уровня. Смотрим, сколько моментов создает команда, которая играет против нее, и прикидываем, есть ли смысл забирать ее голы. Но опять же, нельзя говорить, что «Ницца» обязана в будущем начать больше пропускать. Это случится, только если сохранится текущий уровень игры в защите. Тогда со временем реализация регрессирует к среднему, и «Ницца» начнет пропускать больше, чем сейчас. Букмекеры же будут основываться на реальном количестве пропущенных голов, и, видя, что команда мало пропускает, будут некоторое время давать высокие коэффициенты на голы против «Ниццы». Это из общих соображений.
Есть сайт goalprojection.com. Там человек на основании xG-моделей и критерия Келли вычисляет оптимальный размер ставки в проценте от банка. Если, например, предлагается поставить 8% от банка, то ставка очевидно валуйная, и ее надо брать, причем можно брать своим стандартным размером ставки и любым другим флэтом.
Если мы говорим о важности дистанции, то насколько применимы xG-модели для вычисления валуйных долгосрочных ставок? Есть ли смысл ставить против чемпионства «Спартака», сильно перебравшего очков в первой части сезона?
Проблема чемпионата России в специфике: у нас посреди сезона огромный перерыв, и за это время «Спартак» вполне может поднять уровень игры. В таком случае, даже если реализация изменится к средним показателям, то «Спартак» все равно будет нормально идти. Если бы перерыв был две недели, то другое дело. В «Спартак» пришли новые игроки (Луис Адриано, Самедов, Джикия, Селихов), и это первые полноценные сборы Карреры. Команда просто может начать играть лучше, поэтому ставка на нечемпионство «Спартака» опасная. Но в других лигах можно искать какие-то недооцененные варианты. Например, обратить внимание на Францию, где лидирующий «Монако» перебрал очков, а борющаяся за чемпионство «Ницца» перебрала вообще космически.
Таблица ожидаемых очков французской Лиги 1 после 23 туров
Какие вспомогательные сайты можешь посоветовать бетторам?
Все-таки повторюсь, что я не особо игрок. Я больше исследователь-любитель, и денег на этом не зарабатываю. Однозначно стоит читать сайт whoscored.com— там очень много статистики. Также стоит читать simplesoccerstats.com, где есть централизованная статистика по угловым по многим лигам, включая ту же Австрию. Там можно найти все, что захочешь. Кстати, на Whoscored добавили статистику по судьям — она очень интересная, пожалуй, лучшая из того, что я видел в бесплатном доступе. И все-таки посоветую сайт, о котором мы говорили, про критерий Келли. Goalprojection.com— его тоже стоит читать.
Хоть ты и не считаешь себя игроком, но все-таки: сколько максимально выигрывал с одной ставки?
Это была ставка на шахматы. Не буду называть пару и не скажу, сколько выиграл, но не так много — несколько десятков тысяч. Вообще в формате ставок я больше увлекался именно шахматами. У меня был товарищ, который глубоко знал тему и много с кем общался из этой среды. Было время, мы на одну и ту же пару из-за низких максимумов ставили в трех конторах. Ставка была на ничью, и коэффициент в районе 1,6.
И напоследок, сделаем небольшой блиц-опрос на темы, которые часто мелькали в твоем паблике «Блокнот». Долго не думай и отвечай сразу.
Давай-давай.
Хазенхюттль или Сампаоли?
Сампаоли.
Модрич или Дембеле?
Модрич.
Фаллен МС или Джиглипуф?
Джиглипуф МС, конечно!
Гнойный вынесет Оксимирона?
Думаю, нет.
«Спартак» — чемпион?
Надеюсь, что нет.
Читать также:
Нашли ошибку? Сообщите нам
Комментарии (1)
Stan
«»Например, команда пробила по воротам 10 раз и не подала ни одного углового — в течение матча это можно рассмотреть как сигнал, что стоит прикупить несколько угловых. «» (с)
_____________
Скорее, это может означать, что команда, прежде делегировавшая к чужим воротам такое количество игроков, чтобы довести 10 атак до ударов по воротам — может настолько выдохнуться, что вообще больше не в состоянии будет провести ни одной полноценной глубокой атаки. Не говоря уже об угловом. ))))
(Зависит от текущего счета матча, от соотношения сил команд. Одна из команд сделала ставку на стартовый натиск, на первый тайм. Провела его активно, била по воротам, результата не добилась. Всё. Это приговор для угловых. Игроки не трехжильные.
Сколько корреляций угловых к остальным параметрам матча? Да их десятка три…