xG (expected goals) — одна из самых цитируемых метрик современной футбольной аналитики. Концепт прост: каждому удару назначается вероятность стать голом по факторам — дистанция, угол, часть тела, обороняющиеся. Сумма вероятностей и есть xG — сколько голов команда «должна была» забить.
Что обсуждается гораздо реже — что делать с разрывом между xG и реальными голами. Этот разрыв мы показываем на xG vs Actual Goals stats page, и он заслуживает внимательного чтения.
Три объяснения разрыву
Скилл / клиническое завершение
Самое лестное объяснение: нападающие команды реализуют моменты лучше среднего. Бьют тот же удар, что бил бы типичный игрок, но забивают чаще. Нападающие Реала исторически перевыполняют xG из года в год — модель говорит это реальный скилл-эффект.
Везение
Самое неприятное объяснение: случайность. xG-модели откалиброваны на десятках тысяч ударов, но в 5-месячном сэмпле из 30–40 матчей случайность всё ещё доминирует. Команда +5 к xG может просто иметь горячий стрик который откатится.
Стандарты или тактика
Промежуточное объяснение: команда необычно эффективна в категории ударов, которую xG-модель недооценивает. Специалист по штрафным может стабильно забивать с позиций, где средний шанс оценивается низко. Или тренерский штаб мастер стандартов — меньше моментов, но больше реализации.
Чтение таблицы
В нашей таблице «Diff» = Голы − xG. Плюс — перевыполнение, минус — недовыполнение. Эмпирические правила:
- Diff между -2 и +2: нормальный диапазон. Сигнал не читаем.
- +3 до +5: лёгкое перевыполнение. Скилл или горячий стрик.
- +6 и больше: существенное перевыполнение. Команда с «edge в завершении» или ещё не учтённая рынком.
- -3 до -5: недовыполнение. Команда создаёт моменты но не реализует. Часто buy-сигнал — голы обычно приходят.
- -6 или хуже: проблема. Нападающие в спаде формы или тактика максимизирует плохие удары.
Частые ошибки
Не нормализуйте на матч при малом сэмпле
Команда сыгравшая 10 матчей с +3 xG diff — это не «+0.3 на матч», это «+3 с высокой дисперсией». Всегда смотрите Голы vs xG в сумме, не отношение на матч, пока сэмпл не достиг 20+ матчей.
Не оценивайте один матч по xG
xG vs голы одного матча слишком шумный для вывода. Используйте окно последних 10 матчей или сезонный агрегат, не in-match xG.
xG-модели у разных провайдеров
Разные дата-провайдеры используют разные xG-модели. Наши значения берутся из match-event scraping где источник их даёт, могут не совпадать точно с конкретным конкурентом. Относительный ранкинг надёжнее чем абсолютная цифра.
Почему это важно для live-коэффициентов
Live-рынок обычно ценит in-game Over/Under по счёту и темпу. Но медленнее реагирует на xG который копится без голов. Команда 0:1 с xG 1.7 vs 0.4 имеет выше вероятность следующего гола чем счёт показывает — рынок иногда недоценивает. Наблюдение за разрывом даёт edge.
Комбинация с Powerd
Наша метрика Powerd независима от xG. Их комбинация даёт более сильный сигнал чем по отдельности:
- Высокий Powerd + позитивный xG diff = стабильно сильная команда
- Высокий Powerd + негативный xG diff = элитная команда в спаде (интересный buy-сигнал)
- Низкий Powerd + позитивный xG diff = везучая полоса (интересный sell-сигнал)
- Низкий Powerd + негативный xG diff = обе метрики соглашаются на слабости
Эта матрица 2×2 — одна из самых полезных рамок которую мы видели для кросс-валидации реального уровня команды.