xG (expected goals) — одна из самых цитируемых метрик современной футбольной аналитики. Концепт прост: каждому удару назначается вероятность стать голом по факторам — дистанция, угол, часть тела, обороняющиеся. Сумма вероятностей и есть xG — сколько голов команда «должна была» забить.

Что обсуждается гораздо реже — что делать с разрывом между xG и реальными голами. Этот разрыв мы показываем на xG vs Actual Goals stats page, и он заслуживает внимательного чтения.

Три объяснения разрыву

Скилл / клиническое завершение

Самое лестное объяснение: нападающие команды реализуют моменты лучше среднего. Бьют тот же удар, что бил бы типичный игрок, но забивают чаще. Нападающие Реала исторически перевыполняют xG из года в год — модель говорит это реальный скилл-эффект.

Везение

Самое неприятное объяснение: случайность. xG-модели откалиброваны на десятках тысяч ударов, но в 5-месячном сэмпле из 30–40 матчей случайность всё ещё доминирует. Команда +5 к xG может просто иметь горячий стрик который откатится.

Стандарты или тактика

Промежуточное объяснение: команда необычно эффективна в категории ударов, которую xG-модель недооценивает. Специалист по штрафным может стабильно забивать с позиций, где средний шанс оценивается низко. Или тренерский штаб мастер стандартов — меньше моментов, но больше реализации.

Чтение таблицы

В нашей таблице «Diff» = Голы − xG. Плюс — перевыполнение, минус — недовыполнение. Эмпирические правила:

Частые ошибки

Не нормализуйте на матч при малом сэмпле

Команда сыгравшая 10 матчей с +3 xG diff — это не «+0.3 на матч», это «+3 с высокой дисперсией». Всегда смотрите Голы vs xG в сумме, не отношение на матч, пока сэмпл не достиг 20+ матчей.

Не оценивайте один матч по xG

xG vs голы одного матча слишком шумный для вывода. Используйте окно последних 10 матчей или сезонный агрегат, не in-match xG.

xG-модели у разных провайдеров

Разные дата-провайдеры используют разные xG-модели. Наши значения берутся из match-event scraping где источник их даёт, могут не совпадать точно с конкретным конкурентом. Относительный ранкинг надёжнее чем абсолютная цифра.

Почему это важно для live-коэффициентов

Live-рынок обычно ценит in-game Over/Under по счёту и темпу. Но медленнее реагирует на xG который копится без голов. Команда 0:1 с xG 1.7 vs 0.4 имеет выше вероятность следующего гола чем счёт показывает — рынок иногда недоценивает. Наблюдение за разрывом даёт edge.

Комбинация с Powerd

Наша метрика Powerd независима от xG. Их комбинация даёт более сильный сигнал чем по отдельности:

Эта матрица 2×2 — одна из самых полезных рамок которую мы видели для кросс-валидации реального уровня команды.