Спорт на основе данных: как визуализация помогает клубам и организаторам принимать решения

Хоккейный клуб, футбольная команда, киберспортивная платформа и марафон на 15 тыс. бегунов. У всех разные источники и задачи, но подход общий: собрать данные в облаке, визуализировать и превратить в рабочий инструмент. Показываем, как это устроено.

Краткий пересказ YandexGPT
  • Глобальный рынок спортивной аналитики в 2025 году составил около 5,8 млрд долларов при ежегодном росте на 20%. Спортивные команды и организации вкладываются в аналитику, чтобы повысить точность действий, сэкономить ресурсы и получить конкурентное преимущество.
  • Для эффективного использования данных их нужно собрать из разных источников, обработать и визуализировать.
  • ХК «Авангард» использует аналитику для оценки эффективности бизнес-направлений (мерч, кейтеринг, продажа билетов и т. д.), данные собирают из PostgreSQL, Microsoft SQL Server и «1С:Управление торговлей», визуализируют в Yandex DataLens.
  • ФК «Динамо» реализует проект «Цифровой двойник» футболиста: собирает данные о перформансе игроков, результатах медицинских тестов и анализов, использует Yandex Cloud для обработки и хранения данных.
  • GameSport анализирует киберспортивные соревнования, использует технологии машинного обучения, обрабатывает данные в реальном времени, хранит информацию в Yandex Managed Service for ClickHouse® и Yandex Managed Service for MySQL®.
  • Almaty Marathon использует дашборды для предоставления участникам и болельщикам информации о результатах забега в реальном времени, данные с чипов участников обрабатываются и визуализируются с помощью Yandex DataLens.
  • Все организации используют единый подход к аналитике данных: подключают разрозненные источники к единому хранилищу, обрабатывают и визуализируют данные с помощью инструментов Yandex Cloud.
  • Аналитика в спорте стала сложной и развитой, клубы собирают данные для разных целей: для тренерского штаба, бизнес-аналитики, маркетинговых исследований.

По оценке Fortune Business Insights, глобальный рынок спортивной аналитики в 2025 году составил около 5,8 млрд долларов при ежегодном росте на 20%. Команды, лиги и организаторы соревнований вкладываются в это направление, поскольку рассчитывают на конкретный результат: более точные действия, экономию ресурсов, конкурентное преимущество.

Но между стадиями «мы собираем данные» и «мы принимаем решения на их основе» есть дистанция. Сырые таблицы и выгрузки не помогают тренеру подготовиться к матчу, а менеджеру — понять, какая промокампания сработала. Чтобы данные начали приносить пользу, их нужно собрать из разных источников, обработать и визуализировать: превратить в дашборд, на который можно посмотреть и принять верное решение.

Четыре кейса из России и Казахстана показывают, как это работает на практике — в организациях с разным масштабом, бюджетом и задачами.

ХК «Авангард»: бизнес-аналитика на 50 тыс. рублей в месяц

Омский хоккейный клуб «Авангард» — двукратный чемпион России. С 2022 года команда играет на собственной двенадцатитысячной арене G‑Drive, где за сезон 2024–2025 гг. прошло более 100 мероприятий, которые посетили 700 тыс. зрителей.

Помимо хоккейных матчей, «Авангард» зарабатывает на мерче, кейтеринге, клубном телевидении, мобильном приложении и телеграм-боте для продажи билетов. После переезда на новую арену у клуба выросла аудитория, улучшились коммерческие показатели, а вместе с ними выросла и ценность данных. Чтобы оперативно оценивать эффективность каждого бизнес-направления, руководству нужно было построить аналитику и визуализацию данных из трёх источников: PostgreSQL, Microsoft SQL Server и «1С:Управление торговлей». Каждый из них хранит данные о доходах своего бизнес-юнита.

Информацию из трёх источников собирают в слой сырых данных в Yandex Managed Service for ClickHouse®. Данные по продажам билетов и абонементов поступают в реальном времени — они критически важны, потому что от них зависят показатели других направлений: выручка с матча по мерчу и кейтерингу. Свежие данные из «1С:Управление торговлей» каждые три часа загружают в Yandex Managed Service for ClickHouse® с помощью специального экстрактора. Данные из PostgreSQL и Microsoft SQL Server переносят через Yandex Data Transfer. Yandex Managed Service for Apache Airflow® по расписанию запускает скрипты, которые перемещают информацию из слоя сырых данных в промежуточный, а затем в CDM — слой витрин. Здесь формируются наборы для дашбордов в Yandex DataLens и для Google-таблиц, которые бизнес-пользователи используют при планировании.

Полноэкранное изображение

Схема движения данных

Дашборд показывает ключевые показатели бизнес-юнитов клуба с разбивкой по дням или матчам, а фильтры позволяют выбрать сезон, арену, тип мероприятия, лигу и этап турнира. По стоимости оперативная аналитика обходится клубу в 50 тыс. рублей в месяц. Топ-менеджеры получают ключевые показатели без задержек, а менеджеры продукта сами проводят аналитические исследования. В итоге количество запросов к аналитику команды существенно снизилось. Ответственный менеджер раз в день просматривает отчёты и по результатам принимает управленческие решения и тестирует гипотезы, эффективность которых можно проверить в течение нескольких домашних серий матчей.

В планах клуба — считать LTV клиентов, анализировать метрики взаимодействия с продуктом и промокампании, а также формировать отдельные отчёты по ключевым показателям для каждого домашнего матча.

Нам было важно выстроить регулярную аналитику ключевых управляемых коммерческих направлений клуба и научиться принимать решения на её основе. Любая аналитика начинается с качественных данных и завершается наглядной визуализацией и практическими выводами. В Yandex Cloud мы смогли реализовать весь процесс, имея небольшой бюджет.
Николай Шмаков
Начальник управления аналитики и цифровых решений ХК «Авангард»

Селекция в футболе — это поиск и подбор игроков для команды: анализ рынка, оценка кандидатов, принятие решения о покупке или аренде футболиста.

ФК «Динамо»: «Цифровой двойник» футболиста

Если в хоккее Yandex DataLens помогает с бизнес-аналитикой клуба, то в футболе фокус смещается на спортивную аналитику и данные об игроках. В московском «Динамо» за это направление отвечает директор по спортивной аналитике Максим Дюков.

В последние годы данные для футбольного клуба перестали быть набором цифр и картинок и превратились в стратегический актив. Есть две основные роли данных в клубе:

  • Операционная — это подготовка к матчам, анализ перформанса игроков, сбор информации о физической активности футболистов. Всё то, что помогает тренерскому штабу и менеджменту принимать решения в повседневной работе.
  • Стратегическая — это селекция, исторические данные по перформансу и прогностические модели.

Клуб работает с большим количеством внешних и внутренних источников. Внешние поступают от провайдеров статистики и содержат данные о том, как футболисты выступают на поле и забивают голы. Эти данные выгоднее закупать, потому что объём огромный, особенно если речь идёт о международных рынках и подборе игроков под селекцию. Внутренние — данные с носимых устройств, вроде GPS-трекеров и датчиков ЧСС, результаты медицинского мониторинга и функционального тестирования.

В сезоне 2024–2025 гг. клуб реализовал проект «Цифровой двойник» — платформу, которая собирает и хранит все данные о перформансе футболистов, результатах медицинских тестов и анализов. Технически это не один сервис, а целая инфраструктура. В Yandex Compute Cloud развёрнуты виртуальные машины с контейнеризованными сервисами сбора и обработки данных, объединённые в изолированную сеть Yandex Virtual Private Cloud.

Сырые данные — статистика матчей, GPS-трекинг, медицинские показатели, результаты тестов — сначала попадают в Yandex Object Storage, где хранятся и архив, и промежуточные выгрузки. Затем включается ETL-конвейер на Yandex Managed Service for Apache Airflow®, который по расписанию забирает данные из источников, нормализует их, связывает между собой, например сопоставляет одного и того же игрока в разных системах, и складывает в Yandex Managed Service for Sharded PostgreSQL — управляемую базу, где формируется озеро данных. Поверх озера строятся витрины — подготовленные наборы данных под конкретные задачи: перформанс на тренировках, медицинский профиль, селекционная аналитика. К витринам подключены дашборды в Yandex DataLens.

Дашбордами пользуются тренеры, врачи и аналитики. Последние отталкиваются от заказчика: приходят к функционеру, тренеру или главному врачу и помогают решить конкретные задачи. Ключевой принцип — данные и аналитика не заменяют опыт и компетенции тренера, а усиливают их.

Данные не заменяют опыт тренера или менеджера, но усиливают эти компетенции, дают инструменты, которые помогают принимать более эффективные решения, использовать объективные показатели и в целом ускорять повседневную работу.
Максим Дюков
Директор по спортивной аналитике ФК «Динамо»

Для задач, где нужен не только просмотр цифр, но и работа с текстом: быстрый поиск игрока на естественном языке, подготовка аналитической справки, сравнение профилей, — используется Yandex AI Studio. ИИ-агент на основе платформы обращается к тем же витринам и озеру, что и дашборды, но отвечает на вопросы в диалоговом формате: «Помоги найти футболиста на определённую позицию» или «Сравни профили двух игроков по медицинским показателям». Состояние инфраструктуры и пайплайнов контролируется через Yandex Monium Metrics и Yandex Monium Logs, доступ к ресурсам разграничен через Yandex Identity and Access Management. Так устроена сквозная цепочка: от датчика на поле или провайдера статистики до экрана тренера или аналитика — всё на инфраструктуре Yandex Cloud.

Если собирать данные на протяжении всей карьеры игрока — от спортивной академии до первой команды, — можно не только анализировать его развитие, но и использовать эти данные как референс для следующих поколений. Какие результаты тестирования должны быть у молодого игрока, чтобы попасть в первую команду? Сейчас ориентируются на лучших футболистов, но со временем накопленные данные позволят находить глубинные взаимосвязи — те, которые на поверхности не просматриваются. Здесь на помощь придут ML-модели.

GameSport: киберспортивные большие данные в реальном времени

В традиционном спорте данные собирают из различных систем, трекеров и датчиков. В киберспорте источник данных — это сами игровые сессии, и объём этих данных огромен.

GameSport — один из лидеров в создании аналитических прогнозов для киберспортивных соревнований. Компания анализирует чемпионаты по Counter-Strike, Dota 2 и другим дисциплинам, используя технологии машинного обучения. На платформе зарегистрировано больше 2 млн пользователей, а в штате работает свыше 50 экспертов в области аналитики данных. Основная задача — непрерывно анализировать большие данные: записи игровых сессий, статистику чемпионатов и команд из множества внешних источников. Большая часть данных обрабатывается в реальном времени.

Одни источники предоставляют данные по API, другие — нет. Во втором случае компания забирает разрозненные данные в исходном виде, например XML-файлами, и парсит. Получается воронка из большого количества источников, которая наполняет единую базу данных. В Yandex Managed Service for ClickHouse® хранятся исторические данные по киберспортивным чемпионатам мира за четыре года, а также выводы аналитики на основе ML-моделей. Служебные данные: аккаунты, новости, разделы портала — хранятся в Yandex Managed Service for MySQL®. Горячий кеш — в Yandex Managed Service for Valkey, чтобы снять нагрузку с управляемого MySQL®. Yandex Cloud CDN снимает нагрузку по статике.

Переход в облако позволил на 16% сократить расходы на администрирование и ускорить процессы в 1,5 раза. Компания получила репликацию баз данных и отказоустойчивость — резервирование с размещением копий в трёх зонах доступности. Запуск цифровых продуктов теперь происходит буквально в несколько кликов, при этом не потребовалось увеличивать штат.

Almaty Marathon: аналитика для 15 тыс. бегунов в реальном времени

В этом кейсе дашборды используют не сотрудники спортивной организации, а тысячи участников и болельщиков.

Almaty Marathon — крупнейшее спортивное событие Центральной Азии. В 2024 году он собрал 15 тыс. участников из 62 стран и 300 городов. Суммарно бегуны преодолели 630 тыс. километров. Организаторам нужно было дать спортсменам и болельщикам мгновенный доступ к промежуточным и финальным результатам — с разбивкой по полу, возрасту, стране и городу участников.

Чтобы решить эту задачу, на стартовом номере каждого участника установили чип для учёта времени. Считывающие устройства Mylaps Portable Decoder разместили на старте, финише и контрольных точках. Данные с чипов попадали на FTP-сервер, затем Python-скрипт преобразовывал их: переводил время в числовой формат, сводил информацию из разных дисциплин к общей логике и обеспечивал перевод на три языка: казахский, русский и английский. Обработанные данные поступали в кластер Yandex Managed Service for PostgreSQL, оттуда — в Yandex DataLens для построения дашбордов. Хранение изображений для дашбордов организовали в Yandex Object Storage. В итоге дашборды встроили на сайт марафона, информация в них обновлялась каждую минуту.

На реализацию ушло пять недель — от продумывания логики до внедрения визуализации на сайт. Дашборды могли видеть все: участники, партнёры, сотрудники фонда и представители СМИ. После марафона организаторы продолжили использовать решение.

Что объединяет эти истории

Четыре организации из разных видов спорта, с разным масштабом и бюджетом, использовали единый подход к аналитике данных. Разрозненные источники — провайдеры статистики, учётные системы, датчики, игровые серверы — подключают к единому хранилищу. Данные обрабатывают и визуализируют с помощью Yandex DataLens. В результате человек, который принимает решение, видит ответ на свой вопрос без промежуточных запросов к аналитику.

Аналитика в спорте сегодня стала настолько сложной и развитой, что спортивный клуб по количеству метрик для регулярного мониторинга легко сопоставим с предприятием непрерывного производства полного цикла. Клубы собирают данные о состоянии здоровья игроков для тренерского и медицинского штабов, бизнес-аналитики исследуют прибыльность игровых сооружений и ищут точки роста, маркетинговые аналитики изучают влияние кампаний на популярность клубов. Растёт и число спортсменов, которые собирают аналитику из открытых источников — от покерных турниров до массовых стартов по бегу и триатлону.
Сергей Сошников
Руководитель направления по продвижению аналитических решений

Такую широту применения можно объяснить невысоким порогом входа в Yandex DataLens. Сервис рассчитан на любых пользователей — от энтузиастов до профессиональных аналитических команд. У него есть библиотека знаний, экспертное сообщество и встроенный ИИ-агент Нейроаналитик, который помогает с написанием формул, подсказывает, какую визуализацию выбрать, а в готовом отчёте находит инсайты и помогает с выводами.

Спортивная индустрия — лишь один из примеров. Тот же подход: источники, хранилище и визуализация, применим в ритейле, логистике и любой другой отрасли, где нужна оперативная аналитика.

Спорт на основе данных: как визуализация помогает клубам и организаторам принимать решения

Войдите, чтобы сохранить пост