Как AlmaWine создала платформу анализа данных из 40 учётных систем

- AlmaWine — многопрофильная организация в Казахстане, которая занимается импортом и дистрибуцией алкогольных напитков, розничной торговлей под брендом Nauryz Market и производством продуктов питания под брендом Nauryz Food.
- Компания столкнулась с проблемами из-за разрозненных IT-систем и отсутствия единой платформы для консолидации информации.
- Для решения проблем AlmaWine создала платформу данных на базе опенсорс-решений и управляемых сервисов Yandex Cloud.
- За четыре месяца компания развернула отказоустойчивую инфраструктуру, разработала решение и запустила его в эксплуатацию.
- Платформа позволяет одновременно обрабатывать данные множества бизнес-систем и внешних сервисов, что улучшило аналитические возможности компании.
- В результате внедрения платформы AlmaWine смогла повысить оборачиваемость товарно-материальных запасов по некоторым брендам до 30%, сократить время принятия решений с нескольких дней до нескольких часов, улучшить управление оборотным капиталом и повысить прозрачность операционной деятельности.
- Для загрузки и трансформации данных используется Apache Airflow™, для хранения данных — Yandex Managed Service for MongoDB, Yandex Managed Service for PostgreSQL и Yandex Managed Service for ClickHouse®, для визуализации и анализа информации — Yandex DataLens, для хранения файлов и фотографий — Yandex Object Storage.
- Команда AlmaWine анализирует данные о товарных остатках, финансовых данных и предпочтениях клиентов, разрабатывает персонализированные предложения и стратегии для повышения эффективности работы.
- В планах у AlmaWine — разработка чат-ботов для розничных клиентов с использованием YandexGPT API и Yandex Search API.
- Инженер-программист дата-продуктов AlmaWine отметил, что благодаря Yandex Cloud компания смогла оперативно настроить инфраструктуру для анализа данных, минимизировать затраты на разработку и масштабирование и сосредоточиться на решении ключевых бизнес-задач.
О чём эта история
AlmaWine
За четыре месяца AlmaWine развернула отказоустойчивую инфраструктуру, разработала решение и запустила его в эксплуатацию. В результате компания расширила возможности аналитики за счёт одновременной быстрой обработки данных множества бизнес-систем региональных подразделений и внешних сервисов. Это позволило найти точки роста, улучшить использование оборотного капитала, до 30% повысить оборачиваемость товарно-материальных запасов по некоторым брендам и сократить время принятия решения с нескольких дней до нескольких часов.

Поиск решения для стратегического планирования и глубокого анализа продаж
По мере роста бизнеса AlmaWine столкнулась с типичными для быстрорастущей компании вызовами: 40 разрозненных IT-систем и несколько баз данных, отсутствие единой платформы для консолидации информации, недостаток прозрачности и реактивный подход к принятию решений. Обработку данных по регионам вели в Excel, отчёты отправляли по электронной почте и сводили в единый файл в головном офисе. Проблемными были и оценка рентабельности отдельных брендов, и детальный анализ разрозненной финансовой информации. Недостаточная детализация и ограниченная история не давали точно прогнозировать товарные остатки по брендам и стратегически планировать закупки и продажи.
Поэтому AlmaWine решила создать платформу данных, которая смогла бы объединить весь массив информации и обеспечить её анализ, ускорить цикл принятия решений и предоставить инструменты для проактивного реагирования. Компания рассмотрела несколько вариантов развёртывания и остановилась на облаке, чтобы ускорить внедрение проекта. Использование собственной инфраструктуры могло значительно увеличить сроки реализации и замедлить достижение целей компании.
AlmaWine провела оценку нескольких облачных платформ, включая самые известные международные и российские решения. В первую очередь провайдер должен был предоставить необходимые проекту вычислительные мощности, инструменты для быстрого развёртывания сервисов и управления инфраструктурой. При этом облачная платформа обязана соответствовать требованиям закона Республики Казахстан № 94-V «О персональных данных и их защите».
Выбор сделали в пользу платформы Yandex Cloud — она предложила высокое качество технической поддержки, широкий спектр управляемых сервисов, гибкую, конкурентоспособную модель ценообразования и понятную систему биллинга.
Учитывался и тот факт, что это единственная облачная платформа в Казахстане, которая соответствует требованиям закона № 94-V, выполняет ключевые требования GDPR, а также имеет сертификаты соответствия ISO 27001, 27017, 27018 и PCI DSS.
Создание платформы данных на базе Yandex Cloud
В этой статье:
В начале проекта ситуацию осложняло то, что раньше в AlmaWine не было центральной системы для анализа данных по всем входящим в группу компаниям, которые используют ERP. Поэтому в течение первых двух месяцев команда из одного дата-инженера и трёх дата-аналитиков AlmaWine сосредоточилась на разработке коннекторов для учётных систем. В результате систему подключили к нескольким источникам данных: БД систем ERP каждого регионального филиала и сторонним приложениям, таким как Kaspi, Glovo, Wolt.
Далее в течение месяца консолидировали, стандартизировали и каталогизировали данные. На четвертый месяц с начала проекта команда запустила первый готовый дата-продукт. Он предоставляет аналитические возможности для оценки продаж, клиентской базы и эффективности ассортимента. Большая часть информации обновляется каждые 24 часа, но оперативные данные получают чаще — каждый час. Полный цикл обновления всех слоёв хранилища — три часа.
Загрузку и трансформацию данных обеспечивает развёрнутый на ВМ Yandex Compute Cloud Apache Airflow™. Он передаёт неструктурированную информацию из учётных систем в Yandex Managed Service for MongoDB, которая выполняет роль слоя первоисточника DWH Stage. Для интеграции с внешними сервисами применяют FastAPI. Для консолидации и хранения каталогизированных данных на уровне DWH DDS (Dimensional Data Store) используют Yandex Managed Service for PostgreSQL. В этой БД также хранятся обработанные наборы данных, которые нужны для поддержки конкретных бизнес-процессов, подразделений компании и готовых для анализа витрин. Управляемый сервис позволяет платформе справляться с большими объёмами информации и обеспечивает высокую производительность и надёжность. Yandex Managed Service for ClickHouse® служит для создания копий витрин данных и быстрого доступа к ним. Для визуализации и анализа информации команда использовала Yandex DataLens. А Yandex Object Storage обеспечивает хранение файлов и фотографий полок супермаркета, нужных при оценке эффективности мерчендайзинговых мероприятий.

Когда команда сталкивалась с трудностями, она обращалась в поддержку Yandex Cloud, специалисты которой обычно реагировали в течение часа, а все проблемы решали в течение дня.
Сейчас компания фокусируется на интеграции данных для анализа цепочек поставок, маркетинга и финансов.
Аналитическая платформа для прозрачности и эффективности операционной деятельности
Небольшая команда аналитиков и инженеров данных AlmaWine в короткий срок разработала и запустила в продакшн надёжную единую платформу данных в Yandех Cloud. Управляемые сервисы и отказоустойчивая инфраструктура помогли сократить затраты времени и усилий и создать масштабируемое и стабильное решение.
Платформа данных обеспечивает анализ продаж в реальном времени и ежедневную оценку товарных запасов и закупок, что позволяет AlmaWine эффективнее управлять оборотным капиталом. Сейчас компания отмечает улучшение оборачиваемости товарно-материальных запасов по некоторым брендам на 30%. Компания собирает и анализирует предпочтения клиентов для каждой торговой точки и разрабатывает персонализированные предложения. Также она предоставляет своевременные индивидуальные рекомендации менеджерам торговых точек для увеличения продаж.
Команда AlmaWine проанализировала товарные остатки по брендам в 20 подразделениях за несколько лет и на основе этого разработала стратегию для повышения эффективности планирования и работы цепочки поставок. Анализ финансовых данных позволяет более точно рассчитывать доходы и расходы по каждому бренду. Это способствует устойчивому росту компании и повышению прибыльности. Также AlmaWine повысила прозрачность операционной деятельности. Повысилась управляемость торговой команды, а время от гипотезы до принятого решения сократилось с нескольких дней до нескольких часов. Кроме того, выросла точность прогнозирования и были найдены новые точки роста.
В планах у AlmaWine разработка чат-ботов для розничных клиентов и заполнение карточек товаров с использованием YandexGPT API и Yandex Search API.

