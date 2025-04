У команды KeepRise более 15 лет опыта работы с ценообразованием: создали внутреннюю систему автоматизации поиска оптимальных цен для большой федеральной продуктовой сети, а также помогали с оптимизацией цен компаниям РИВ ГОШ, Агрокомплекс и другим крупным сетям ритейла. Поэтому к моменту реализации у команды уже было понимание архитектуры решения и требований бизнеса.

И хотя концепция архитектуры проекта была понятна, нужно было подобрать оптимальное инфраструктурное решение: использовать физические серверы, полностью расположить все данные в облаке или выбрать гибридный формат.

В ценообразовании участвуют данные, которые могут оказать значительное влияние на бизнес. И некоторые компании из соображений безопасности и конфиденциальности не хотят, чтобы такая информация хранилась в облаке. Другие компании готовы передавать данные в облако, понимая преимущества гибкости и доступности готового решения. Важно отметить, что облачные провайдеры стремятся обеспечить безопасность хранения персональных и других чувствительных данных.

KeepRise хотела создать сервис, который предоставит выбор инфраструктуры клиентам в зависимости от их внутренних требований. Так как платформа KeepRise — это сложная высокотехнологичная система, требующая компетенций для обслуживания, то в основном клиенты выбирают облачную инфраструктуру, но около 30% клиентов предпочли развернуть приложения полностью на своих вычислительных мощностях. При гибридном решении часть информации хранится на собственных серверах клиента, а вычисления производятся в облаке.

Архитектура решения поделена на два контура: контур клиента и контур KeepRise, где и производятся вычисления. Вначале необходимо собрать данные из всех источников клиента: это могут быть транзакции, файлы в CRM, информация из приложений и так далее. В контур KeepRise их загружают с помощью Airbyte и далее сохраняют в Yandex Object Storage. Помимо собранных данных, здесь также хранятся архивы, файлы фронтенда приложения и состояния инфраструктуры Terraform.

Затем собранную информацию фильтруют и при помощи инструмента оркестрации Dagster направляют в DWH, которое организовано на базе Yandex Managed Service for PostgreSQL. В хранилище выделили два слоя: холодный и горячий. Данные от клиента поступают в холодное хранилище и проходят предварительную обработку: каждый день изменения в значениях фиксируются как цифровой слепок или версия. Это обеспечивает актуальность данных и даёт возможность восстановить состояние на любую прошедшую дату. Слепки актуальных данных направляются в горячее хранилище. Расчёт цен происходит очень быстро — системе не нужно каждый раз обращаться в хранилище и производить вычисления, она использует уже предварительно подготовленные данные. Управляет вычислениями контур центральной обработки. Причем подготовка оптимальных цен происходит как ежедневно по расписанию, так и событийно, например, при изменении количества остатков на складе или же по запросу пользователя. Оркестрирует все потоки данных контур координации с использованием инструмента Dagster. Параметры приложения хранятся в Yandex Managed Service for MongoDB. В кластере Yandex Managed Service for Kubernetes® развернули контейнеризированные приложения KeepRise, что позволяет легко управлять ими и масштабировать их при необходимости.