1. Данные о пользовательской активности с фронтенда сохраняются в операционную СУБД. Пример: покупки, переходы, лайки, комментарии и другие сведения.
Рекомендательная система для ритейла и e‑commerce
Создайте рекомендательную систему, используя платформу данных Yandex Cloud, технологии машинного обучения и визуализации данных. Инфраструктура в облаке справится с любой нагрузкой и объёмом информации, без капитальных затрат и поиска экспертов для её обслуживания.
Рекомендательная система анализирует поведение ваших пользователей, предсказывает вероятность выбора конкретных товаров или услуг. С ней вы улучшаете пользовательский опыт, повышаете количество товаров в среднем чеке и его итоговую сумму, уменьшаете отток клиентов.
Почему эту задачу нужно решать с Yandex Cloud
Надёжная управляемая платформа данных
Постройте платформу данных для вашей рекомендательной системы на базе надёжных и отказоустойчивых решений Yandex Cloud. Интеграция с популярными сервисами и инструменты машинного обучения позволят реализовать полный цикл работы с данными.
Поддержка профессионалов
Команда разработчиков Yandex Cloud поддерживает работу платформы 24/7, участвует в модернизации ведущих open-source проектов хранения данных: PostgreSQL, ClickHouse® и других, создаёт управляемые сервисы, которые Яндекс использует в Почте, Такси, Драйве.
Прозрачное ценообразование
Платите только за фактически потребляемые ресурсы, подключая дополнительные мощности по мере необходимости. Система биллинга покажет детальную информацию об объеме использованных ресурсов, что помогает чётко контролировать расходы денежных средств.
Визуализация данных и мониторинг
Стройте детальные графики и создавайте дашборды с ключевыми бизнес-метриками в удобном BI-сервисе Yandex DataLens. Контролируйте работу рекомендательной системы и загрузку ваших сервисов в реальном времени с помощью системы мониторинга.
Автоматическое масштабирование
Гибкая инфраструктура Yandex Cloud обеспечит автоматическое масштабирование ресурсов для вашей рекомендательной системы и хранения данных о предпочтениях пользователей. Все сервисы будут работать без снижения скорости даже в часы пиковых и непредсказуемых нагрузок.
Отказоустойчивость и безопасность
Разместите свою платформу данных в безопасном периметре трёх географически распределённых дата-центров Yandex Cloud, храните сведения о клиентах в соответствии с требованиями 152-ФЗ, GDPR, ISO и PCI DSS.
Архитектура решения
Используйте современные технологии и сервисы в проектировании архитектуры рекомендательной системы — СУБД ClickHouse, PostgreSQL, MySQL®, Spark™‑фреймворк, объектное хранилище S3 и DataSphere с GPU. Мы поможем продумать оптимальное решение и предложим походящий для вашего проекта вариант.
Пример реализации рекомендательной системы¹
2.1. Данные из фронтальных систем извлекаются Spark‑джобом (компонент Spark — часть Yandex Data Processing, но данные не сохраняются — вычисления производятся в памяти) или ETL-системой.
2.2. Без промежуточного приземления на диск с помощью Spark‑джоба (или любой другой ETL‑системы) данные из фронтальных систем перегружаются в аналитическую СУБД Greenplum®/ClickHouse. Затем данные приводятся к единой модели внутри аналитической СУБД — с помощью Spark‑джоба или совместимой ELT‑системы.
2.3. Устаревшие исторические данные перегружаются из ClickHouse/Greenplum в холодное хранилище S3/Yandex Data Processing (HDFS, Hive) для существенного снижения стоимости эксплуатации системы.
3. На больших объёмах исторических данных о поведении пользователей, хранящихся в DWH, Data Scientists обучают модели в DataSphere с использованием GPU, за которые платят только по факту использования.
4.1. Обученные или переобученные со временем модели выполняются в Spark, принимая на вход: в real-time — данные с фронтальной системы, в offline — данные из операционной СУБД.
4.2. Эти модели выдают необходимые рекомендации соответствующей системе, через которую они выставляются пользователям.
Посмотрите вебинар
Эксперты Glowbyte поделились опытом внедрения и построения рекомендательных систем: показали современную архитектуру рекомендательного движка на базе платформы данных Yandex Cloud и рассказали, как пришли к такому варианту.
Наши партнёры создадут ИТ-проект под ваши задачи. Продумают архитектуру, предложат подходящие технологии, рассчитают стоимость и возьмут на себя разработку и поддержку решения.
Закажите консультацию архитектора
1. Один из вариантов реализации. Оптимальную схему, подходящую для проекта, необходимо подбирать индивидуально. В этом вам помогут наши эксперты или партнеры.
2. Apache Spark является зарегистрированным товарным знаком Apache Software Foundation в США и/или других странах.
3. Greenplum является зарегистрированным товарным знаком VMware, Inc. в США и/или других странах.
4. ClickHouse является зарегистрированным товарным знаком ClickHouse, Inc.