О чём эта история

VINO.RU — маркетплейс российских вин. В 2024 году команда разработчиков VINO.RU совместно с партнёром — разработчиком ИИ-решений «Гуреев.Про» — создала цифрового помощника, который помогает пользователям выбирать вино. «Цифрового сомелье», основанного на модели YandexGPT, обучили на базе профессиональной экспертизы сомелье. Его встроили в телеграм-бот «Винтеллект». После запуска ботом воспользовались 9198 клиентов. В августе 2024 года 12% всех заказов на маркетплейсе покупатели сделали после взаимодействия с ботом. С 1 октября по 31 декабря 2024 года клиенты совершили более 18,7 тыс. целевых переходов из бота в каталог VINO.RU.

Создать цифрового помощника для персонального подбора вин

Проект VINO.RU работает по формату click & collect: покупатель оформляет заказ в онлайн-магазине, а получает его в офлайн-точке продаж. Платформа делает акцент на бутиковые хозяйства, которые выпускают лимитированные вина. В сервис входит навигатор по выбору лучших вин России, а также «Винный атлас» с описаниями лицензированных производителей.

Команда VINO.RU стремится развивать клиентский сервис. В рамках этой задачи совместно с компанией «Гуреев.Про», у которой есть опыт создания цифровых помощников для бизнеса, решили разработать консультанта по винам. На момент старта «Гуреев.Про» уже более года применяла ИИ в различных проектах. Поэтому партнёры решили протестировать, как генеративные языковые модели можно применять в маркетинге алкогольной продукции — сфере, где реклама строго регулируется, а возможности для прямого продвижения ограничены. Целью стало создание цифрового сомелье, способного работать с динамически обновляемым каталогом вин. Проект решили запускать сразу в продуктовом формате, чтобы быстрее определить технологические ограничения и как можно раньше выпустить работоспособную версию.

На первом этапе для проверки идеи использовали нейросеть OpenAI. Простая версия чат-бота подтвердила, что концепцию можно технически реализовать. После успешного теста команда приступила к выбору технологий для полноценного запуска.

Команда «Гуреев.Про» планировала сервис, у которого не было аналогов на российском рынке, и стремилась запустить первую версию за три месяца. Чтобы оптимизировать затраты, решили обойтись без физической инфраструктуры и GPU, обучив классификатор вин на базе TensorFlow в облаке.

Команда протестировала несколько моделей на другом ассистенте и выбрала YandexGPT. Партнёры оценили простоту дообучения больших языковых моделей в Yandex Cloud — нужная модель готова через сутки после загрузки датасета. Особенно полезным оказался подход PEFT (Parameter-Efficient Fine-Tuning) — он снижает нагрузку на инфраструктуру без потерь в производительности.

Большое количество русскоязычных токенов, гибкая оплата и возможность работы без GPU сделали Yandex Cloud оптимальной средой. Важную роль сыграли соответствие 152-ФЗ и круглосуточная поддержка, которая помогала оперативно решать возникающие вопросы. В результате весь проект развернули в Yandex Cloud.

Классификация вина с помощью алгоритмов и LLM

На реализацию проекта ушло три месяца. Сначала команда собрала базу данных вин с атрибутами для поиска и провела интервью с несколькими сомелье, чтобы понять этапы и принципы подбора вина. Многое из их экспертизы не поддавалось формализации, поэтому часть признаков обрабатывали классическими алгоритмами, а часть — с помощью языковых моделей. Из перечня признаков для подбора вина выбрали систематизированные и соединили их с учётной системой VINO.RU.

Для классификации вин использовали два подхода. Детерминированные признаки — тип, цвет, содержание сахара, винодельню — классифицировали алгоритмически. Сложные и неструктурированные характеристики, вроде описания аромата и крепости, обрабатывали с помощью Foundation Models Text Classification API. Модель поддерживает бинарную и многоклассовую классификацию, а запросы передаются в виде промтов. Некоторые данные о винах были неполными или представлены в разном формате — например, крепость могла выражаться и в целых, и в десятичных числах. Для нормализации данных команда использовала LLM-модели. Также учли динамический характер каталога VINO.RU: модель обучили предлагать только актуальные позиции, доступные на складе.

На втором этапе разработали пары запросов, например сочетания с блюдами и предпочтения по крепости. Так система исключает неуместные рекомендации — к примеру, не предлагает креплёное вино при запросе «лёгкий ужин».

Проект полностью реализовали на базе Yandex Cloud. Архитектура системы — микросервисная, каждый сервис упакован в Docker®-контейнер, версии помечаются тегами и хранятся в Yandex Container Registry. Развёртывание происходит в кластере Yandex Managed Service for Kubernetes®. Оркестрация — с помощью опенсорс-решения Node-RED, интегрированного с Yandex Managed Service for GitLab для организации версионности решений. Данные и веса моделей хранят в Yandex Object Storage и Yandex Managed Service for PostgreSQL. Метрики визуализируют в Yandex DataLens. Данные обновляются минимум раз в день.

При выборе большой языковой модели для нас было важно получать быстрые ответы, составленные на грамотном русском языке. Модель YandexGPT 3 Pro после дообучения, по результатам внутреннего тестирования, показала результаты лучше, чем GPT-4 от OpenAl, поэтому мы выбрали именно её. Чтобы обучить модель на знаниях профессионального сомелье, мы использовали оригинальную методологию, где воссоздавали и алгоритмизировали процесс подбора вина с учётом запроса клиента и текущего ассортимента. Я понял, что мы достигли цели, когда сервис предложил вино, идеально соответствующее моим ожиданиям, о котором я никогда не слышал. Это было удивительное открытие.

Дмитрий Гуреев,
руководитель ИИ-студии «Гуреев.Про»

Первый запуск прошёл на фокус-группе из 150 IT-директоров. На этом этапе проверяли корректность ответов и дообучали модель. Перед официальным запуском провели дополнительную разметку данных и цикл обучения.

Доступ пользователей к сервису реализовали через телеграм-бот «Винтеллект». Языковую модель также использовали в маркетинговой рассылке VINO.RU. Письма, персонализированные с учётом поведения пользователей за полтора месяца, повысили конверсию на 70%.

Четыре тысячи вовлечённых пользователей

За первые месяцы работы ботом «Винтеллект» воспользовались более 4 тыс. человек. В августе 2024 года 12% всех заказов на VINO.RU были оформлены после перехода из бота на базе YandexGPT. Специалисты компании отмечают, что такие пользователи демонстрируют значительную вовлечённость: они проводят на сайте больше времени и просматривают больше страниц.

В декабре 2024 года в YandexGPT появилась возможность передачи контекста между ассистентами. Поэтому команда разработала микросервисы для дублирования и передачи диалога между сервисами.

Сейчас «Гуреев.Про» тестирует YandexGPT 5, чтобы оживить диалог с цифровым сомелье, который сможет поддерживать с пользователем разговор о винах и винодельнях. Кроме того, в планах расширить базу вин и виноделен.

Мнение

Сергей Усик,
операционный директор VINO.RU
Сергей Усик,
операционный директор VINO.RU

Это был очень интересный опыт. Нам предстояло объединить навыки YandexGPT с уникальными знаниями сомелье. Кроме того, необходимо было адаптировать описание всех вин из каталога таким образом, чтобы поиск по ним был оптимальным и быстрым, а клиентам было приятно общаться с «Винтеллектом.