При этом было важно, чтобы сервис не использовали для генерации сторонних изображений для личных целей. Его планировали интегрировать не только с сайтом, но и с приложением, и нужно было предусмотреть ограничения трафика. Поэтому за один раз пользователь может создавать не более трёх картинок, либо вернуться к попыткам через два часа. Тесты показали, что этого количества достаточно, чтобы покупатель сгенерировал понравившийся вариант или выбрал один из дизайнов, предложенных «Золотым Яблоком». Большее число попыток может затянуть процесс выбора подарочной карты.

Сначала генерацию изображений тестировали на сайте. После анализа работы функцию генерации добавили в мобильное приложение. Сервис работает следующим образом:

Клиент заходит на страницу покупки электронных подарочных карт и выбирает дизайн от нейросети;

для генерации покупатель вводит свой запрос или выбирает из списка предложенных;

пользователь нажимает кнопку «Сгенерировать», и сервис обращается к API YandexART;

через несколько секунд клиент получает изображение, которое можно использовать для дальнейшего оформления карты, либо пробует сгенерировать новое, — но не более трёх генераций за два часа. Неиспользованные изображения хранятся два часа, а затем удаляются.

На начальном этапе для обращения к YandexART использовали общий пропускной канал. Компания интегрировала технологию в приложение через API Foundation Models. Но стало очевидно, что это не даёт гарантированного времени ответа пользователю — ожидание могло превышать две минуты, и такой результат не соответствовал уровню сервиса «Золотого Яблока». Чтобы сайт работал с привычной для клиентов скоростью, после тестирования настроили выделенный канал передачи данных. Это позволило управлять трафиком и контролировать его объём. Время ответа сервиса сократилось, и теперь не превышает 15 секунд.

Чтобы спрогнозировать, сколько мощностей понадобится для сервиса, настроили мониторинг на базе Grafana. Отслеживали успешные и неудачные генерации, их количество и длительность. Мониторинг позволял отслеживать всплески трафика, строить прогнозы пиков и определять правила, по которым избыточные запросы отправлялись в общий канал YandexART. Благодаря этому можно гарантировать, что пользователь, пусть и с задержкой, но в любом случае получит ответ на запрос.

У YandexART есть внутренние ограничения, отсекающие неприемлемый контент. В дополнение к ним перед началом внедрения нейросети «Золотое Яблоко» провело объёмное тестирование генераций: нужно было убедиться, что изображения не только не нарушают законов, но также эстетически и эмоционально не противоречат тематике красоты, подарка и хорошего настроения.

Сначала тестировщики определяли, какие именно изображения стоит считать неприемлемыми, и составляли своеобразный чёрный список. Для более предсказуемого результата создали собственный набор лексем, который добавляется к промту клиента при генерации. Чтобы отсечь запросы неприемлемого содержания, установили правила фильтрации на русском и английском языках. Если пользователь всё-таки введёт недопустимые данные, генерация не сработает и он получит соответствующее сообщение.

Иногда при генерации возникали ошибки на стороне YandexART: на этапе тестирования команда «Золотого Яблока» обнаружила, что коды ошибок не универсальные и не подходят для того, чтобы показывать их пользователям. Сервис доработали так, чтобы он интерпретировал полученные коды ошибок и выдавал клиентам сообщение о недоступности сервиса или других проблемах с генерацией.