О чём эта история
Яндекс Маркет — сервис для покупок, на котором продаётся более 108 миллионов товаров. Пользователи Маркета просматривают и покупают товары в разных категориях, делают обзоры на товары, оставляют отзывы, взаимодействуют с продавцами и производителями, сравнивают цены и характеристики товаров.
Чтобы помочь продавцам создавать привлекательные и информативные карточки товаров, Маркет дал им возможность создавать описание для своих товаров с помощью YandexGPT и улучшать качество изображений товаров с помощью картиночной нейросети YandexART. YandexGPT — генеративная языковая модель, которая создаёт тексты на русском языке. Продавцы используют 52% описаний, созданных нейросетью. Количество продаж увеличилось на 1,1% без дополнительных затрат со стороны продавцов.
Задача компании
Яндекс Маркет — маркетплейс, на котором активно торгуют 125 тысяч продавцов. Маркет обрабатывает заказы, общается с клиентом за продавца, хранит и доставляет товары. Продавцов привлекает удобная логистика и надёжность Яндекс Маркета как партнёра, удобство личного кабинета, хорошая рекомендательная система и удобный поиск по каталогу.
Сервису нужны функции, которые будут отличать его от конкурентов и привлекать продавцов и покупателей. Преимущества должны быть реализованы с использованием технологий и возможностей Яндекса. Сравнивая активность пользователей по покупке товаров с описанием и без него, компания пришла к выводу, что товары с подробным описанием пользуются большей популярностью. Создание карточки товара, включающей описание и фотосессию для товара, может стоить продавцам несколько тысяч рублей. Поэтому нужно было помочь продавцам создавать описание быстро и бесплатно.
Яндекс Маркет решил использовать возможности YandexGPT и YandexART, чтобы создавать с их помощью продающее описание из уже имеющихся характеристик, таких как марка, тип товара, габариты, предназначение, и улучшать качество изображений товаров, делать для них с помощью аутпейнтинга нужный фон. Промт для языковой модели должен быть составлен таким образом, чтобы получался приемлемый результат, а также не давать модели придумывать несуществующие характеристики.
Маркет оценил качество сгенерированных изображений и описаний, которые использовали в карточках товаров крупные мировые игроки, такие как Amazon, и пришёл к выводу, что нейросети Яндекса могут давать более качественные картинки и текст даже без дополнительного обучения и тюна.
Нейросети для продающего текста и красивой картинки
Для создания текстов Яндекс Маркет использует API YandexGPT. В личном кабинете продавец заполняет данные о товаре, нажимает кнопку «Создать с YaGPT», получает продающий текст, раскрывающий преимущества товара, сохраняет его в качестве описания к товару и публикует товар в магазине. Продавцу не нужно копировать данные, заполнять поля или открывать дополнительные вкладки. Можно использовать сервис для уже существующих карточек товаров, чем больше характеристик в карточке — тем подробнее и точнее будет описание, которое напишет YandexGPT. Дополнительно используя функцию «Создать фон с YandexART», продавцы добавляют для некоторых видов товаров интерьерные фоны.
На первом этапе тексты для описаний генерировали с помощью YandexGPT и других языковых моделей без дополнительного дообучения, затем асессоры размечали, есть ли в сгенерированном тексте критичные ошибки и насколько он соответствует исходным данным о товаре. При написании текстов модели иногда «фантазировали», наделяя товары свойствами, которых у них не было. Нейросети допускали ошибки в 33–35 текстах из 100, для недообученной модели, не настроенной под конкретную задачу, это был хороший результат, но ошибки в текстах могли быть критическими и ввести в заблуждение покупателей. Поэтому на данном этапе каждое описание дополнительно верифицировали сами продавцы и ошибки удавалось устранять.
Для быстрого старта сначала продавцы генерировали с помощью YandexGPT по одному тексту за раз. Затем для массовой генерации разработали сервис, который управляет нагрузкой, создаёт очередь из запросов, передаёт запросы в модель постепенно. Сейчас единовременно продавец может делать запросы на описание для ста товаров — ограничение позволяет не перегружать серверы и обеспечивать быстрые ответы нейросети. Все описания перед публикацией можно просмотреть, отредактировать и сохранить для публикации или отказаться от полученного текста. Кроме того, что описания просматривает сам продавец, все они перед публикацией проходят модерацию Яндекс Маркета.
По результатам первого этапа, модель дообучили с помощью команды асессоров. Они в течение 3 месяцев вручную оценивали качество ответов нескольких нейросетей, выбирали самый качественный ответ, редактировали его, отмечали как эталонный и отдавали модели YandexGPT, которая в дальнейшем должна была генерировать тексты для описаний. Если ни одно из описаний конкретного товара не было корректным, его редактировал человек. После исправления 25 тысяч ответов и дообучения модель значительно улучшила качество описаний. На этом этапе у модели появилась дополнительная задача — создавать заголовок к описанию. Модель должна отмечать в заголовке ключевые и уникальные особенности товара. Сейчас команда улучшает эту функцию.
Промт для нейросети содержит около ста слов, запрещает модели фантазировать, учитывает особенности чтения — нейросеть считывает указания с конца, но более важным считает то, что прочитала последним. То есть токены в промте должны быть указаны по убыванию значимости — от наиболее важной информации в начале к наименее важной в конце. Сейчас из 100 текстов 88 будут сгенерированы без ошибок, и Яндекс Маркет стремится повысить этот показатель до 97. Это позволит продавцам делать более массовые запросы на генерацию и тратить минимум времени на оценку качества полученного текста. Количество используемых описаний вырастет.
Маркету нужно было как можно быстрее получить отзывы о новой функции от продавцов, поэтому от первых тестовых запросов до запуска в работу у пользователей прошла всего неделя. На первом этапе Маркет не добивался идеального качества текстов из‑за того, что продавцам дали возможность их редактировать. Сейчас дообучение модели продолжается и качество текстов растёт.
Результаты
За полгода работы новой функциональности продавцы сгенерировали более двух миллионов описаний, то есть 300 тысяч описаний в месяц и около десяти тысяч описаний в день. Основной пик запросов наступает днём и составляет 1–1,2 тысячи запросов в час, в утренние и ночные часы снижается до двухсот. Продавцы используют 52% сгенерированных описаний, которые дают им прирост к заказам в 1,1%. Сгенерированные с помощью YandexGPT и YandexART описания и фоны позволяют быстро и без дополнительных затрат создавать продающие карточки товаров.
В планах компании — создание всей карточки товара из небольшого описания, наименования и производителя, которые дал продавец. Команда Маркета планирует дообучить YandexGPT, чтобы извлекать нужные характеристики из описания, заполнять характеристики, создавать маркетинговый текст. Например, продавец указывает, что его товар — клетчатые рубашки из смеси льна и хлопка, и нейросеть извлечёт из этого верные параметры: принт — клетка, материал — лён, хлопок.
Мнение
Создание продающего, грамотного и правдоподобного описания товаров — простой способ для продавцов зайти на маркетплейс. Копирайтеру‑человеку нужно несколько часов для написания карточек для ста товаров, текстовое описание одного товара может стоить около 300 рублей, фотосессия обойдётся ещё в 3–5 тысяч. YandexGPT создаёт описание бесплатно за несколько секунд, давая продавцам возможность сконцентрироваться на более важных задачах.
* Изображение для обложки кейса создано с помощью YandexART.