Yandex B2B Tech запустила быстрый метод дообучения нейросетей для бизнеса

Дообучение методом LoRA (Low-Rank Adaptation) позволит компаниям быстро и самостоятельно адаптировать нейросети под специализированные задачи: писать письма в корпоративном стиле или извлекать важные данные из документов.

Для дообучения методом LoRA уже доступны нейросеть YandexGPT и опенсорс-модель LLaMA*. Вскоре это станет возможно и для моделей, которые можно запустить по запросу на выделенных мощностях — например, Qwen и DeepSeek. Таким образом, бизнес сможет использовать в своих решениях несколько дообученных нейросетей, легко переключаться между ними и комбинировать их для разных сценариев.

Использование модели будет не дороже базовых версий нейросетей. Новый метод уже доступен всем клиентам на платформе для разработки ИИ‑решений Yandex Cloud AI Studio.

Дообучение модели позволяет повысить качество решения конкретных задач: после кастомизации нейросети лучше суммаризируют и точнее классифицируют тексты, точнее следуют заданному формату ответа и придерживаются определённой роли в диалоге. Качество ответов по этим задачам даже на облегчённых моделях может быть выше, чем у мощных версий нейросетей. Дообучение особенно полезно, когда требования к ответу трудно сформулировать в коротком и понятном промте.

LoRА работает быстро за счёт того, что изменяет небольшое количество параметров при дообучении модели. Алгоритм ориентируется на эталонные запросы и ответы, заранее заданные пользователем, и приближает результаты работы модели к образцам из датасета. При обработке небольших датасетов весь процесс дообучения с помощью LoRA может занять десять минут.

author
Команда Yandex Cloud

«Алгоритм LoRA уже признан одним из наиболее эффективных способов дообучения, и он широко используется для кастомизации моделей среди ML‑разработчиков, в том числе в Яндексе. Внедрение такого инструмента — ещё один шаг к многообразию и адаптивности решений, которые упрощают решение клиентских задач».

Дообучение моделей особенно актуально для среднего и крупного бизнеса для оптимизации наиболее частотных бизнес‑задач, которые решаются с помощью нейросетей.

В рамках технического тестирования LoRA уже попробовали более 100 клиентов: они использовали её для разработки телеграм‑ботов для ритейла, классификации запросов в поддержку, генерации рекламного контента и других задач. В частности, компания Presentsimple.ai использует для автоматической генерации презентаций по запросу клиента модель YandexGPT 4 Lite, дообученную с помощью LoRA на результатах работы Pro‑версии. По оценке компании, таким образом стоимость генерации презентаций снизилась в шесть раз, а благодаря высокой скорости модели они смогли создавать серии объёмных слайдов для клиентов за 30–40 секунд. Дообученная модель лучше придерживалась заданного технического задания по количеству символов, предложений и стилистике.

author
Григорий Атрепьев
CPO Yandex Cloud

Напишите нам

Начать пользоваться Yandex Cloud

Тарифы

Узнать цены и рассчитать стоимость

Мероприятия

Календарь событий Yandex Cloud
Yandex B2B Tech запустила быстрый метод дообучения нейросетей для бизнеса
Войдите, чтобы сохранить пост