Открыли доступ к визуальным нейросетям для анализа изображений

Yandex B2B Tech открыл доступ к опенсорсным визуально‑генеративным моделям (VLM): Deepseek VL2 Tiny, Qwen2.5 VL, Gemma3 27B и другим. С их помощью компании смогут составлять описания товаров по фото и быстро находить информацию в документах.

Новые модели доступны в Yandex Cloud AI Studio для пакетной обработки большого количества изображений: за один раз в нейросети можно отправить сразу множество запросов.

Всего в пакетном режиме доступны около 20 больших языковых (LLM) и VLM‑моделей. Он понадобится бизнесу для анализа и классификации документов или коммуникации с клиентами. Например, банки и ритейлеры смогут использовать нейросети для ежедневного анализа комментариев или запросов в службу поддержки. Компании могут планировать задачи по расписанию, по мере накопления данных или для объёмных разовых задач.

Полноэкранное изображение

Модели можно использовать для классификации товаров по категориям.

Полноэкранное изображение

Модели способны проанализировать изображения и составить описания для каждого товара.

Полноэкранное изображение

Модели успешно справляются с поиском и определением дефектов по фотографиям.

Полноэкранное изображение

Модели можно использовать для поиска идей по улучшению дизайна и функциональности интерьера.

Тарификация LLM- и VLM‑моделей при больших объёмах данных начинается от 200 тыс. токенов (примерно 200 изображений или 360 страниц текста). Такое использование моделей обойдётся вдвое дешевле, чем в стандартном режиме, а результат можно получить в течение дня.

author
Команда Yandex Cloud

«Каждую неделю мы видим запуск новых ML‑моделей, при этом каждая из них может лучше справляться с теми или иными нишевыми задачами. Поэтому бизнесу важно иметь доступ к большому разнообразию моделей и возможность протестировать их в своих сценариях. Поэтому мы предоставляем клиентам платформу для разработки ML‑сервисов с возможностью широкого выбора моделей, чтобы каждый мог подобрать оптимальную нейросеть, дообучить под свои задачи и запустить с минимальным написанием кода».

Среди уже доступных моделей — Qwen2.5 и Llama 3.3, рассуждающие нейросети QwQ и DeepSeek R1. По мере появления новых опенсорс‑моделей они почти сразу будут развёрнуты на платформе Yandex Cloud AI Studio. Вскоре клиентам также будет доступна VLM‑модель Яндекса, которая уже используется в Алисе, Нейроэксперте, Поиске и других сервисах компании. Если клиенту нужно использовать модель для разовых запросов, он может развернуть нужную нейросеть на облачной платформе на выделенных ресурсах.

author
Артур Самигуллин
Руководитель продуктового ML‑направления Yandex Cloud

Напишите нам

Начать пользоваться Yandex Cloud

Тарифы

Узнать цены и рассчитать стоимость

Мероприятия

Календарь событий Yandex Cloud
Открыли доступ к визуальным нейросетям для анализа изображений
Войдите, чтобы сохранить пост