MLflow
Обновлено 5 мая 2025 г.
MLflow — это платформа для управления жизненным циклом машинного обучения. Она включает в себя инструменты для:
- отслеживания экспериментов;
- совместного использования и развертывания моделей;
- упаковки кода в воспроизводимые прогоны.
MLflow имеет встроенную интеграцию со многими популярными библиотеками ML (TensorFlow, PyTorch, XGBoost и т. д.), но может работать с любой библиотекой, алгоритмом или инструментом развертывания.
Компоненты MLflow:
- MLflow Tracking — API для регистрации параметров, версий кода, метрик, зависимостей среды моделирования и артефактов модели при запуске кода машинного обучения.
- MLflow Models — формат упаковки моделей и набор инструментов, которые позволяют легко развернуть обученную модель для пакетного ввода или вывода в реальном времени.
- Реестр моделей MLflow — централизованное хранилище моделей, набор API и пользовательский интерфейс, предназначенные для утверждения, обеспечения качества и развертывания модели MLflow.
- MLflow Projects — стандартный формат для упаковки многоразового кода Data Science, который можно запускать с различными параметрами для обучения моделей, визуализации данных или выполнения любой другой задачи Data Science.
- Рецепты MLflow — предопределенные шаблоны для разработки высококачественных моделей для множества распространенных задач, включая классификацию и регрессию.
- Получите пару SSH-ключей для подключения к виртуальной машине (ВМ).
- Создайте ВМ из публичного образа. В блоке Выбор образа/загрузочного диска перейдите на вкладку Marketplace и выберите MLflow. В блоке Доступ:
- в поле Логин введите имя пользователя;
- в поле SSH-ключ вставьте содержимое файла с открытым SSH-ключом.
- Подключитесь к ВМ по SSH. Для этого используйте логин, который вы задали при создании ВМ, и закрытый SSH-ключ, созданный ранее.
- Откройте файл
/root/default_passwords.txt
и скопируйте учетные данные для аутентификации. - Перейдите в браузере на страницу
http://<публичный_IP-адрес_ВМ>/
и аутентифицируйтесь, используя полученные ранее логин и пароль.
- Запись параметров и метрик экспериментов, сравнение результатов и изучение пространства решений. Сохранение выходных данных в виде моделей.
- Сравнение производительности различных моделей и выбор наилучшей для развертывания. Регистрация моделей и отслеживание производительности их производственных версий.
- Развертывание моделей ML в различных обслуживающих средах.
- Хранение, аннотирование, обнаружение моделей и управление ими в центральном репозитории.
- Упаковка кода Data Science в форматах, позволяющих запускать его с различными параметрами на любой платформе и делиться им с другими.
Служба технической поддержки Yandex Cloud отвечает на запросы 24 часа в сутки, 7 дней в неделю. Доступные виды запросов и срок их обработки зависят от тарифного плана. Подключить платную поддержку можно в консоли управления. Подробнее о порядке оказания технической поддержки.
Используя данный продукт, вы соглашаетесь с Условиями использования Yandex Cloud Marketplace