Yandex Managed Service for Apache Airflow

  • Бесплатный доступ*
  • 3 темы с теорией и практикой
  • Материал рассчитан на 14 часов
  • Свидетельство об окончании

Обновлено в октябре 2025 года.

Чему вы научитесь

Работать с облачным сервисом Yandex Managed Service for Apache Airflow

Автоматизировать загрузку и обработку данных с помощью Managed Service for Apache Airflow

Писать и загружать DAG-файлы для оркестрации процессов и управления зависимостями

Использовать сервис: от развёртывания кластера до управления доступами

Интегрировать Yandex Managed Service for Apache Airflow с другими сервисами Yandex Cloud

Yandex Managed Service for Apache Airflow

Сервис помогает разворачивать, администрировать и поддерживать кластеры Apache Airflow в инфраструктуре Yandex Cloud.

Apache Airflow — платформа для разработки, запуска и мониторинга рабочих процессов, ориентированных на пакетную обработку данных. Она является мощным инструментом для автоматизации задач благодаря:

  • поддержке множества источников данных и плагинов,
  • масштабируемости,
  • функциям мониторинга и журналирования.

Кому будет полезно

  • IT-командам
    Научитесь правильно разворачивать и настраивать Airflow.

  • DevOps-инженерам
    Узнаете об инфраструктурных возможностях облачной платформы для развёртывания технологий Airflow.

  • Архитекторам
    Изучите возможности и ограничения Airflow с точки зрения функциональности системы и архитектуры.

  • Дата-инженерам
    Освоите DAG для управления потоками данных.

Программа

Темы можно проходить в произвольном порядке

1. Что такое Airflow и какие задачи он решает

  • Познакомитесь с общей архитектурой Airflow и узнаете, какие задачи он решает.
  • Поймёте, как устроены компоненты и ролевая модель, как организовано взаимодействие с сервисом.
  • Рассмотрите основные сценарии использования платформы.

2. Знание объектов Airflow

  • Разберётесь в ключевых объектах Airflow (DAGs, Providers, Operators, XCom, Connection, Variable) и узнаете, какую задачу они выполняют.

3. DAG как основной компонент Airflow. Тонкости работы

  • Изучите структуру DAG (subdag, task group).
  • Поймёте, как задаётся порядок выполнения задач (приоритет, веса).
  • Изучите ресурсную модель DAG и операторов, приёмы работы с ними.
  • Разберётесь в статусной модели DAG: узнаете статусы объектов и принцип их смены.
  • Узнаете различия между синхронными и асинхронными операторами, их возможности и принципы работы.

4. Что такое Yandex Managed Service for Apache Airflow

  • Узнаете, как устроен Yandex Managed Service for Apache Airflow, включая автомасштабирование, логи и архитектурные особенности.
  • Поймёте, как происходит тарификация сервиса.

5. Практика. Начало работы в Yandex Managed Service for Apache Airflow

  • Научитесь создавать кластеры, подключаться к консоли, просматривать статусы заданий и анализировать логи.

Разработано совместно с АЭРО

Провайдер e-com- и дата-решений АЭРО строит надёжную дата-инфраструктуру и помогает бизнесу зарабатывать на данных.

Авторы

Что вас ждёт

Понятная теория на интерактивной платформе

Программу составили эксперты Yandex Cloud с большим опытом работы в IT. Вы изучите теорию на наглядных примерах и выполните интерактивные задания на платформе.

Практические работы с сервисами Yandex Cloud

Пробуйте силы на реальных кейсах.

Поддержка на всех этапах

Задавайте вопросы в телеграм-чате, обменивайтесь опытом и получайте рекомендации от экспертов Yandex Cloud.

Доступ в любое время

Подходит для самостоятельного обучения — узнавайте новое в комфортном для вас темпе, когда и где угодно. А доступ к материалам останется у вас навсегда.

Вам потребуются

Базовые знания в Python и опыт работы в терминале

Базовые знания в SQL

Частые вопросы

Все материалы курса доступны бесплатно.

Практическая часть курса предполагает использование облачных ресурсов, которые вы оплачиваете самостоятельно. Курс разработан таким образом, чтобы расходы были минимальными. Часть из них покроет стартовый грант.

Чтобы избежать лишних трат, следуйте нескольким советам:

  • Останавливайте виртуальные машины в перерывах между выполнением практических работ. Вы не снизите потребление до нуля, но сократите расходы.
  • Контролируйте расходы с помощью бюджета и уведомлений, которые можно настроить в разделе Биллинг. Как это сделать, рассказывается в документации.
  • Не забудьте удалить ресурсы после завершения курса.

Начните прямо сейчас

Автоматизируйте процессы работы с данными в Yandex Managed Service for Apache Airflow.

Может быть интересно

* Теоретическая часть бесплатная. Для практики новым пользователям Yandex Cloud предоставляется стартовый грант, после его исчерпания возможны дополнительные расходы.

Apache® и Apache Airflow являются зарегистрированными товарными знаками или товарными знаками Apache Software Foundation в США и/или других странах.

ClickHouse является зарегистрированным товарным знаком ClickHouse, Inc.