Обработка данных на Apache Airflow в Yandex Cloud

Для анализа данных в облаке не достаточно СУБД и средств визуализации — нужен ещё и понятный инструмент, который автоматизирует сбор, подготовку и обработку данных. На вебинаре мы рассказали о таком сервисе — Apache Airflow.
21 июля 2022 г., 12:00
Есть запись

О мероприятии

Для анализа данных в облаке не достаточно СУБД и средств визуализации — нужен ещё и понятный инструмент, который автоматизирует сбор, подготовку и обработку данных. На вебинаре мы расскали о таком сервисе — Apache Airflow.

Эксперты Yandex Cloud обсудили:

  • как спроектировать инфраструктуру для Apache Airflow;
  • как собирать данные в облако для анализа и визуализации на основе Python и Spark;
  • как автоматизировать обогащение данных и подготовку витрин в аналитическом хранилище на основе PostgreSQL, Greenplum и Clickhouse;
  • как обеспечивать отказоустойчивость и непрерывность конвейеров данных.

Вебинар был интересен и тем, кто только собирается попробовать аналитику данных в облаке, и тем, кто строит такую платформу или хочет масштабировать уже работающую среду. CDO и CTO смогли разобраться, чем инструмент будет полезен бизнесу, а дата-инженеры — получили практические рекомендации для его использования.

Спикеры

  • Иван Веткасов
    Иван ВеткасовАрхитектор облачных решений, Yandex Cloud, Yandex Cloud
  • Иван Кровяков
    Иван КровяковРазвивает бизнес платформы данных в Yandex Cloud. Профессионально занимается облаками десять лет, с 2017 года — платформами хранения и обработки данных., Yandex Cloud