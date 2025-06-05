Связаться с намиПодключиться

Yandex Data Processing

Сервис для обработки многотерабайтных массивов данных с использованием инструментов с открытым исходным кодом, таких как Apache Spark, Apache Hadoop®, Apache HBase®, Apache Zeppelin и других сервисов экосистемы Apache®.

Простота использования

Выберите размер кластера, мощность узлов и набор сервисов, а Yandex Data Processing автоматически создаст и настроит кластеры Spark, Hadoop и другие компоненты. Для совместной работы есть возможность использовать Zeppelin notebooks и другие WEB-приложения через UI Proxy.

Низкая стоимость

Вы можете запустить кластер Yandex Data Processing всего за 18 рублей в час. Кроме того, можно экономить до 70% от стоимости виртуальных машин, выбирая прерываемые виртуальные машины.

Полный контроль над кластером

Вы полностью контролируете кластер с root-пользователем для каждой виртуальной машины. Устанавливайте собственные приложения и библиотеки на работающих кластерах без необходимости их перезагружать.

АвтомасштабированиеPreview

Yandex Data Processing использует группы виртуальных машин Instance Groups, чтобы автоматически наращивать или уменьшать вычислительные ресурсы compute-подкластеров на основе показателей загруженности процессоров.

Автоматизация задач

Сэкономьте время на построении ETL-пайплайнов и пайплайнов для обучения и разработки моделей, а также для описания других итерационных задач. В Apache Airflow уже встроен оператор Yandex Data Processing.

Решайте свои задачи с Yandex Data Processing

Мы берём на себя большую часть работы по обслуживанию кластеров

Самостоятельный контроль

Контроль на стороне Yandex Cloud

С чего начать

Выберите необходимые вычислительные мощности, сервисы Apache® и создайте готовый к работе кластер Yandex Data Processing.

Научим работать с сервисом

На курсе «Инженер облачных сервисов» вы научитесь создавать отказоустойчивые облачные системы, работать с управляемыми базами данных и контейнерами, изучите основы бессерверных технологий и подходы к созданию защищённой от внешних атак облачной инфраструктуры.

Мероприятия и вебинары 

Вопросы и ответы

Spark, HDFS, YARN, HBase®, Oozie, Sqoop, Flume, Tez®, Zeppelin.

Новости 

Начните пользоваться Yandex Data Processing

Тарифы

Apache, Apache Hadoop, Apache Spark и Apache Oozie являются зарегистрированными товарными знаками или товарными знаками Apache Software Foundation в США и/или других странах.