Yandex Data Processing
Сервис для обработки многотерабайтных массивов данных с использованием инструментов с открытым исходным кодом, таких как Apache Spark™, Apache Hadoop®, Apache HBase®, Apache Zeppelin™ и других сервисов экосистемы Apache®.
Простота использования
Выберите размер кластера, мощность узлов и набор сервисов, а Yandex Data Processing автоматически создаст и настроит кластеры Spark, Hadoop и другие компоненты. Для совместной работы есть возможность использовать Zeppelin notebooks и другие WEB-приложения через UI Proxy.
Низкая стоимость
Вы можете запустить кластер Yandex Data Processing всего за 18 рублей в час. Кроме того, можно экономить до 70% от стоимости виртуальных машин, выбирая прерываемые виртуальные машины.
Полный контроль над кластером
Вы полностью контролируете кластер с root-пользователем для каждой виртуальной машины. Устанавливайте собственные приложения и библиотеки на работающих кластерах без необходимости их перезагружать.
АвтомасштабированиеPreview
Yandex Data Processing использует группы виртуальных машин Instance Groups, чтобы автоматически наращивать или уменьшать вычислительные ресурсы compute-подкластеров на основе показателей загруженности процессоров.
Автоматизация задач
Сэкономьте время на построении ETL-пайплайнов и пайплайнов для обучения и разработки моделей, а также для описания других итерационных задач. В Apache Airflow уже встроен оператор Yandex Data Processing.
Мы берём на себя большую часть работы по обслуживанию кластеров
Самостоятельный контроль
Контроль на стороне Yandex Cloud
С чего начать
С чего начать
Выберите необходимые вычислительные мощности, сервисы Apache® и создайте готовый к работе кластер Yandex Data Processing.
Научим работать с сервисом
На курсе «Инженер облачных сервисов» вы научитесь создавать отказоустойчивые облачные системы, работать с управляемыми базами данных и контейнерами, изучите основы бессерверных технологий и подходы к созданию защищённой от внешних атак облачной инфраструктуры.
Вопросы и ответы
Spark™, HDFS, YARN™, HBase®, Oozie™, Sqoop™, Flume™, Tez®, Zeppelin™.
Начните пользоваться Yandex Data Processing
Полезные ссылки
Apache, Apache Hadoop, Apache Spark и Apache Oozie являются зарегистрированными товарными знаками или товарными знаками Apache Software Foundation в США и/или других странах.