Показательный пример — онкологический центр City of Hope

DevOps в 2024–2025: полное руководство по принципам, практикам и трендам
Рассказываем, как методология DevOps трансформирует разработку и обслуживание программного обеспечения, какие инструменты использовать и с чего начать внедрение.
- DevOps — подход к разработке ПО, который помогает компаниям быстрее и надёжнее выпускать новые функции. Компании инвестируют в DevOps для ускорения выхода на рынок, повышения качества продукта и оптимизации IT-бюджетов.
- Три фундаментальных принципа DevOps, сформулированные Джином Кимом: системное мышление и оптимизация потока, усиление обратных связей, культура непрерывного эксперимента и обучения.
- CAMS-модель (Culture, Automation, Measurement, Sharing) — концепция, помогающая компаниям внедрять DevOps-практики.
- Ключевые практики DevOps: непрерывная интеграция и поставка (CI/CD), инфраструктура как код (IaC), мониторинг и наблюдаемость, управление инцидентами и SRE-подход.
- Этапы внедрения DevOps в компании: анализ текущего состояния, постепенная автоматизация процессов, обучение команд, измерение результатов, изучение опыта других компаний.
- Ограничения DevOps: регуляторные требования в разных индустриях, работа с устаревшими системами, сложности мультиоблачной архитектуры, дефицит квалифицированных специалистов.
DevOps — это подход к разработке программного обеспечения, который помогает компаниям выпускать новые функции быстрее и надёжнее. DevOps уже давно стал де‑факто стандартом индустрии: его применяют и стартапы, и крупные компании.
Растущий спрос на DevOps подтверждают и рыночные оценки, хотя аналитики расходятся в прогнозах. IndustryARC
В статье расскажем об основных принципах и практиках DevOps, этапах внедрения в компании, современных инструментах и трендах на 2024–2025 годы. Рассмотрим кейсы применения и дадим практические рекомендации для технических команд и бизнес‑лидеров.
Сооснователь компании Tripwire, разработчика решений для кибербезопасности, автор книг The Phoenix Project и The DevOps Handbook, один из лидеров движения DevOps и основатель DevOps Enterprise Summit.
Автор DevOps‑литературы и соавтор акронима CAMS.
Эксперт DevOps и автоматизации.
Основные принципы DevOps
DevOps строится на проверенных временем принципах, которые помогают компаниям создавать качественные продукты быстрее и работают вместе, создавая культуру, где технологии служат бизнесу, а не наоборот.
Джин Ким в книге The Phoenix Project
Три принципа DevOps
Системное мышление и оптимизация потока |
Цель — ускорить путь от идеи до прода. Amazon применяет «правило двух пицц» |
Усиление обратных связей |
Чем быстрее получается узнать о проблеме, тем дешевле её исправить. Современная наблюдаемость строится на стандарте OpenTelemetry, который унифицирует сбор метрик, логов и трейсов. Системы вроде Datadog Watchdog используют машинное обучение для автоматического обнаружения аномалий — система сама замечает странное поведение и алертит команду. |
Культура непрерывного эксперимента и обучения |
Практика разбора инцидентов без поиска виноватых создаёт среду, где люди не боятся экспериментировать. Если эксперимент не удался, просто вернитесь назад и попробуйте другой подход. |
CAMS‑модель: четыре столпа DevOps
В 2010 году, после конференции DevOpsDays Mountain View, Джон Уиллис и Дэймон Эдвардс сформулировали простую концепцию
Подробнее о CAMS‑модели
Culture — культура сотрудничества
Культура — это основа всего. Исследование DORA 2024
Хороший пример культуры DevOps — принцип «ты строишь — ты и эксплуатируешь», который активно применяют в Amazon и Netflix. Команды несут полную ответственность за свой сервис: от разработки до поддержки в проде.
Automation — автоматизация рутины
Автоматизация сокращает ручную работу. В 2011 году Amazon разворачивал изменения в проде в среднем каждые 11,6 секунды
Современные команды работают по GitOps. Git выступает единственным источником правды для желаемого состояния приложений и инфраструктуры, описанного кодом. Контроллеры вроде Argo CD и Flux непрерывно сравнивают реальное состояние с описанным и при расхождениях автоматически приводят кластеры к нужной конфигурации. Изменение в Git запускает тот же процесс — инфраструктура обновляется сама.
Measurement — измерение прогресса
Без метрик невозможно понять, движетесь ли вы в правильном направлении. DORA определила четыре ключевые метрики
- частота релизов,
- время от коммита до продакшна,
- процент неудачных изменений,
- время восстановления после сбоев.
Как правило, сильные команды разворачивают код несколько раз в день, доставляют изменения в продакшн менее чем за час, имеют менее 15% неудачных релизов и восстанавливаются после сбоев в течение часа.
Sharing — обмен знаниями
Знания, которые не распространяются, умирают. Spotify создал модель «гильдий»
Microsoft и другие корпорации практикуют InnerSource
Ключевые практики DevOps в действии
DevOps объединяет набор практик, которые помогают командам ускорять выпуск изменений и сохранять надёжность систем. Разберём основные подходы — от непрерывной интеграции до наблюдаемости и SRE.
Непрерывная интеграция и поставка (CI/CD)
Автоматизация сборки, тестирования и развёртывания освобождает разработчиков от рутины и даёт больше времени на создание новых функций, а также влияет на способность компании быстро реагировать на изменения рынка.
По данным исследования DORA 2024
Рассмотрим конкретные подходы и инструменты развёртывания кода, применяемые в индустрии.
Подробнее о непрерывной интеграции и поставке
Непрерывная интеграция
В основе CI/CD — принцип частой интеграции кода в основную ветку с автоматическими проверками. Каждый коммит автоматически проверяется набором тестов. Исследования DORA
GitHub Actions стала естественным выбором для многих команд благодаря глубокой интеграции с экосистемой GitHub. В 2024 году разработчики использовали 10,54 млрд минут
В корпоративных командах используются разные подходы к CI/CD. Jenkins
Непрерывная поставка
Согласно исследованию The State of DevOps Report 2024
Одна из самых надёжных стратегий — Blue‑Green‑развёртывание
Более осторожный подход — «канареечные» релизы
Кстати, канарейки тут неслучайно. В начале XX века шахтёры брали их с собой для обнаружения угарного газа — птицы реагировали на опасность быстрее людей.
Один из гибких инструментов — флаги функций
Инфраструктура как код (IaC)
IaC превращает настройку инфраструктуры из ручного процесса в программируемый и воспроизводимый. Вместо кликов в консоли администраторы описывают серверы, сети и базы данных в текстовых файлах с настройками. Эти файлы хранятся в Git, где можно отслеживать изменения, откатывать ошибки и работать командой — как с обычным кодом приложений.
Terraform использует декларативный подход — человек просто описывает, какая инфраструктура нужна, а инструмент сам вычисляет и выполняет необходимые изменения.
Для настройки существующих серверов подходит Ansible. Он подключается по SSH без агентов — никаких дополнительных программ на серверах не нужно. Конфигурация
Многим разработчикам нравится Pulumi — здесь инфраструктура
Безопасность тоже становится кодом благодаря подходу Policy as Code. Open Policy Agent (OPA) определяет стандарт описания политик безопасности. В Kubernetes® интеграция
Мониторинг и наблюдаемость
Современный мониторинг опирается на три столпа наблюдаемости:
- метрики показывают числовые показатели инфраструктуры — загрузка процессора, память, количество запросов;
- логи фиксируют события и ошибки в хронологическом порядке;
- трассировки отслеживают путь каждого запроса через все компоненты.
Каждый тип данных раскрывает свой аспект работы системы, а вместе они создают полную картину происходящего.
OpenTelemetry (OTel) стандартизирует сбор этих данных
Prometheus® собирает и хранит временные ряды метрик, а Grafana превращает их в интерактивные дашборды с графиками и алертами. Эта связка стала индустриальным стандартом для контейнерных сред в Kubernetes благодаря простоте развёртывания и богатой экосистеме готовых шаблонов. В Yandex Cloud доступен Yandex Managed Service for Prometheus®.
Для логов удобно использовать OpenSearch как хранилище и поисковый движок. На нашей платформе доступен сервис Yandex Managed Service for OpenSearch. Визуализация выполняется в OpenSearch Dashboards. Сбор выполняют агенты — чаще всего Fluent Bit, для которого есть официальный плагин
Распределённые трассировки критичны для микросервисов. На нашей платформе их можно развернуть на базе Jaeger, в том числе с хранением данных в Yandex Managed Service for YDB и интеграцией с кластерами Yandex Managed Service for Kubernetes®. Метрики и дашборды закрываются Yandex Managed Service for Prometheus® и Yandex Monitoring, которые совместимы с экосистемой Prometheus и PromQL
Управление инцидентами и SRE‑подход
Site Reliability Engineering (SRE) применяет инженерные практики для обеспечения надёжности систем. Традиционные подходы полагаются на общие формулировки о стабильности работы, но SRE работает с конкретными метриками и чёткими границами допустимых ошибок.
В основе методологии лежат три взаимосвязанных концепции
-
SLI (Service Level Indicator) — измеримый показатель качества сервиса, например процент успешных HTTP‑запросов за период.
-
SLO (Service Level Objective) задаёт целевой уровень этого показателя — например, 99,9% успешных запросов.
-
Разница между 100% и SLO образует error budget — допустимое количество ошибок. Когда «бюджет ошибок» исчерпан, команда приостанавливает выпуск новых функций и концентрируется на стабилизации системы.
Важную роль в повышении надёжности играет разбор инцидентов
Этапы внедрения DevOps в компании
DevOps‑трансформация — это путь от изолированных команд к единой системе разработки и доставки продукта. Каждая компания проходит этот путь по‑своему, но есть проверенные этапы, которые помогают избежать типичных ошибок.
Анализировать текущее состояние
Первый шаг — понять, где находится компания сейчас. Value Stream Mapping — карта потока создания ценности — помогает увидеть весь путь от идеи до работающего продукта. Этот метод показывает, сколько времени занимает каждый этап и где возникают задержки.
Ключевые точки анализа — это соотношение полезной работы к ожиданию, время от написания кода до выхода в прод и количество этапов передачи между командами. Современные инструменты с использованием ИИ помогают находить узкие места автоматически — система предсказывает проблемы до того, как они возникнут.
Автоматизировать шаг за шагом
После анализа начинается постепенная автоматизация процессов. Типичный план выглядит так: первые 3–6 месяцев — настройка CI/CD для некритичных приложений, следующие полгода — автоматизация развёртывания для всех продуктов, через год — внедрение IaC, к концу второго года — полный цикл автоматизации с мониторингом.
Инвестировать в обучение команд
Технологии без людей не работают. Успешные компании начинают с обучения — например, практических воркшопов с реальными инструментами. Важная часть культуры DevOps — парное программирование и регулярные код‑ревью. Команды, которые выделяют время на совместную проверку кода, быстрее находят ошибки и лучше понимают общую архитектуру системы. Это не просто практика — это способ передачи знаний внутри команды.
У нас есть трек «DevOps‑инженер», который объединяет курсы по основным DevOps‑инструментам и сценариям в Yandex Cloud.
19% всех организаций.
Интеграция безопасности в DevOps.
Проверка безопасности на ранних этапах.
Измерять результаты правильно
DORA‑метрики стали стандартом индустрии для оценки эффективности DevOps. По данным 2024 года, как мы уже писали выше, самые сильные команды развёртывают код по требованию и восстанавливаются после сбоев менее чем за час. Высокоэффективные команды выкатывают обновления от раза в день до раза в неделю и устраняют проблемы в течение суток.
Платформенная инженерия добавляет новые метрики к классическим. Команды с выделенными платформенными инженерами повышают продуктивность на 8–10%
Учиться на чужих ошибках
Самая распространённая ошибка — покупка инструментов без изменения процессов, тратить миллионы на DevOps‑платформы, но продолжать работать по старым схемам. Результат предсказуем — деньги потрачены, а скорость разработки не изменилась.
Безопасность часто остаётся в стороне от DevOps‑процессов. Компании с полноценным DevSecOps быстрее устраняют уязвимости. Внедрение практик Shift‑left и Policy as Code должно начинаться с первого дня трансформации. Индустриальные исследования
Поддержка руководства определяет успех трансформации. По данным Gartner, 75% DevOps‑инициатив
Постепенное вытеснение старого функционала новым.
Ограничения DevOps
Внедрение DevOps — это поиск баланса между желаемой скоростью изменений и реальностью конкретной компании. Каждая индустрия привносит свои особенности, а техническое наследие добавляет сложности. Разберём основные препятствия и способы их преодолеть.
Регулируемые индустрии
В российском финансовом секторе скорость разработки упирается в требования Банка России. Положение ЦБ РФ № 821‑П
В здравоохранении Росздравнадзор регулирует медицинские изделия с программным обеспечением по новым правилам, вступившим в силу с 1 марта 2025 года (постановление Правительства РФ № 1684
Российские компании адаптируются к регуляторным ограничениям через автоматизацию процессов соответствия. По данным исследования State of DevOps Russia 2024
Вместо западного подхода Policy as Code российские организации используют автоматизированный контроль через стандарт ГОСТ 57580
Работа с устаревшими системами
Компании продолжают использовать системы, написанные десятилетия назад. 88% организаций признают, что легаси‑технологии
Полная замена старых систем — рискованный и дорогой путь. Вместо этого команды применяют паттерн Strangler Fig, строят API Gateway для современного доступа к старым сервисам и контейнеризируют легаси‑приложения для упрощения их переноса в облако. Такой подход позволяет модернизировать инфраструктуру по частям, сохраняя работоспособность бизнеса.
Сложности мультиоблачной архитектуры
Компании могут используют больше одного облачного провайдера, у каждого из которых свои инструменты CI/CD, требования безопасности и модели оплаты. Управлять такой разнородной средой — настоящий вызов для DevOps‑команд.
Выход — в использовании универсальных инструментов. Terraform работает с любыми облаками, Kubernetes обеспечивает единообразный деплой везде, а централизованный мониторинг собирает метрики со всех платформ в едином месте. Это позволяет команде не изучать десятки инструментов, а работать с привычным стеком.
Дефицит квалифицированных специалистов
Найти хорошего DevOps‑инженера сложно: 31% руководителей DevOps‑команд
Компании решают проблему кадров через внутреннее обучение. Разработчики изучают инфраструктуру, системные администраторы осваивают автоматизацию, создаются менторские программы и практикуется ротация между командами. Это дешевле найма готовых специалистов и помогает сохранить знания о продукте внутри компании.
Виртуальную частную сеть.
Современный протокол взаимодействия.
DevOps и Yandex Cloud: как наша платформа помогает трансформации бизнес‑процессов
Облачные сервисы изначально проектировались с учётом DevOps‑подходов. Автоматизация, масштабирование, управление через API — всё это заложено в основу современных облачных платформ.
На нашей платформе есть сервисы для всего цикла разработки и эксплуатации:
-
Yandex Managed Service for Kubernetes® управляет контрольной плоскостью кластера: настраиваются параметры мастера, тип и уровень отказоустойчивости. Узлы объединяются в группы и масштабируются.
-
Yandex Container Registry хранит Docker®‑образы.
-
Для IaC поддержан Terraform для всех ключевых сервисов: можно описать VPC, группы безопасности, сервисные аккаунты и единым конфигом развернуть инфраструктуру.
-
Состояние Terraform хранится в Yandex Object Storage.
-
Блокировки включаются через Yandex Managed Service for YDB — так несколько инженеров безопасно меняют одни и те же окружения.
-
CLI Yandex Cloud даёт полный контроль через интерфейс командной строки и возвращает результаты в JSON для автоматизации. Python SDK с поддержкой gRPC и автоматическими повторами при сбоях упрощает написание скриптов автоматизации.
Кейсы применения DevOps
Практический опыт российских компаний показывает реальные результаты DevOps‑трансформации.
Тренды DevOps
В 2025 году фокус смещается с базовой автоматизации на интеллектуальное управление инфраструктурой. Разберём пять ключевых направлений, которые определяют развитие отрасли.
Тренд |
В чём заключается |
Ключевые метрики и преимущества |
Применение |
GitOps |
Использует Git‑репозиторий как единственный источник истины для конфигурации инфраструктуры. Изменения проходят через код‑ревью, развёртывание происходит автоматически после мержа в главную ветку. |
|
Стандарт управления инфраструктурой через Git |
AIOps |
Анализирует метрики, логи и события, выявляя реальные проблемы среди тысяч алертов. |
|
Автоматизация решения инцидентов |
Serverless |
Автоматически масштабирует функции под нагрузку, оплата только за время выполнения. |
|
Обработка событий, API‑endpoints, периодические задачи |
FinOps |
Объединяет инженеров, финансистов и менеджеров для оптимизации затрат. |
|
Контроль и оптимизация облачных расходов |
Platform Engineering |
Создаёт внутренние платформы разработчиков (IDP) для управления микросервисами и координации команд. |
|
Управление микросервисной архитектурой и координация команд |