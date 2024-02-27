Архитектура Циан перед переездом в Yandex Cloud включала в себя 500 микросервисов и 2 монолитных приложения. Один из монолитов был размещён в контейнерах, второй развёрнут с помощью Windows IIS. Технологический стек компании включает Python, C#, Node.js. Работа с данными велась в PostgreSQL, MSSQL, Cassandra, Elasticsearch; приём и отправка сообщений — в RabbitMQ и Kafka.

Подготовительный этап миграции в Yandex Cloud занял 4 месяца. Из них 2 месяца ушло на проверку осуществимости миграции. На этом этапе, например, пришлось изменить конфигурацию сети. Работа в Yandex Cloud отличалась от работы с предыдущим поставщиком, поэтому Terraform и Salt разворачивали в течение месяца. И ещё месяц работали над возникшими с ними проблемами. Параллельно с этим делали утилиту для миграции микросервисов.

В минимальном объёме нужные компоненты развернули в то время, когда Yandex Cloud служил инструментом для аварийного восстановления. Перед основным переездом тестировали компоненты.

За полтора месяца миграции микросервисы и один монолит перенесли в Yandex Managed Service for Kubernetes®, а монолит на Windows IIS — на виртуальные машины Compute Cloud. Для хранения данных используют объектное хранилище Object Storage, для гибкой работы с документоориентированными моделями данных — Managed Service for MongoDB, для эксплуатации и администрирования реляционных баз данных — Managed Service for PostgreSQL и Managed Service for MySQL®.

В процессе переноса команда столкнулась с проблемой. Максимально кластер Kubernetes можно разделить на 128 нод, а Циан было необходимо 250 нод. Для решения этой проблемы развернули несколько кластеров на Vanilla Kubernetes. А чтобы приложения могли продолжать обращаться друг к другу по имени, сделали синхронизатор эндпоинтов. При развёртывании микросервиса в одном кластере и создании его виртуальной копии в другом синхронизатор точно фиксирует изменения в микросервисах.

Были и другие сложности, но все их удалось решить. Например, иногда отсоединялись сетевые диски и исчезало сетевое подключение. Для решения обновили драйвера и сменили процессоры на семейство Ice Lake (платформа v3). Циан также решил использовать нереплицируемые SSD для работы MSSQL, потому что в данном случае критична скорость работы железа.

Процесс непрерывной интеграции и развёртывания был развит у Циан ещё до миграции, и благодаря тому, что Yandex Cloud уже использовали как инструмент аварийного восстановления, изменения пришлось внести небольшие — сделали генерацию манифестов для Kubernetes.