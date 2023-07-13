Миграцию разделили на три основных этапа:

Запись в новую базу YDB с параллельным использованием PostgreSQL. Непосредственно миграция данных. Отказ от чтения из PostgreSQL.

Команда Игр решила перенести сначала информацию авторизованных пользователей. На первом этапе команда Игр написала обёртку для Go SDK, которая была похожа на текущий интерфейс клиента PostgreSQL и занималась записью в новую базу в YDB. Команда выбрала вычислительные ресурсы со следующими характеристиками:

vCPU с 10 ядрами.

50 ГБ оперативной памяти.

3 зоны доступности.

При создании таблицы прогресса авторизованных пользователей в YDB использовали стандартные настройки шардирования по размеру — 2048 МБ. При сегментировании может возникнуть проблема неравномерного распределения шардов, если первичный ключ инкрементируемый. В данном случае проблемы удалось избежать, так как использующийся в качестве первичного ключа идентификатор пользователя составной и имеет большой разброс значений. Чтение осуществлялось в определённом порядке: если в YDB данных не нашлось, то запрос отправлялся в PostgreSQL. Если там данные находились, то они дозаписывались в YDB и возвращались в ответе пользователю. Идентично работал и процесс записи. Такая схема работы ожидаемо привела к небольшой деградации скорости ответов из‑за обращений к резервному PostgreSQL, но в продакшне этот переходный вариант работал не дольше недели, а затем переход в YDB завершился полностью.

На втором этапе команда Игр переносила все оставшиеся данные из старой базы. Сделали дамп таблицы, разместили его на виртуальной машине и с помощью Python‑скрипта в несколько потоков начали запись данных в YDB. Таким образом команда перенесла 15 ГБ данных в YDB, при этом база продолжала работать под нагрузкой.

На последнем этапе изменили схему чтения, отключив запросы на чтение к старой базе PostgreSQL.

Первым эффектом миграции стало уменьшение времени запроса на запись на 35%, а на чтение — почти на 50% в режиме 80p. Команда Игр оценила этот результат и решила перенести в YDB также список игр неавторизованных пользователей. На тот момент планировалось расширение функциональности Игр для неавторизованных пользователей, которых всегда много. Поэтому рост объёмов данных ожидался и в этом сценарии.

У хранения списка игр есть одна особенность — получение и модификация данных происходят в рамках одной транзакции. Для этого реализовали метод транзакции с ручным коммитом. Данные переносили также в три этапа.

В процессе работы команда Игр столкнулась с одной проблемой. В случае с таблицей неавторизованных пользователей идентификатор — просто инкрементируемое значение. Это приводит к неравномерному распределению по шардам, что может привести к ухудшению latency запросов к этим данным. Чтобы преодолеть эту сложность, решили добавлять в идентификатор, служащий первичным ключом, хеш от id пользователя.

В итоге для списка игр неавторизованных пользователей результат миграции был ещё лучше: время выполнения запроса на запись сократилось на 52%, а на чтение — на 58%.