О чём эта история
В 2023 году сервис ReText.AI мигрировал в Yandex Cloud. За несколько месяцев он вырос из экспериментального синонимайзера в платформу, которую Tele2 назвала самой востребованной нейросетью.
Сейчас миграция ещё идёт, но уже позволила сервису масштабироваться и повысить отказоустойчивость. Он достиг уровня в 99% SLA для перенесённой функциональности, несмотря на ежедневную нагрузку более 10 тысяч пользователей. В Yandex Cloud удалось перенести функции «Синонимы» и «Уникальность», которые применяет 64% аудитории сервиса.
Эффективность облачного развёртывания пока сложно оценить, но уже можно сравнить затраты, которые понадобились бы на собственную инфраструктуру. Облачная инфраструктура выигрывает в долгосрочной перспективе, так как не требует времени специалистов и расходов на закупку серверов, их модернизацию и обслуживание. Кроме того, ReText.AI уже вышел на самоокупаемость.
Задача компании
ReText.AI — сервис перефразирования на основе нескольких нейросетей с умным синонимайзером. С его помощью за несколько секунд можно разнообразить, сжать или увеличить текст без потери смысла, проверить уникальность и проанализировать. С платформой работают копирайтеры, редакторы, блогеры и предприниматели.
Когда продукт только появился, пользователей было мало, и физические серверы компании хорошо справлялись с нагрузкой. Росла популярность, а вместе с ней и аудитория — собственных мощностей перестало хватать.
За 3‑4 месяца команда разработала новую версию продукта и для её продвижения использовала эффективную PR‑кампанию. В результате в проект пришло ещё больше пользователей, и нагрузка возросла. Нужно было умещаться в рамках небольшой инфраструктуры. Разработчики пытались оптимизировать модели, но скоро стало ясно, что для масштабирования необходимо переходить в облако.
Облачное развёртывание помогло бы решить вопросы масштабирования, так как ресурсы в облаке меняются динамически в зависимости от нагрузки. Кроме того, платформенные сервисы облака позволили бы сократить затраты на развёртывание новой и поддержку существующей инфраструктуры.
Масштабируемое облако для стартапа
Без поддержки стартапу трудно развиться, поэтому компания ReText.AI выбирала те облачные платформы, которые выдают гранты.
Рассматривали несколько предложений от крупных организаций, но ни одно из них не подходило по условиям или бюджету. Команда опасалась, что в процессе миграции потребуется много доработок, на которые нужно будет потратить ещё больше денег, и суммы гранта не хватит.
В итоге ReText.AI попал в программу Yandex Cloud Boost, и сейчас сервис переходит в облако. Финансирование покрывает расходы на маркетинг, исправление ошибок, а самое главное — на миграцию.
Поэтапная миграция сервиса перефразирования
Миграция ещё идёт, процесс длится уже около трёх месяцев. За него отвечают DevOps‑специалист и бэкенд‑разработчик ReText.AI, а команда Yandex Cloud помогает при переносе.
Для развёртывания кластеров РostgreSQL, Redis и Kubernetes команда ReText.AI выбрала виртуальные машины Yandex Compute Cloud. Кроме того, ReText.AI использует Yandex Object Storage — в нём хранятся обученные модели, Docker‑образы, логи проекта, бэкапы баз данных. Только для сервиса «Синонимы» команда хранит 200 ГБ пользовательских данных, а версии обученных моделей занимают 100 ГБ в хранилище.
Под разные задачи ReText.AI использует разные текстовые нейросети. Команда задействовала три основных типа: кодировщики, генеративные и text‑to‑text. Модели работают вместе: например, кодировщик анализирует результаты генеративной модели. А ещё в сервисе используются отдельные нейронные сети для аугментации данных и формирования датасетов. В результате контент получается качественным.
Сейчас инфраструктура проекта гибридная: для вычислений, которые используют GPU в режиме 24/7, в ReText.AI развернули собственные физические серверы. Переход — сложный процесс. Различия между облачной и собственной физической инфраструктурой зачастую приводят к рефакторингу большого объёма кода. Команда ReText.AI продолжает переносить сервисы в облако — специалисты работают над миграцией в Yandex Managed Service for Kubernetes®.
Результаты
Хотя миграция ещё не завершена, уже есть несколько результатов. Один из наиболее важных эффектов от перехода в Yandex Cloud — в ReText.AI оптимизировали расходы на инфраструктуру и вышли на самоокупаемость. Также ReText.AI достиг уровня в 99% SLA для перенесённой в Yandex Cloud функциональности при посещении более чем 10 тысячами пользователей в сутки.
Теперь команда планирует создавать проекты сразу в облаке. Один из них почти готов — в ближайшее время запустится телеграм‑бот, который облегчит аналитику инфополя: он будет исследовать доступные источники информации и суммаризировать результаты по ним.
Компания движется в сторону профессиональной платформы, чтобы специалисты могли оптимизировать время, получать контент для своих задач и анализировать тексты. Например, команда ReText.AI существенно расширила датасет, чтобы получить высокое качество перефразирования. По результатам исследования Tele2, модель вошла в топ нейросетей, показав лучшее качество для этой задачи.
Мнение
Готовить новые проекты сразу в облаке гораздо проще, чем мигрировать. Также мы постепенно переносим работу ReText.AI в Telegram, чтобы пользователям было удобнее с ним работать. И ресурсы Yandex Cloud позволят нам это сделать.