О чём эта история
Компания SalesAI разрабатывает систему для эффективного контроля качества звонков менеджеров по продажам и для упрощения ввода данных в CRM на базе собственной нейросети.
Продукт SalesAI решает задачи конверсии продаж для компаний СМБ. С его помощью можно контролировать качество звонков по десяткам параметров, автоматически добавлять данные в CRM, формировать протоколы встреч, получать рекомендации по улучшению обработки возражений и т. д. Это позволяет клиентам не создавать отделы контроля качества.
Команда SalesAI перенесла систему в Yandex Cloud всего за 2 недели, с учётом времени на настройку и тестирование решения с участием реальных клиентов. За счёт использования сервиса Yandex SpeechKit работа SalesAI ускорилась в 15 раз, а качество транскрибации голосовой информации стало выше.
Задача компании
SalesAI разрабатывает решение на базе собственной нейросети для компаний, которые хотят получить эффективный контроль качества звонков, адаптированный под процесс продаж.
Система SalesAI — это российское ПО, которое изначально было развёрнуто в облаке. Компания хорошо разбирается в скриптах, квалификации лидов, установлении контакта и обработке возражений. У стартапа уже много клиентов среди известных брендов: БЖФ Банк, CryptusMedia, RetailCRM, «АвтоСтронг‑М», Fresh Auto, «Кортрос», «Автопремьер», Группа «Клевер», «Евразия Креп», Profy48, РИКЦ, «Ленрусстрой», SKIPP и др.
SalesAI использовала систему транскрибации аудио от российского разработчика. Решение работало медленно: ответ системы приходил примерно через 30 секунд с момента запроса, а для эффективной работы менеджеров задержка должна быть минимальной, не более пары секунд. Кроме того, система сильно нагружала компьютеры, а при запуске пилотного проекта на 30 пользователей просто переставала работать. При этом транскрибация голоса в текст была невысокого качества — допускалось много пропусков и ошибок в распознавании.
Команда SalesAI решила заменить систему транскрибации речи на более качественную. Ещё компании нужны были управляемые сервисы для оптимизации затрат и усилий на обслуживание и масштабирование инфраструктуры и ПО.
SalesAI рассмотрела несколько представленных на рынке решений для транскрибации речи. Основными критериями выбора продукта были скорость и качество распознавания речи на русском языке, а также стоимость сервиса.
Специалисты SalesAI составили выборку и вручную её провалидировали. Затем протестировали каждое из облачных решений, замерили ключевые метрики — скорость, качество распознавания и количество ошибок (WER), удельную стоимость транскрибации, возможности по улучшению качества и дообучению модели, возможность разработки on‑premise продукта. Для оценки компания замеряла расстояние Левенштейна — метрику сходства между двумя строковыми последовательностями, которая используется для исправления ошибок в словах, поиска дубликатов текстов и других операций.
Помимо этого, команда общалась с представителями всех компаний, чтобы обозначить тестовые лимиты и возможности стратегического партнёрства, т. к. в перспективе поток трафика может значительно увеличиться.
В результате из всех исследуемых сервисов Yandex SpeechKit уже в первых тестах показал, что может работать почти в 15 раз быстрее, а качество транскрибации у него выше, чем у предыдущего продукта. SalesAI отметила и другие преимущества платформы Yandex Cloud — прежде всего возможность быстрой работы с большими данными и гарантированное SLA сервисов. Дополнительным плюсом стало то, что инфраструктура Yandex Cloud отвечает требованиям правил обработки информации в соответствии с российским и международным законодательством в сфере обеспечения безопасности персональных данных. Компания рассмотрела возможности, которые предлагает Yandex Cloud, и решила мигрировать на эту облачную платформу.
Кроме того, Yandex Cloud выделила SalesAI грант, который существенно снизил затраты на миграцию на новую инфраструктуру.
Yandex SpeechKit и управляемые сервисы для ускорения работы
Первая версия SalesAI сочетала в себе веб‑компонент и приложение на стороне клиента, которое работало на ОС Windows. В реальном времени система считывала данные со звуковой карты и отправляла в облако SalesAI. Затем аудио транскрибировали в текст с помощью Yandex SpeechKit STT. После этого нейросеть распознавала контекст и выделяла в диалоге вопросы и предложения, которые продавец должен озвучить при общении с потенциальным клиентом.
Система визуализировала результат в приложении сразу во время общения с клиентом, а историю звонков сохраняла в облаке. Когда систему начали использовать, стало понятно, что такой потребности нет, и результат стал выдаваться после окончания звонка и обработки файла записи.
Архитектура SalesAI — микросервисная. Это позволяет легко интегрироваться с другими продуктами, чтобы отправлять и собирать данные, анализировать информацию и визуализировать результаты. Основной язык программирования системы — Python, данные хранятся в PostgreSQL. Также используются ASR‑сервисы и NLP‑стек.
Чтобы решать задачи кластеризации, классификации, заполнения маски (fill‑mask) и извлечения именованных сущностей из текстов, SalesAI использует такие языковые модели, как BERT (Bidirectional Encoder Representations from Transformers) и T5. Для создания классификаторов команда использует метод опорных векторов, а для рекомендаций на основе выделенных корреляций — метод градиентного спуска. Чтобы проанализировать транскрибированный текст, применяются собственные NLP‑сервисы, а также решения внешних поставщиков систем на основе больших языковых моделей (LLM).
Система очень гибкая, и её можно конфигурировать под потребности конкретного клиента. Чтобы повысить качество и расширить терминологическую базу, нейросети дообучают на основе результатов работы с клиентскими компаниями. При обучении используются данные больших языковых моделей от крупных производителей, в том числе YandexGPT.
Сейчас у системы 5 сценариев применения:
-
Оценка качества действий менеджера по продажам.
-
Квалификация лида.
-
Заполнение ячеек CRM.
-
Получение протокола — структурированного резюме встречи.
-
Построение и улучшение скрипта продаж.
Специалисты SalesAI перенесли систему в Yandex Cloud в два этапа. Первый этап занял 2 недели: команда разработки создала тестовую инфраструктуру и проверила работу системы. На втором этапе DevOps‑инженер развернул рабочее окружение для реальных клиентов и актуальных текстовых данных. При этом голосовую информацию компания не хранит в облаке, а удаляет её сразу после распознавания.
У специалистов SalesAI миграция не вызвала трудностей.
Для сбора, преобразования и анализа данных, а также для разработки и администрирования системы используются управляемые сервисы Yandex Cloud:
-
Yandex SpeechKit — для распознавания речи (Speech‑to‑Text).
-
Yandex DataLens — для визуализации отчётов в виде дашбордов.
-
Yandex Object Storage — для организации универсального масштабируемого объектного хранилища. Здесь хранятся аудиозаписи до транскрибации и распознанные тексты.
-
Yandex Compute Cloud — для создания ВМ, которые используются для разработки, тестирования и развёртывания микросервисов.
-
Yandex Network Load Balancer — для обеспечения отказоустойчивости системы и возможности её обновления без остановки работы.
-
Yandex Managed Service for PostgreSQL — для хранения и обработки информации, которая используется в разработке и в продакшен‑решении.
-
Yandex Container Registry — для хранения промежуточных контейнеров, собранных в процессе CI/CD. В них установлены все необходимые зависимости. Такой подход позволяет ускорить сборку примерно в 2–6 раз, в зависимости от сервиса. В планах перенести хранение итоговых контейнеров также в Registry, чтобы быстро откатывать изменения в непредвиденных ситуациях.
-
Yandex Certificate Manager — для контроля и управления TLS-сертификатами.
-
Yandex Cloud DNS — для обслуживания DNS‑зоны salesai.ru.
-
Yandex Monitoring — для сбора и отображения метрик ВМ, а также для рассылки уведомлений.
-
Yandex Cloud Logging — для централизованного сбора логов из микросервисов.
Для безопасного доступа команда выделила внешний и внутренний вычислительные контуры. На ВМ с внешним IP‑адресом развёрнут VPN‑сервис на базе протокола WireGuard, а для доступа и сетевой маршрутизации ВМ во внутреннем контуре используется клиент WireGuard.
Значительное ускорение работы и повышение качества транскрибации
Решение SalesAI на базе Yandex Cloud запустили в промышленную эксплуатацию, при этом компания продолжает улучшать инфраструктуру. С Yandex SpeechKit в 15 раз выросла скорость обработки потока. В каждом потоке 7‑минутный звонок полностью обрабатывается за 1 минуту. Специалисты SalesAI отмечают, что после перехода в Yandex Cloud стабильность работы системы улучшилась. Это произошло за счёт асинхронного выполнения задач посредством брокеров и распределения на несколько воркеров, а также благодаря масштабируемости системы с помощью автоскейлинга. Кроме того, компания повысила безопасность сервиса: организовала VPN‑доступ к виртуальным машинам во внутреннем вычислительном контуре.
Благодаря широкому выбору управляемых сервисов Yandex Cloud компания не тратила время на настройку и поддержку инфраструктуры и сфокусировалась на разработке и улучшении собственного решения.
Сейчас компания быстро растёт и, по предварительным расчётам, планирует ежемесячно удваивать свой оборот и нагрузку.
Недавно SalesAI добавила в продукт новые возможности — в частности, структурированное саммари с конкретными проблемами и вопросами, которые влияют на конверсию продаж. В следующей итерации появятся подсказки руководителю отдела продаж, это также позволит увеличивать конверсию. Кроме того, система сможет контролировать качество всех данных, которые проходят через неё, в том числе данных из мессенджеров, чатов и электронной почты.
В планах компании разработать цифрового двойника менеджера по продажам — роботизированного приложения на основе искусственного интеллекта. Эта система будет работать не по жёстко заданной алгоритмической структуре, а формировать скрипт общения с помощью нейросети в реальном времени. Двойник сможет отвечать даже на нестандартные запросы и будет разговаривать голосом, похожим на голос реального человека.
Компания планирует интегрировать в проект сервис для управления DevOps‑платформой GitLab — Yandex Managed Service for GitLab, а также тестирует YandexGPT API и Yandex Tracker, оценивая возможность их применения в своём решении.
Мнение
Когда мы подключили к нашей системе Yandex SpeechKit и начали проводить испытания, первый ответ прилетел через 2 секунды. Не через 30 секунд, как раньше, а через 2. Причём качество транскрибации было гораздо выше. При этом Yandex Cloud даёт нам не только скорость и качество, но и надёжность и безопасность. За счёт перехода на эту инфраструктуру мы получаем дополнительные бонусы, поскольку все текстовые данные, в том числе и персональные, хранятся на территории России, а само решение отвечает требованиям правил обработки информации в соответствии с российским законодательством.