Мы разработали нейросеть-полиглота

Новая модель на базе машинного обучения может одновременно распознать более 10 иностранных языков: английский, французский, датский, финский, турецкий и другие.

Мы стремимся к тому, чтобы диалоговые сценарии для разработки голосовых помощников вроде Алисы, автоматизации работы с клиентами, проведения опросов и контроля качества были доступны каждому бизнесу. Для внедрения любой фичи в речевые технологии требуются большие массивы данных, высококвалифицированные специалисты и сотни часов обучения. Мы в Yandex Cloud постоянно развиваем сервис синтеза и распознавания Yandex SpeechKit: делаем речь максимально естественной, расширяем возможности для ее распознавания и создаем уникальные голоса помощников.

Новая модель на базе машинного обучения умеет распознавать более 10 иностранных языков одновременно. С помощью новой нейросети компании смогут проще и быстрее создавать многоязычных голосовых помощников и мультиязычных голосовых роботов для колл‑центров с большим потоком клиентов.

Нейросеть‑полиглот умеет работать и с популярными языками, такими как английский и французский, и с более редкими — датским, финским, турецким. Модель распознает речь на любую тему и в разных форматах: короткие и длинные фразы, а также имена, адреса, даты и числа. Она умеет распознавать язык автоматически в одном потоке: нейросеть может в любой момент переключаться между языками. При этом есть возможность давать ей «подсказки», чтобы улучшить качество распознавания.

author
Василий Ершов
Руководитель ML-cервисов

Новая мультиязычная модель работает на базе архитектуры Transformer. «Трансформеры» обрабатывают входные слова параллельно и независимо друг от друга, благодаря чему быстро обучаются. Чтобы при переходе на другой язык текст получался связным и грамматически правильным, нейросеть обучали на десятках терабайтов данных из профессиональных датасетов и массивах данных из сервисов и приложений Яндекса.

Новое мультиязычное распознавание уже доступно для пользователей Yandex SpeechKit и настраивается стандартными средствами в API.

Yandex SpeechKit

Речевые технологии на базе машинного обучения

Yandex SpeechKit

Попробуйте наши речевые технологии бесплатно

Тарифы

Узнать цены и рассчитать стоимость

Мероприятия

Календарь событий Yandex Cloud
Мы разработали нейросеть-полиглота
Войдите, чтобы сохранить пост