Мы разработали нейросеть-полиглота

Новая модель на базе машинного обучения может одновременно распознать более 10 иностранных языков: английский, французский, датский, финский, турецкий и другие.

Мы стремимся к тому, чтобы диалоговые сценарии для разработки голосовых помощников вроде Алисы, автоматизации работы с клиентами, проведения опросов и контроля качества были доступны каждому бизнесу. Для внедрения любой фичи в речевые технологии требуются большие массивы данных, высококвалифицированные специалисты и сотни часов обучения. Мы в Yandex Cloud постоянно развиваем сервис синтеза и распознавания Yandex SpeechKit: делаем речь максимально естественной, расширяем возможности для ее распознавания и создаем уникальные голоса помощников.

Новая модель на базе машинного обучения умеет распознавать более 10 иностранных языков одновременно. С помощью новой нейросети компании смогут проще и быстрее создавать многоязычных голосовых помощников и мультиязычных голосовых роботов для колл‑центров с большим потоком клиентов.

Нейросеть‑полиглот умеет работать и с популярными языками, такими как английский и французский, и с более редкими — датским, финским, турецким. Модель распознает речь на любую тему и в разных форматах: короткие и длинные фразы, а также имена, адреса, даты и числа. Она умеет распознавать язык автоматически в одном потоке: нейросеть может в любой момент переключаться между языками. При этом есть возможность давать ей «подсказки», чтобы улучшить качество распознавания.

author
Василий Ершов
Руководитель ML‑сервисов, Yandex Cloud

Новая мультиязычная модель работает на базе архитектуры Transformer. «Трансформеры» обрабатывают входные слова параллельно и независимо друг от друга, благодаря чему быстро обучаются. Чтобы при переходе на другой язык текст получался связным и грамматически правильным, нейросеть обучали на десятках терабайтов данных из профессиональных датасетов и массивах данных из сервисов и приложений Яндекса.

Новое мультиязычное распознавание уже доступно для пользователей Yandex SpeechKit и настраивается стандартными средствами в API.

Yandex SpeechKit

Речевые технологии на базе машинного обучения

Yandex SpeechKit

Попробуйте наши речевые технологии бесплатно

Тарифы

Узнать цены и рассчитать стоимость

Мероприятия

Календарь событий Yandex Cloud
Мы разработали нейросеть-полиглота
Войдите, чтобы сохранить пост