О чем эта история
Платформа PressReader предоставляет своим подписчикам цифровые версии популярных газет и журналов в приложениях для iOS, Android, на компьютерах и других устройствах.
С 2017 года платформа использует сервис машинного перевода Yandex Translate. При помощи облачных технологий PressReader переводит свыше 7 тысяч изданий, выходящих в 120+ странах и на более чем 60 языках.
Адаптация продукта к многоязычной среде
PressReader обрабатывает тысячи полос каждый день, извлекая из них тексты и изображения. The Washington Post, USA Today, The New York Times International Edition (International Herald Tribune), Daily Mail, The Herald — эти и многие другие газеты появляются на платформе, как только попадают в газетные киоски. Все материалы становятся доступны для поиска и легко читаются на мобильных устройствах.
PressReader делает публикации доступными для самого широкого круга читателей. Статью, вышедшую с утра на немецком, уже через пару часов может прочитать на своем родном языке и студент из Индии, и бизнесмен из США.
Переводить публикации вручную было бы невозможно: обеспечить такой объем и такую скорость работы не способно ни одно переводческое агентство. Для этого нужен качественный машинный перевод.
В условиях пандемии, когда у людей возросла потребность в онлайн-доступе к контенту, эта задача стала особенно актуальна.
Цена, качество, масштаб и скорость обработки данных
Чтобы создать собственный сервис машинного перевода, нужно нанять команду разработчиков, развернуть инфраструктуру и потратить много времени на разработку продукта. Затраты на проект автоматически делали бы его нерентабельным практически для любой компании.
Облачные технологии позволяют свести эти затраты к сравнительно небольшим операционным расходам. А еще они значительно облегчают хранение, систематизацию и передачу больших объемов информации.
На этапе выбора заказчик рассматривал три варианта: Yandex Translate, Microsoft Translator, Google Переводчик. Выбор был сделан в пользу сервиса машинного перевода компании «Яндекс», который по качеству и масштабируемости ничем не уступает конкурентам, но стоит при этом значительно дешевле.
Интеграция Yandex Translate
Yandex Translate подключен к PressReader с помощью API. Используя облачные технологии, сервис принимает от агрегатора тексты, с ходу определяя язык, на котором они написаны, и возвращает их обратно переведенными.
Интеграция сервиса машинного перевода в платформу PressReader заняла меньше недели. Теперь, чтобы ознакомиться с передовицей свежей La Repubblica или статьей в последнем номере Vogue France, не нужно знать итальянский или французский. Программа выполняет колоссальный объем работы и выдает итоговый результат практически мгновенно. Необходимая скорость обработки данных предоставляется облаком.
В Yandex Translate используется гибридная модель машинного перевода, включающая в себя нейросетевой и статистический подходы. Результат, полученный от обеих систем, оценивается алгоритмом, основанном на методе обучения CatBoost. При оценке учитываются десятки факторов — от длины предложения (короткие фразы и редкие слова лучше переводит статистическая модель) до синтаксиса. Алгоритм оценивает оба перевода по всем факторам, выбирает лучший и показывает этот перевод пользователю.
Пользователи получают мгновенный доступ к контенту на понятном для них языке
С помощью облачных технологий PressReader дает своим пользователям возможность прочитать любой выпуск практически любой популярной газеты или журнала в мире на любом из 60+ языков.
Агрегатор обеспечивает перевод для 365 языковых пар (и их число постоянно растет). Например, он может перевести текст с русского на французский и с финского на чешский. Ежемесячный объем материалов, переводимых PressReader с помощью Yandex Translate, превышает два миллиарда знаков.
Ведение бизнеса в международном масштабе всегда создает как дополнительные возможности, так и сложности, связанные в том числе с необходимостью адаптации продукта к многоязычной среде. Особенно это актуально для медийных платформ, пользователи которых привыкли получать мгновенный доступ к контенту на понятном для них языке и в удобном формате. При больших объемах информации обеспечить ее быстрый и качественный перевод могут только облачные сервисы. Наш четырехлетний опыт сотрудничества с PressReader показывает, что Yandex Cloud способна полностью обеспечивать растущие потребности международных компаний в уникальных сервисах и делать ценный контент доступным как можно более широкому кругу людей во всем мире.
Олег Коверзнев,операционный директор Yandex Cloud
Мнение
На протяжении более чем четырех лет Yandex Cloud позволяет нам предлагать перевод высочайшего качества нашим читателям во всем мире. Сервис Yandex Translate было легко интегрировать в наш продукт, а его технологии постоянно совершенствуются. С начала использования Yandex Translate у нас не было ни одной жалобы на качество перевода: оно просто отличное.