Почему «Сейсмотек» перенёс обработку геофизических данных в Yandex Cloud

О компании
Компания «Сейсмотек»
Особенности обработки геофизических данных
Сервисная компания «Сейсмотек» ранее использовала физическое кластерное оборудование, а теперь работает на серверах Yandex Cloud.
Данные являются ключом к разведке и добыче традиционного углеводородного сырья. Чтобы оценить, насколько перспективны месторождения, геологическим службам нефтегазодобывающих компаний необходимо обрабатывать большие массивы геофизических данных. Например, работа с морскими сейсморазведочными данными с площади 700 кв. км выполнялась на 70 серверах (12 ядер, 48 ГБ оперативной памяти) в течение 30 дней. Объём данных проекта составлял 50 ТБ.
У процесса обработки сейсмических данных есть несколько особенностей:
- переменная потребность в вычислительных ресурсах: этапы интерактивной работы пользователя, при выполнении которых потребность низкая, сменяются вычислительными этапами, выполнение которых в разумные сроки не представляется возможным без использования большого количества ресурсов;
- множество параллельных задач: этапы интерактивной работы и вычислений часто не следуют друг за другом, а пересекаются, поэтому геофизик может запустить масштабную вычислительную задачу и на это время переключиться на другую часть проекта;
- приоритет сроков выполнения проекта над стоимостью: для заказчиков в нефтегазовой отрасли важна возможность использования практически неограниченных вычислительных ресурсов без резервирования и предварительного заказа (является конкурентным преимуществом).
Компания «Сейсмотек» выбрала сервисы Compute Cloud и Object Storage, в результате чего были достигнуты две цели:
- оптимизация расходов на аренду вычислительного оборудования;
- сокращение времени выполнения вычислительных этапов обработки до минимума.
Перенос данных и адаптация ПО для работы в Yandex Cloud
В этой статье:
На этапе technical preview и в течение первых месяцев использования разработчиками была выполнена адаптация ПО Prime для работы в Yandex Cloud. Для каждого вычислительного задания автоматически создаются необходимые ресурсы со специфическими характеристиками (количество ядер, объём оперативной и дисковой памяти). После завершения вычислений ресурсы автоматически удаляются.
Подготовка к переезду заняла 3–4 месяца. В течение этого периода происходило развёртывание в Yandex Cloud необходимой инфраструктуры (кластерная система хранения данных, серверы для обеспечения интерактивной удалённой работы, сервер базы данных).
Также программное обеспечение Prime оснащалось облачным API, то есть Prime «научился» создавать виртуальные кластеры для проведения вычислений. С момента готовности инфраструктуры и ПО все новые проекты по обработке сейсмических данных стали загружаться в Yandex Cloud.
Коллектив компании «Сейсмотек» состоит из разработчиков программного обеспечения Prime и геофизиков, использующих Prime для выполнения обработки сейсмических данных. Реализация проекта проводилась силами штатных специалистов при помощи квалифицированной технической поддержки Yandex Cloud.
Результаты
По завершении проекта были достигнуты обе поставленные цели:
- Переход на облачную платформу с посекундной тарификацией позволил снизить затраты на аренду не менее чем на 30%.
- Сотрудники компании, выполняющие обработку данных, получили возможность подключить необходимое количество вычислительных ресурсов по требованию и тратить минимальное время, ожидая завершения выполнения расчётов.
Также важно, что сотрудники получили возможность подключаться к облачным ресурсам независимо от местонахождения.
Мнение
Подписывайтесь на телеграм-канал
