Как машинное обучение помогает учёным исследовать вспышки на красных карликах

Астрофизики вместе с Yandex Cloud автоматизировали анализ данных и создали крупнейший каталог вспышек на карликовых звёздах. Он поможет учёным лучше понять природу звёздных и солнечных вспышек.

Мониторинг солнечной активности помогает предсказывать магнитные бури на Земле и их влияние на электронику и системы связи, а также позволяет снизить вероятность поломок космических спутников.

В мониторинге учёным помогает изучение вспышек на красных карликах — небольших и холодных звёздах, схожих с Солнцем по физическим параметрам. Частота вспышек на этих звёздах позволяет учёным исследовать их динамику и моделировать процессы, похожие на солнечные вспышки. Для исследования вспышек на красных карликах учёным нужно обрабатывать огромные объёмы данных, что невозможно сделать вручную. Эта проблема требует автоматизации процессов анализа. Так появилась идея совместного проекта SNAD и Yandex Cloud.

Международная команда астрофизиков и аналитиков данных SNAD при поддержке Центра техологий для общества Yandex Cloud запустила проект по поиску вспышек и анализу кривых блеска красных карликов для лучшего понимания их активности. Yandex Cloud предоставила вычислительные мощности и инфраструктуру для обработки данных. С помощью сервиса Yandex DataSphere команда выстроила пайплайн машинного обучения, который позволил автоматически проанализировать 100 миллионов кривых блеска звёзд.

Кривая блеска помогает астрономам понять, как и почему изменяется светимость звезды, что может указывать на различные процессы, происходящие на ней или вокруг неё, например вспышки, затмения или пульсации. На основе большого количества измерений строится график изменения яркости объекта в зависимости от времени.

График можно сравнить с электрокардиограммой, только вместо электрической активности сердца здесь отображаются изменения в яркости небесного объекта. Но в отличие от врачей астрономы не всегда могут вести наблюдения в одинаковых условиях и с равными интервалами, что создаёт дополнительные сложности при анализе полученных данных

Данные для исследования были взяты из астрономических обзоров, их предоставили команды телескопов ZTF и TESS, которые регистрируют изменения яркости миллиардов астрономических объектов. Используя модели машинного обучения Random Forest и CatBoost, исследователи классифицировали кривые блеска, определяя, связаны ли они со вспышками или нет.

Команда SNAD проанализировала 100 миллионов кривых блеска в поисках вспышек на красных карликах. Разработка алгоритмов машинного обучения заняла около года, а итоговый пайплайн обработки данных потребовал нескольких дней работы вычислительных мощностей. Вручную просмотреть такое количество кривых блеска для классификации заняло бы годы.

С помощью разработанной ML‑модели, обученной примерно на миллионе временных рядов (последовательности значений светимости звезды с течением времени), учёные SNAD обнаружили 1196 вспышек на красных карликах и собрали самый большой их каталог на основе данных наземных наблюдений.

Каталог позволит учёным глубже проанализировать динамику звёздных вспышек и лучше понять физику звёздной активности и её последствия для экзопланет.

Почему важно изучать вспышки на красных карликах

Красные карлики — это небольшие и холодные звёзды, составляющие большинство в нашей галактике Млечный Путь. Учёные оценивают их количество на уровне от 160 до 320 миллиардов из общего числа в 400 миллиардов звёзд. Их высокая активность и долгий срок жизни делают их важными объектами для астрономических исследований.

Красные карлики невозможно наблюдать невооруженным взглядом из‑за их тусклости. Даже самую близкую к Солнцу звезду Проксима Центавра, которая тоже является красным карликом, нельзя заметить без телескопа на южном небосводе. Зато эти звёзды ярко и мощно вспыхивают. Вспышки вызваны частыми магнитными пересоединениями — процессами быстрого превращения магнитной энергии в кинетическую. Частота вспышек зависит от возраста звезды.

Диаграмма Герцшпрунга — Рассела показывает распределение звёзд по светимости и температуре. Красные карлики находятся на диаграме в правом нижнем углу, у них низкая температура и малая светимость по сравнению с более массивными звёздами. Эта диаграмма помогает визуализировать разницу между различными типами звёзд

Вспышка на Солнце 31 августа 2012 года с SDO (Solar Dynamics Observatory, космической обсерватории NASA, запущенной в 2010 году для изучения Солнца). Источник: Flickr

Солнечная активность влияет на магнитное поле нашей планеты и вызывает магнитные бури.

Известные случаи влияния солнечных вспышек

В 1989 году вспышка на Солнце вызвала сильную магнитную бурю на Земле, которая вывела из строя энергосистему Квебека, оставив миллионы людей без электричества. В 2003 году всплески солнечной активности привели к Хэллоуинской буре, которая вызвала повреждения нескольких спутников на орбите Земли, что привело к серьёзным сбоям в связи и нанесло значительный ущерб.

Вспышки красных карликов не достают до Земли, но значительно влияют на окружающие экзопланеты, разрушая их атмосферу и создавая проблемы для развития на них жизни. Несмотря на это, вокруг этих звёзд астрофизики часто находят зоны с подходящими условиями для зарождения жизни, которые успевают сформироваться благодаря долгому существованию красных карликов. Продолжительность их жизни — десятки миллиардов лет. Поэтому они — ключевые объекты в поиске экзопланет и внеземной жизни.

Низкая светимость красных карликов упрощает исследование: методы транзита и прямого наблюдения за экзопланетами наиболее эффективны именно для данного типа звёзд.

Метод транзита для обнаружения экзопланет. В верхней части изображения показан процесс прохождения планеты перед звездой, а в нижней части — кривая блеска, показывающая изменение яркости звезды в зависимости от времени. Эти изменения фиксируют и анализируют, чтобы подтвердить наличие экзопланеты

Часть экзопланет находится в зоне обитаемости — области вокруг звезды, где возможны условия для существования жидкой воды. Например, вокруг красного карлика в центре звёздной системы TRAPPIST‑1 вращаются семь экзопланет, и три из них находятся в зоне обитаемости.

Поиск вспышек среди миллиардов объектов на небе: сотрудничество Yandex Cloud и SNAD

Команда проекта автоматизировала поиск вспышек с помощью алгоритмов машинного обучения, используя данные астрономического обзора ZTF и космической обсерватории TESS.

Обзор ZTF, проводимый с помощью телескопа Самуэля Ошина, предназначен для наблюдения за быстрыми транзиентными явлениями: вспышками сверхновых, событиями приливного разрушения, астероидами и кометами. Он регистрирует изменения яркости миллиардов звёзд, данные сохраняются в виде кривых блеска. Широкоугольная камера позволяет телескопу собирать за ночь около терабайта изображений.

Обзор TESS охватывает всё небо и предназначен для поиска экзопланет, проходящих перед своими звёздами, что помогает находить потенциально обитаемые планеты. Обсерватория измеряет яркость звёзд и создаёт огромные массивы данных, которые используются для исследования экзопланет и звёздной активности.

Команда SNAD использует алгоритмы машинного обучения Random Forest и CatBoost для поиска вспышек среди всех кривых блеска, собранных ZTF за несколько лет. Затем учёные проверяют найденные события, чтобы убедиться в их достоверности.

Пайплайн машинного обучения

Состоит из нескольких этапов, каждый из которых важен для классификации кривых блеска.

Схема процесса, обработки и анализа данных иллюстрирует, как данные ZTF и TESS используются для генерации данных для обучения, извлечения признаков, моделирования и классификации кривых блеска с помощью Yandex Cloud

Этапы сбора и анализа данных с телескопов ZTF и TESS
Этап Описание
Сбор данных ZTF сканирует небо и фиксирует яркость миллиардов объектов. Данные собираются регулярно в зависимости от доступности телескопа и условий наблюдения, а затем преобразуются в кривые блеска, которые анализируют учёные
Фильтрация данных Учёные отбирают ряды высокочастотных наблюдений, в которых могут быть найдены вспышки. Это графики, по которым оценивается активность звезды
Моделирование данных Для обучения алгоритмов учёные используют данные с телескопа TESS. Они помогают моделировать различные формы вспышек, что улучшает их обнаружение и позволяет алгоритмам точнее идентифицировать вспышки на красных карликах. А использование симуляции кривых блеска помогает решить проблему нехватки данных для обучения моделей
Извлечение признаков Из числовых данных кривых блеска выделяют два типа признаков: астрофизические — по формулам, и аналитические — с помощью нейросетей
Обучение моделей Алгоритмы машинного обучения, такие как Random Forest и CatBoost, обучаются на данных кривых блеска. Эти алгоритмы анализируют изменения яркости, чтобы автоматически выявлять потенциальные вспышки
Постфильтрация Для исключения ложноположительных результатов используется модель логистической регрессии. Её применение в качестве постфильтра увеличивает конверсию полезного сигнала до 40%, что значительно улучшает результаты поиска вспышек
Верификация Астрофизики вручную проверяют потенциальные вспышки, анализируя данные, чтобы исключить ошибки и подтвердить подлинность обнаруженных событий

Результаты и будущее развитие проекта

Каталог вспышек на красных карликах ценен для астрофизиков, поскольку его можно использовать для:

  • проверки научных гипотез о том, как возникают и влияют на экзопланеты вспышки на красных карликах;

  • разработки новых моделей, которые помогут прогнозировать вспышки на красных карликах и других звёздах.

В будущем команда SNAD планирует расширить проект, исследуя другие типы звёзд, а также усовершенствовать пайплайн обработки данных, чтобы быстрее и точнее анализировать наблюдения за звёздными вспышками и другими астрономическими явлениями.

Важной задачей остаётся улучшение процессов анализа данных с использованием машинного обучения, чтобы открыть новые горизонты в исследовании космоса и, возможно, приблизить нас к обнаружению признаков жизни на других планетах.

Проект реализован при поддержке Центра технологий для общества Yandex Cloud

В проектах, связанных с наукой и образованием, здравоохранением, экологией и культурой, Yandex Cloud выступает технологическим партнёром. Команда напрямую погружается в проект и участвует в его реализации и развитии: анализирует потенциал, разрабатывает IT‑архитектуру, бесплатно предоставляет доступ к технологиям и консультациям экспертов, а также оказывает маркетинговую и PR‑поддержку. Оставить заявку на партнёрство с Yandex Cloud можно на сайте центра.

Напишите нам

Начать пользоваться Yandex Cloud

Тарифы

Узнать цены и рассчитать стоимость

Мероприятия

Календарь событий Yandex Cloud
Как машинное обучение помогает учёным исследовать вспышки на красных карликах
Войдите, чтобы сохранить пост