График можно сравнить с электрокардиограммой, только вместо электрической активности сердца здесь отображаются изменения в яркости небесного объекта. Но в отличие от врачей астрономы не всегда могут вести наблюдения в одинаковых условиях и с равными интервалами, что создаёт дополнительные сложности при анализе полученных данных
Как машинное обучение помогает учёным исследовать вспышки на красных карликах
Астрофизики вместе с Yandex Cloud автоматизировали анализ данных и создали крупнейший каталог вспышек на карликовых звёздах. Он поможет учёным лучше понять природу звёздных и солнечных вспышек.
Команда SNAD — это международная группа исследователей, занимающаяся поиском аномалий в астрономических каталогах и базах данных. В этой работе принимали участие специалисты Государственного астрономического института имени П. К. Штернберга МГУ, Факультета Космических Исследований МГУ и Университета Карнеги — Меллона.
Кривые блеска — это графики, показывающие, как изменяется яркость звезды с течением времени. Они позволяют астрономам наблюдать за различными явлениями, такими как вспышки, транзиты планет и пульсации звёзд, и изучать поведение звёзд и экзопланет.
Последовательность этапов, через которые проходят данные от их сбора до получения конечного результата. Обычно включает предобработку данных, обучение модели, оценку и тестирование. Пайплайн помогает автоматизировать и стандартизировать процесс работы, делая его более структурированным и удобным для повторения.
Мониторинг солнечной активности помогает предсказывать магнитные бури на Земле и их влияние на электронику и системы связи, а также позволяет снизить вероятность поломок космических спутников.
В мониторинге учёным помогает изучение вспышек на красных карликах — небольших и холодных звёздах, схожих с Солнцем по физическим параметрам. Частота вспышек на этих звёздах позволяет учёным исследовать их динамику и моделировать процессы, похожие на солнечные вспышки. Для исследования вспышек на красных карликах учёным нужно обрабатывать огромные объёмы данных, что невозможно сделать вручную. Эта проблема требует автоматизации процессов анализа. Так появилась идея совместного проекта SNAD и Yandex Cloud.
Международная команда астрофизиков и аналитиков данных SNAD
Кривая блеска помогает астрономам понять, как и почему изменяется светимость звезды, что может указывать на различные процессы, происходящие на ней или вокруг неё, например вспышки, затмения или пульсации. На основе большого количества измерений строится график изменения яркости объекта в зависимости от времени.
Zwicky Transient Facility — широкоугольный астрономический обзор неба, предназначенный для наблюдения за транзиентными астрономическими явлениями: вспышками сверхновых, астероидами и кометами. Использует камеру, подключённую к телескопу имени Самуэля Ошина в Паломарской обсерватории.
Transiting Exoplanet Survey Satellite — это космическая обсерватория NASA, предназначенная для поиска экзопланет методом транзитов.
Алгоритм машинного обучения, основанный на ансамбле деревьев решений. Он создаёт несколько деревьев, обученных на разных подмножествах данных, и принимает решение путём голосования большинства.
Градиентный бустинг на деревьях решений, оптимизированный для работы с категориальными данными без необходимости их предварительного кодирования.
Данные для исследования были взяты из астрономических обзоров, их предоставили команды телескопов ZTF и TESS, которые регистрируют изменения яркости миллиардов астрономических объектов. Используя модели машинного обучения Random Forest и CatBoost, исследователи классифицировали кривые блеска, определяя, связаны ли они со вспышками или нет.
Команда SNAD проанализировала 100 миллионов кривых блеска в поисках вспышек на красных карликах. Разработка алгоритмов машинного обучения заняла около года, а итоговый пайплайн обработки данных потребовал нескольких дней работы вычислительных мощностей. Вручную просмотреть такое количество кривых блеска для классификации заняло бы годы.
С помощью разработанной ML‑модели, обученной примерно на миллионе временных рядов (последовательности значений светимости звезды с течением времени), учёные SNAD обнаружили 1196 вспышек на красных карликах и собрали самый большой их каталог на основе данных наземных наблюдений.
Это планеты, которые находятся за пределами Солнечной системы и вращаются вокруг других звёзд. Их изучение помогает понять, насколько уникальна наша планетная система и есть ли условия для жизни на других планетах. По оценкам учёных, в нашей галактике может быть более 100 миллиардов экзопланет. Это основано на данных, полученных с помощью телескопов, таких как Kepler.
Каталог позволит учёным глубже проанализировать динамику звёздных вспышек и лучше понять физику звёздной активности и её последствия
Почему важно изучать вспышки на красных карликах
Температура красных карликов в районе 2700–3500K, а светимость от 1/10 до 1/1000 солнечной.
Красные карлики — это небольшие и холодные звёзды, составляющие большинство в нашей галактике Млечный Путь. Учёные оценивают их количество на уровне от 160 до 320 миллиардов
Красные карлики невозможно наблюдать невооруженным взглядом из‑за их тусклости. Даже самую близкую к Солнцу звезду Проксима Центавра, которая тоже является красным карликом, нельзя заметить без телескопа на южном небосводе. Зато эти звёзды ярко и мощно вспыхивают. Вспышки вызваны частыми магнитными пересоединениями — процессами быстрого превращения магнитной энергии в кинетическую. Частота вспышек зависит от возраста звезды.
Диаграмма Герцшпрунга — Рассела показывает распределение звёзд по светимости и температуре. Красные карлики находятся на диаграме в правом нижнем углу, у них низкая температура и малая светимость по сравнению с более массивными звёздами. Эта диаграмма помогает визуализировать разницу между различными типами звёзд
Вспышка на Солнце 31 августа 2012 года с SDO (Solar Dynamics Observatory, космической обсерватории NASA, запущенной в 2010 году для изучения Солнца). Источник: Flickr
Солнечная активность влияет на магнитное поле нашей планеты и вызывает магнитные бури.
Известные случаи влияния солнечных вспышек
В 1989 году вспышка на Солнце вызвала сильную магнитную бурю
Вспышки красных карликов не достают до Земли, но значительно влияют на окружающие экзопланеты, разрушая их атмосферу и создавая проблемы для развития на них жизни. Несмотря на это, вокруг этих звёзд астрофизики часто находят зоны с подходящими условиями для зарождения жизни, которые успевают сформироваться благодаря долгому существованию красных карликов. Продолжительность их жизни — десятки миллиардов лет. Поэтому они — ключевые объекты в поиске экзопланет и внеземной жизни.
Низкая светимость красных карликов упрощает исследование: методы транзита и прямого наблюдения за экзопланетами наиболее эффективны именно для данного типа звёзд.
Метод транзита для обнаружения экзопланет. В верхней части изображения показан процесс прохождения планеты перед звездой, а в нижней части — кривая блеска, показывающая изменение яркости звезды в зависимости от времени. Эти изменения фиксируют и анализируют, чтобы подтвердить наличие экзопланеты
Часть экзопланет находится в зоне обитаемости — области вокруг звезды, где возможны условия для существования жидкой воды. Например, вокруг красного карлика в центре звёздной системы TRAPPIST‑1 вращаются семь экзопланет, и три из них находятся в зоне обитаемости.
Поиск вспышек среди миллиардов объектов на небе: сотрудничество Yandex Cloud и SNAD
Команда проекта автоматизировала поиск вспышек с помощью алгоритмов машинного обучения, используя данные астрономического обзора ZTF и космической обсерватории TESS.
Обзор ZTF, проводимый с помощью телескопа Самуэля Ошина, предназначен для наблюдения за быстрыми транзиентными явлениями: вспышками сверхновых, событиями приливного разрушения, астероидами и кометами. Он регистрирует изменения яркости миллиардов звёзд, данные сохраняются в виде кривых блеска. Широкоугольная камера позволяет телескопу собирать за ночь около терабайта изображений.
Обзор TESS охватывает всё небо и предназначен для поиска экзопланет, проходящих перед своими звёздами, что помогает находить потенциально обитаемые планеты. Обсерватория измеряет яркость звёзд и создаёт огромные массивы данных, которые используются для исследования экзопланет и звёздной активности.
Команда SNAD использует алгоритмы машинного обучения Random Forest и CatBoost для поиска вспышек среди всех кривых блеска, собранных ZTF за несколько лет. Затем учёные проверяют найденные события, чтобы убедиться в их достоверности.
Пайплайн машинного обучения
Состоит из нескольких этапов, каждый из которых важен для классификации кривых блеска.
Схема процесса, обработки и анализа данных иллюстрирует, как данные ZTF и TESS используются для генерации данных для обучения, извлечения признаков, моделирования и классификации кривых блеска с помощью Yandex Cloud
Этапы сбора и анализа данных с телескопов ZTF и TESS
В контексте данного исследования — это те случаи, когда алгоритм считает объект вспышкой, хотя на самом деле это не так.
Этап | Описание |
---|---|
Сбор данных | ZTF сканирует небо и фиксирует яркость миллиардов объектов. Данные собираются регулярно в зависимости от доступности телескопа и условий наблюдения, а затем преобразуются в кривые блеска, которые анализируют учёные |
Фильтрация данных | Учёные отбирают ряды высокочастотных наблюдений, в которых могут быть найдены вспышки. Это графики, по которым оценивается активность звезды |
Моделирование данных | Для обучения алгоритмов учёные используют данные с телескопа TESS. Они помогают моделировать различные формы вспышек, что улучшает их обнаружение и позволяет алгоритмам точнее идентифицировать вспышки на красных карликах. А использование симуляции кривых блеска помогает решить проблему нехватки данных для обучения моделей |
Извлечение признаков | Из числовых данных кривых блеска выделяют два типа признаков: астрофизические — по формулам, и аналитические — с помощью нейросетей |
Обучение моделей | Алгоритмы машинного обучения, такие как Random Forest и CatBoost, обучаются на данных кривых блеска. Эти алгоритмы анализируют изменения яркости, чтобы автоматически выявлять потенциальные вспышки |
Постфильтрация | Для исключения ложноположительных результатов используется модель логистической регрессии. Её применение в качестве постфильтра увеличивает конверсию полезного сигнала до 40%, что значительно улучшает результаты поиска вспышек |
Верификация | Астрофизики вручную проверяют потенциальные вспышки, анализируя данные, чтобы исключить ошибки и подтвердить подлинность обнаруженных событий |
Результаты и будущее развитие проекта
Каталог вспышек на красных карликах ценен для астрофизиков, поскольку его можно использовать для:
-
проверки научных гипотез о том, как возникают и влияют на экзопланеты вспышки на красных карликах;
-
разработки новых моделей, которые помогут прогнозировать вспышки на красных карликах и других звёздах.
В будущем команда SNAD планирует расширить проект, исследуя другие типы звёзд, а также усовершенствовать пайплайн обработки данных, чтобы быстрее и точнее анализировать наблюдения за звёздными вспышками и другими астрономическими явлениями.
Важной задачей остаётся улучшение процессов анализа данных с использованием машинного обучения, чтобы открыть новые горизонты в исследовании космоса и, возможно, приблизить нас к обнаружению признаков жизни на других планетах.
Проект реализован при поддержке Центра технологий для общества Yandex Cloud
В проектах, связанных с наукой и образованием, здравоохранением, экологией и культурой, Yandex Cloud выступает технологическим партнёром. Команда напрямую погружается в проект и участвует в его реализации и развитии: анализирует потенциал, разрабатывает IT‑архитектуру, бесплатно предоставляет доступ к технологиям и консультациям экспертов, а также оказывает маркетинговую и PR‑поддержку. Оставить заявку на партнёрство с Yandex Cloud можно на сайте центра.