Катализаторы — это вещества, которые ускоряют химические реакции и при этом не расходуются сами. Почти у каждого промышленного процесса есть свой катализатор — например, катализатор Филлипса

Нейросеть и рентгеновские спектры: как ускорить анализ катализаторов
Рассказываем, как проект Центра технологий для общества Yandex Cloud и Южного федерального университета помогает учёным исследовать атомную структуру катализаторов.
- Катализаторы — это вещества, которые ускоряют химические реакции и при этом не расходуются сами. Они играют огромную роль в промышленных процессах.
- Для понимания процессов, происходящих с катализаторами на атомарном уровне, учёные используют спектроскопию рентгеновского поглощения и проводят эксперименты на синхротронах.
- Анализ спектров катализаторов — сложная задача, которая может занять несколько часов и требует участия специалистов из разных областей.
- Междисциплинарный коллектив МИИИМ ЮФУ разработал интеллектуального агента-исследователя на основе большой языковой модели для упрощения и ускорения анализа спектров.
- Агент обучен на специально собранных базах данных с помощью авторского фреймворка PyFitIt и может работать с разными моделями LLM.
- Общение с агентом происходит через телеграм-бот, который поддерживает два сценария взаимодействия: свободный и пайплайн-режим.
- Время анализа спектров с помощью агента сократилось до менее чем одной минуты, а точность анализа сопоставима с результатами, полученными вручную, и даже выше.
- Обучение и развёртывание LLM команда реализовала в облаке — на базе Yandex Cloud при помощи Yandex DataSphere.
- Разработанный агент позволил автоматизировать анализ спектров и сократить время обработки данных с нескольких месяцев до одной минуты.
- Команда планирует распространить и адаптировать агента для использования на крупных российских установках, включая Курчатовский синхротрон.
Что такое катализаторы и для чего они нужны
В Международном исследовательском институте интеллектуальных материалов Южного федерального университета (МИИИМ ЮФУ) разрабатывают новые методы диагностики катализаторов.
Несмотря на огромную роль катализаторов в современной технической цивилизации, долгое время о процессах, которые с ними происходят на атомарном уровне, было известно крайне мало. Чтобы понять, как устроены активные центры катализаторов, почему они деградируют и как улучшить их активность, учёные используют спектроскопию рентгеновского поглощения — один из самых точных неразрушающих методов диагностики атомной структуры.
Эксперименты проводят на синхротронах — установках мегакласса, позволяющих буквально «заглянуть» внутрь вещества в процессе его работы, например при высоких температурах и давлении газов.

Одна из экспериментальных станций Курчатовского источника синхротронного излучения. Здесь исследуют катализаторы в условиях, максимально приближённых к реальным

Схема подобного эксперимента: в капилляре под давлением и при нагреве формируются активные центры родия. Их спектры фиксируют с помощью рентгеновского излучения, а затем математически обрабатывают для дальнейшей расшифровки структуры
В него входят Богдан Проценко, Михаил Лифарь, Георгий Асатуров, Даниил Куприяненко, Назар Чубков, Кирилл Кулаев, Георгий Кочиев, Александр Гуда, Сергей Гуда. Коллектив работает под руководством профессора, научного руководителя направления ЮФУ Александра Солдатова.
Llama принадлежит компании Meta, которая признана экстремистской и запрещена в РФ.
Интерпретировать полученные спектры — задача сложная. Даже при наличии инструкции и верного направления анализ может занять несколько часов. От момента измерения до публикации результатов может пройти год, даже при участии профильных специалистов из квантовой химии, спектроскопии и компьютерного моделирования.
Какое решение реализовали
Чтобы упростить и ускорить анализ спектров, междисциплинарный коллектив МИИИМ ЮФУ разработал интеллектуального агента‑исследователя. Он создан на основе большой языковой модели и обучен на специально собранных базах данных с помощью авторского фреймворка PyFitIt.
Архитектура решения не зависит от конкретной LLM, агент может работать с разными моделями. Для научных задач хорошо подходят нейросети с большим числом параметров, например LLaMa 3.2 (40B) и DeepSeek R1: они обеспечивают более высокую точность логических рассуждений и позволяют формировать обоснованные и осмысленные выводы.

Общение с агентом происходит через телеграм‑бот. Пользователь загружает документ со спектром — обычный текстовый файл с данными. Система подхватывает его и запускает анализ: формирует код, разворачивает Docker®‑контейнер и выполняет расчёты на фреймворке для спектроскопии. В ответ пользователь получает результат, основанный на физических и химических закономерностях: заряд атомов, расстояния между ними и координационные числа.
Телеграм‑бот поддерживает два сценария взаимодействия:
- Пайплайн‑режим — линейная работа с подсказками, подходящая для начинающих пользователей.
- Свободный режим — пользователь задаёт промт в свободной форме, и агент сам подбирает подход к анализу.

Схема работы пользователей с интеллектуальным агентом в свободном режиме
Термин, описывающий исследования материалов или устройств в процессе их работы, то есть в реальных условиях эксплуатации, а не в лабораторных, искусственно созданных, условиях.
На всё — от запроса до ответа — уходит меньше минуты. Точность анализа при этом не только сопоставима с результатами, полученными вручную, — во многих случаях она даже выше. Особенно это заметно в сценариях, где не используются заранее подготовленные шаблоны или примеры. При этом вероятность ошибки не превышает 10%.
Почему выбрали облако
У ЮФУ есть собственный вычислительный кластер, основанный на CPU. Расширение инфраструктуры для работы с большими языковыми моделями на базе GPU потребовало бы значительных вложений. Поэтому обучение и развёртывание LLM команда реализовала в облаке — на базе Yandex Cloud при помощи Yandex DataSphere. В сервисе есть все необходимые инструменты и динамически масштабируемые облачные ресурсы для полного цикла разработки машинного обучения.
Какие результаты уже получили и что в планах
Разработанный агент позволил автоматизировать анализ спектров и сократить время обработки данных — с нескольких месяцев до одной минуты. Погрешность в предсказании ключевых значений не превышает:
- 0,2 ед. — по заряду атомов (степень окисления, отражающая, сколько электронов отдал атом металла в активном центре);
- 0,3 ед. — по координационным числам (количество ближайших атомов‑соседей);
- 0,01 Å — по расстояниям между атомами (средняя дистанция от центрального атома до окружающих).
В совокупности эти показатели позволяют исследователю‑химику понять структуру и поведение активного центра катализатора, а также признаки его деградации.
Команда планирует распространить и адаптировать агента для использования на крупных российских установках — в том числе на Курчатовском синхротроне в рамках проекта по разработке умной станции operando‑диагностики. Цель — создать удобный и надёжный инструмент, который станет «золотым стандартом» обработки данных для пользователей таких платформ. Разработка инструментов спектрального анализа ведётся при поддержке программы «Приоритет‑2030» ЮФУ.
Центр технологий для общества Yandex Cloud реализует социально значимые проекты в области образования и науки, здравоохранения, экологии и культуры. Если у вас есть похожие проекты, заполните заявку.