
Помогаем врачам с помощью ИИ улучшить качество жизни людей после острого коронарного синдрома
Помогаем врачам с помощью ИИ улучшить качество жизни людей после острого коронарного синдрома
НМИЦ кардиологии им. ак. Е. И. Чазова Минздрава России при поддержке Центра технологий для общества Yandex Cloud запустил цифровой регистр пациентов, перенёсших острый коронарный синдром.
ИИ-система автоматически анализирует медицинские документы, помогает отслеживать пациентов высокого риска и ускоряет принятие решений о дальнейшей терапии.
О проекте
Болезни системы кровообращения — одна из основных причин смертности в России. ОКС — наиболее рисковая форма ишемической болезни сердца, включающая острый инфаркт миокарда и нестабильную стенокардию. Внедрение современных способов лечения позволило существенно снизить летальность в госпитальном периоде. Но пациенты, перенесшие ОКС, относятся к крайне высокому риску последующих сердечно-сосудистых осложнений, смертность в этой категории больных составляет до 20% в течение четырёх лет.
По инициативе НМИЦК им. ак. Е. И. Чазова совместно с Центром технологий для общества создали региональный регистр пациентов с ОКС. Система объединила более 13 тыс. медицинских документов из сосудистых центров Тульской области за 2021–2025 годы.
Этапы создания решения
Формирование задачи и запрос данных
Инициатором выступил НМИЦ кардиологии им. ак. Е. И. Чазова. Первоочередной целью проекта стало создание автоматизированного регистра для мониторинга пациентов с ОКС и контроля качества помощи в регионе.
Для этого были выбраны данные Тульской области (около 3,5 тыс. случаев за последние 5 лет), которые находились в неструктурированном виде. Их обработка и систематизация позволили не только запустить регистр, но и сформировать качественный датасет, который в перспективе станет основой для разработки прогнозных моделей.
Разработка обезличивателя и парсера
Поскольку готовых инструментов не существовало, создали два компонента:
-
Модуль обезличивания и связывания: удаляет персональные данные и присваивает уникальные идентификаторы (УИН), объединяя документы одного пациента из разных больниц даже без СНИЛС.
-
Модуль извлечения признаков на базе больших языковых моделей: распознает заданные параметры обследования и лечения пациента в текстах любой структуры. Пользователь сам задаёт набор извлекаемых полей — от нескольких параметров до расширенных схем анализа.
Создание регистра и тестирование
Сформировали первый полный регистр на основе более 13 тыс. эпикризов с 2021 года, разделив работу с персональными и обезличенными данными: персональная информация осталась в регионе для контроля лечения, а в НМИЦ Чазова поступила только агрегированная статистика для науки. Такая архитектура позволила вести исследования без вывода персональных данных за пределы медицинской организации и сразу заменила ручной сбор отчётов на автоматический мониторинг.
Подготовка датасета для моделей
На выходе проекта получили структурированный регистр и готовый датасет, очищенный от персональных данных. Это создало нужную информационную базу для работы с данными и дальнейших разработок.
Как работает решение
Разверните и настройте приложение, создайте схемы данных, стратегии обработки данных и валидации.
Загрузите свои документы.
Назначьте соответствие документов схемам данных и запустите обработку.
Посмотрите результаты и при необходимости донастройте схемы. Скачайте результаты обработки. Получите готовый структурированный регистр для мониторинга пациентов и анализа рисков.
Технические аспекты реализации
Решение состоит из модуля для обезличивания документов и модуля для извлечения признаков на базе больших языковых моделей: YandexGPT Lite и Alice AI LLM (модели доступны на платформе Yandex AI Studio). Система не использует жёсткие шаблоны и умеет извлекать более 90 параметров из суммирующих медицинских документов — эпикризов и выписок пациентов. Алгоритмы идентифицируют диагноз, включая сопутствующие заболевания и осложнения, анамнез, данные общего осмотра, результаты инструментальных и лабораторных обследований, сведения об оперативном и фармакологическом лечении.
Система работает внутри защищённого контура региона: сначала обезличивает документы и присваивает им уникальные идентификаторы (УИН), чтобы связать данные одного пациента из разных медицинских организаций. Затем алгоритмы извлекают клинические данные и формируют структурированный массив, на основе которого регион может создавать регистры и аналитические датасеты, сохраняя полный контроль над информацией.
Подробности читайте в статье.

Результаты

Что планируем делать дальше
Масштабировать решение на новые регионы и нозологии
Масштабировать подход для формирования региональных регистров в других регионах ЦФО и адаптировать систему для работы с другими заболеваниями, включая онкологические.
Улучшить качество извлечения и визуализацию данных
Расширить возможности системы: извлекать не только отдельные параметры, но и связи между ними, чтобы формировать графовую структуру данных вместо плоского списка полей. Это позволит автоматически выявлять пропущенные логические связи, дорабатывать обработку последующих осмотров пациентов и внедрить наглядную графовую визуализацию регистра.

В медицинских IT-проектах мы сталкиваемся с задачами обезличивания практически постоянно, но каждая организация решает эту задачу по-своему. Это связано с тем, что на российском рынке до сих пор не было гибких инструментов, которые можно настроить под конкретные данные и задачи — чаще используются встроенные решения, выполняющие обезличивание по шаблону. Между тем стратегия обезличивания должна подбираться под задачу, чтобы сохранить ценность медицинских данных и при этом надёжно защитить персональную информацию пациентов.
Евгений Попов
Руководитель проектов по направлению «Медицина» в Yandex Cloud




































