Помогаем врачам с помощью ИИ улучшить качество жизни людей после острого коронарного синдрома

НМИЦ кардиологии им. ак. Е. И. Чазова Минздрава России при поддержке Центра технологий для общества Yandex Cloud запустил цифровой регистр пациентов, перенёсших острый коронарный синдром.

ИИ-система автоматически анализирует медицинские документы, помогает отслеживать пациентов высокого риска и ускоряет принятие решений о дальнейшей терапии.

О проекте

Болезни системы кровообращения — одна из основных причин смертности в России. ОКС — наиболее рисковая форма ишемической болезни сердца, включающая острый инфаркт миокарда и нестабильную стенокардию. Внедрение современных способов лечения позволило существенно снизить летальность в госпитальном периоде. Но пациенты, перенесшие ОКС, относятся к крайне высокому риску последующих сердечно-сосудистых осложнений, смертность в этой категории больных составляет до 20% в течение четырёх лет.

По инициативе НМИЦК им. ак. Е. И. Чазова совместно с Центром технологий для общества создали региональный регистр пациентов с ОКС. Система объединила более 13 тыс. медицинских документов из сосудистых центров Тульской области за 2021–2025 годы.

Применение ИИ

Решение на базе больших языковых моделей обеспечивает безопасную обработку данных: анализ проводится без передачи персональной информации. Система извлекает разнообразные данные из суммирующих медицинских документов (эпикризов, выписок), распознавая медицинские термины, включая аббревиатуры, латинские названия, опечатки и нюансы текста.

Ускорение работы

Автоматизация с помощью искусственного интеллекта ускорила обработку данных в десятки раз: решение анализирует документы за секунды вместо часов ручного ввода, работая круглосуточно. Благодаря этому снижается объём рутинной непрофильной работы, а врачи используют регулярно пополняемый инструмент со структурированной информацией о пациентах, а также возможности аналитики и визуализации данных, что способствует улучшению диспансерного наблюдения и снижению риска неблагоприятных исходов.

Гибкость и контроль

Система использует двухконтурную модель. Регион хранит персональные данные и ведёт лечение пациентов, а НМИЦК работает только с агрегированной статистикой. Уникальные идентификаторы (УИН) позволяют связывать документы одного пациента без раскрытия личности. Инструмент универсален: его можно адаптировать для других нозологий — онкологии, гинекологии и других направлений — без программирования, добавив новую схему извлечения данных.

Этапы создания решения

Формирование задачи и запрос данных

Инициатором выступил НМИЦ кардиологии им. ак. Е. И. Чазова. Первоочередной целью проекта стало создание автоматизированного регистра для мониторинга пациентов с ОКС и контроля качества помощи в регионе.

Для этого были выбраны данные Тульской области (около 3,5 тыс. случаев за последние 5 лет), которые находились в неструктурированном виде. Их обработка и систематизация позволили не только запустить регистр, но и сформировать качественный датасет, который в перспективе станет основой для разработки прогнозных моделей.

Разработка обезличивателя и парсера

Поскольку готовых инструментов не существовало, создали два компонента:

  • Модуль обезличивания и связывания: удаляет персональные данные и присваивает уникальные идентификаторы (УИН), объединяя документы одного пациента из разных больниц даже без СНИЛС.

  • Модуль извлечения признаков на базе больших языковых моделей: распознает заданные параметры обследования и лечения пациента в текстах любой структуры. Пользователь сам задаёт набор извлекаемых полей — от нескольких параметров до расширенных схем анализа.

Создание регистра и тестирование

Сформировали первый полный регистр на основе более 13 тыс. эпикризов с 2021 года, разделив работу с персональными и обезличенными данными: персональная информация осталась в регионе для контроля лечения, а в НМИЦ Чазова поступила только агрегированная статистика для науки. Такая архитектура позволила вести исследования без вывода персональных данных за пределы медицинской организации и сразу заменила ручной сбор отчётов на автоматический мониторинг.

Подготовка датасета для моделей

На выходе проекта получили структурированный регистр и готовый датасет, очищенный от персональных данных. Это создало нужную информационную базу для работы с данными и дальнейших разработок.

Как работает решение

Разверните и настройте приложение, создайте схемы данных, стратегии обработки данных и валидации.

Загрузите свои документы.

Назначьте соответствие документов схемам данных и запустите обработку.

Посмотрите результаты и при необходимости донастройте схемы. Скачайте результаты обработки. Получите готовый структурированный регистр для мониторинга пациентов и анализа рисков.

Технические аспекты реализации

Решение состоит из модуля для обезличивания документов и модуля для извлечения признаков на базе больших языковых моделей: YandexGPT Lite и Alice AI LLM (модели доступны на платформе Yandex AI Studio). Система не использует жёсткие шаблоны и умеет извлекать более 90 параметров из суммирующих медицинских документов — эпикризов и выписок пациентов. Алгоритмы идентифицируют диагноз, включая сопутствующие заболевания и осложнения, анамнез, данные общего осмотра, результаты инструментальных и лабораторных обследований, сведения об оперативном и фармакологическом лечении.

Система работает внутри защищённого контура региона: сначала обезличивает документы и присваивает им уникальные идентификаторы (УИН), чтобы связать данные одного пациента из разных медицинских организаций. Затем алгоритмы извлекают клинические данные и формируют структурированный массив, на основе которого регион может создавать регистры и аналитические датасеты, сохраняя полный контроль над информацией.
Подробности читайте в статье.

Результаты

Создали универсальный конструктор регистров

Разработали универсальный автоматизированный инструмент для извлечения данных из различных медицинских документов (эпикризов, выписок), который можно без программирования перенастроить с кардиологии на онкологию и другие нозологии.

Обеспечили сквозной мониторинг пациентов

Внедрили архитектуру с уникальными идентификаторами (УИН), которая позволяет региону отслеживать персональные риски пациентов, а НМИЦ — анализировать агрегированную статистику в аналитических и исследовательских целях.

Ускорили анализ данных и снизили нагрузку на врачей

Автоматизировали обработку 90 полей за секунды вместо часов ручного ввода. Это позволило определить пациентов в зоне риска и начать работу по улучшению клинических исходов.

Что планируем делать дальше

Масштабировать решение на новые регионы и нозологии

Масштабировать подход для формирования региональных регистров в других регионах ЦФО и адаптировать систему для работы с другими заболеваниями, включая онкологические.

Улучшить качество извлечения и визуализацию данных

Расширить возможности системы: извлекать не только отдельные параметры, но и связи между ними, чтобы формировать графовую структуру данных вместо плоского списка полей. Это позволит автоматически выявлять пропущенные логические связи, дорабатывать обработку последующих осмотров пациентов и внедрить наглядную графовую визуализацию регистра.

Наша команда

В медицинских IT-проектах мы сталкиваемся с задачами обезличивания практически постоянно, но каждая организация решает эту задачу по-своему. Это связано с тем, что на российском рынке до сих пор не было гибких инструментов, которые можно настроить под конкретные данные и задачи — чаще используются встроенные решения, выполняющие обезличивание по шаблону. Между тем стратегия обезличивания должна подбираться под задачу, чтобы сохранить ценность медицинских данных и при этом надёжно защитить персональную информацию пациентов.

Евгений Попов

Руководитель проектов по направлению «Медицина» в Yandex Cloud

Наши проекты