Clear Sky Science · ru
Новый подход к раннему прогнозированию преэклампсии с учётом предиктивной неопределённости из‑за отсутствующих данных в клинической базе
Почему это важно для матерей и детей
Преэклампсия — опасное осложнение беременности, которое может внезапно угрожать жизни матери и ребёнка. Врачи знают, что простые меры, например назначение низкой дозы аспирина очень рано в беременности, могут существенно снизить риск у женщин, склонных к развитию этого состояния. Задача — вовремя выявить такие беременные и делать это надёжно, хотя реальные медицинские записи часто неполны. В этом исследовании предложен новый способ раннего прогнозирования преэклампсии, который также сообщает врачам, насколько им следует доверять каждому прогнозу.
Понимание «тихой» угрозы беременности
Преэклампсия встречается в 2–8% беременностей во всём мире. Обычно она проявляется позднее в беременности, но её причины формируются гораздо раньше. При преэклампсии у матери могут страдать почки, печень, головной мозг и другие органы, а в тяжёлых случаях и мать, и ребёнок могут погибнуть. Плод может тормозиться в развитии или потребоваться преждевременное родоразрешение. Поскольку начало приёма низкой дозы аспирина до 16-й недели беременности может снизить риск ранней преэклампсии более чем наполовину, возможность выявлять женщин с высоким риском в первом триместре может радикально изменить уход. Опора лишь на опыт клинициста, однако, оказалась слишком ненадёжной для таких ответственных решений.

Как превратить «грязные» медицинские записи в полезные предупреждения
За последнее десятилетие многие исследовательские группы использовали методы машинного обучения для прогнозирования преэклампсии по рутинным клиническим и лабораторным данным. Такие модели обычно достигают умеренной точности, но у всех есть одна серьёзная проблема: они предполагают, что каждый прогноз одинаково заслуживает доверия, даже когда в карте пациента отсутствуют ключевые результаты обследований. В реальной дородовой практике часто пропускают анализы крови и контрольные визиты, особенно в загруженных амбулаторных условиях. Это делает крупные больничные базы данных заполненными пробелами. Ранние исследования в основном игнорировали, как эти пробелы влияют на уверенность в каждом прогнозе, что могло скрывать истинный потенциал моделей.
Добавление «измерителя честности» к оценкам риска
Авторы проанализировали записи более чем 31 000 одноплодных беременностей в трёх больницах Кореи, используя информацию, собранную до 16-й недели гестации. Они построили модель прогнозирования, выдающую оценку риска преэклампсии от 0 до 1. Затем к ней добавили второе число — показатель неопределённости, отражающий, насколько отсутствие данных может подрывать этот прогноз. Для этого они изучили, насколько сильно каждая клиническая или лабораторная переменная обычно сдвигает риск вверх или вниз у женщин с полными данными. Переменные, которые сильно влияют на модель — такие как среднее артериальное давление, большой интервал с момента предыдущей беременности или первородство, определённые беременные белки и уровень HDL‑холестерина — признаны более важными. Если для конкретной женщины отсутствовала такая ключевая переменная, её балл неопределённости повышался сильнее, чем при отсутствии менее значимого показателя.
Что происходит, когда доверяешь только более «чистым» сигналам
Имея этот показатель неопределённости, команда проверила, как модель работает при фокусе только на беременностях с относительно полными и информативными данными. Во внутреннем тестировании, когда они игнорировали неопределённость и использовали всех женщин, способность модели различать, кто разовьёт преэклампсию, была хорошей, но не выдающейся. По мере того как они постепенно ограничивали оценку женщинами с более низкими показателями неопределённости — то есть с меньшим количеством или менее критичными пропусками — точность стабильно возрастала. При умеренном уровне неопределённости производительность модели уже превосходила предыдущие отчёты; при очень низкой неопределённости точность становилась заметно высокой, почти полностью правильно выявляя будущие случаи преэклампсии и генерируя мало ложных тревог. Подобная картина наблюдалась и при тестировании на данных независимой больницы, что указывает на устойчивость подхода даже в разных клиниках и среди разных групп пациентов.

Подсказки для лучшего тестирования и будущей помощи
Поскольку метод учитывает, насколько каждая переменная вносит вклад в неопределённость, он может подсказать, какие измерения стоит собирать в первую очередь на ранних сроках беременности. Анализ показал, что ни один отдельный тест не даёт полной картины: множество переменных каждая вносит маленький, но важный фрагмент информации. Рамочная структура гибка и может сочетаться с другими, более сложными моделями машинного обучения или быть расширена на другие редкие осложнения беременности. При этом авторы предупреждают, что их работа является предварительной, в основном основана на корейских женщинах с одноплодными беременностями, и что самые впечатляющие оценки точности получены в небольших подгруппах с низкой неопределённостью, где очень мало случаев преэклампсии. Потребуются более разнообразные исследования и тщательный подбор порогов принятия решений, прежде чем такой инструмент сможет повлиять на практическую помощь.
Что это значит для будущих семей
Это исследование пока не предлагает клинически готового теста, но указывает путь к более умным и прозрачным инструментам прогнозирования. Вместо простого показателя риска будущие системы могли бы также сообщать, насколько они уверены в своём выводе, помогая врачам избежать излишней уверенности, когда важные фрагменты информации отсутствуют. Изучая, какие рутинные измерения наиболее значимы и как работать с несовершенными данными, эта работа закладывает основу для более безопасного и раннего выявления беременностей с риском преэклампсии — давая больше времени для защиты здоровья матери и ребёнка.
Цитирование: Kim, J.W., Kim, N., Kim, J.Y. et al. A novel approach to preeclampsia early prediction addressing predictive uncertainty due to missing data in clinical dataset. Sci Rep 16, 8455 (2026). https://doi.org/10.1038/s41598-025-27801-4
Ключевые слова: преэклампсия, прогнозирование риска беременности, машинное обучение в акушерстве, неопределённость клинических данных, здоровье матери