Clear Sky Science · ru

От «негативного» испытания до положительного клинического влияния: снижение временной селекционной ошибки, вызванной критериями допустимости, в эмулируемых клинических испытаниях

· Назад к списку

Почему важно, кто попадает в испытание

Когда сообщают, что клиническое испытание не выявило разницы между двумя методами лечения, возникает искушение считать дело закрытым. Но что происходит, когда врачи или исследователи пытаются затем воспроизвести это испытание, опираясь на реальные записи повседневной практики? В этом исследовании показано, что правила отбора участников в «копировавшем» испытании могут незаметно искривлять результаты — иногда в большей степени, чем прошедшее время или изменения в медицинской практике.

Figure 1. Как крупные исследования на основе медицинских записей воспроизводят испытание препарата для сердца и как отбор пациентов меняет общий итог.
Figure 1. Как крупные исследования на основе медицинских записей воспроизводят испытание препарата для сердца и как отбор пациентов меняет общий итог.

От контролируемого исследования к реальной практике

Оригинальное испытание WARCEF сравнивало два антикоагулянта — варфарин и аспирин — у людей с сердечной недостаточностью и сниженной сократительной функцией сердца, но без широко распространенного нарушением ритма — фибрилляции предсердий. В этом тщательно организованном эксперименте более 2300 добровольцев были случайным образом распределены на один из препаратов, и исследование не выявило явного преимущества ни одного из них по снижению смертности. Позже рекомендации не стали поддерживать рутинное длительное назначение варфарина аналогичным пациентам с сердечной недостаточностью без ясного показания, отчасти потому, что уменьшение риска инсульта компенсировалось возрастанием серьезных кровотечений.

Воспроизведение WARCEF с помощью медицинских записей

Новое исследование спросило, что получится, если попытаться «эмулировать» WARCEF на данных электронных медицинских карт Клиники Мэйо. Вместо рандомизации препаратов исследователи посмотрели на тысячи пациентов, которым в рутинной практике были выписаны либо аспирин, либо варфарин до и после завершения испытания WARCEF в 2014 году. Они применили статистические методы выравнивания явных различий между группами и использовали подход «намерение лечить», считая людей в составе той группы, с которой они начали, даже если позже лечение менялось, чтобы имитировать логику оригинального исследования.

Неожиданное изменение после 2014 года

На первый взгляд результаты указывали на важную смену во времени. Среди пациентов, лечившихся до 2014 года, разницы в показателях смертности между двумя препаратами не наблюдалось, что повторяло результаты оригинального испытания. Но среди пациентов, лечившихся после 2014 года, варфарин ассоциировался со значительно более высоким риском смерти по сравнению с аспирином. При объединении всех годов общая картина оказалась формируемой в основном за счет пациентов после 2014 года, и аспирин выглядел явно безопаснее. Такая схема могла бы навести на мысль, что после публикации результатов испытания и новых рекомендаций способ использования варфарина в клинической практике изменился, и его кажущееся качество ухудшилось.

Как одно правило допустимости исказило картину

Тем не менее более внимательный анализ показал иную картину. Чтобы оставаться верными протоколу испытания, команда попыталась применить многие те же критерии включения, в том числе показатель Modified Rankin Score, описывающий степень инвалидности после инсульта. В реальных записях этот показатель часто фиксируется с задержкой или вовсе отсутствует. Требование наличия этого значения до момента включения в исследование означало, что многие ранние смерти просто не фиксировались, что делало кривые выживаемости искусственно плоскими в течение нескольких лет. Когда исследователи убрали это единственное правило, странное плато исчезло, и 2014 год перестал выглядеть особенным. При разных датах отсечения повторялась та же история: выбор критериев допустимости, а не календарная дата, объяснял большую часть различий в эффектах препаратов.

Figure 2. Как строгие фильтры при наборе участников незаметно отсрочивают и исключают ранние смерти, искажающие видимую безопасность двух сердечных препаратов.
Figure 2. Как строгие фильтры при наборе участников незаметно отсрочивают и исключают ранние смерти, искажающие видимую безопасность двух сердечных препаратов.

Уроки для работы с крупными медицинскими данными

Исследование подчеркивает, что построение «похожих на испытание» исследований на основе медицинских записей — это не просто копирование дат и названий лекарств. Каждый критерий включения и исключения должен быть переведен в данные, которые могут быть неполными, запаздывающими или фиксироваться только у определенных пациентов. Правило, кажущееся безобидным на бумаге, на практике может отфильтровывать именно тех людей, у которых случаются ранние неблагоприятные исходы, и тем самым смещать сравнение между лечениями. Авторы настаивают на том, что важно тщательно тестировать, как каждый критерий меняет состав участников и время наступления событий, чтобы избежать скрытой селекционной ошибки.

Что это означает для пациентов и врачей

Для пациентов с сердечной недостаточностью и их врачей эта работа не отменяет выводы оригинального испытания WARCEF и текущие клинические рекомендации. Скорее это предостерегающая история о том, как следует интерпретировать «реальные» исследования, пытающиеся имитировать испытания. Различия в результатах с течением времени могут отражать способы отбора и наблюдения за пациентами, а не внезапные изменения в действии препарата. Взвешенная методология и прозрачная отчетность о выборе критериев допустимости необходимы, если мы хотим, чтобы исследования на больших массивах медицинских данных действительно информировали повседневную практику.

Цитирование: Li, X., Rajaganapathy, S., Hu, X. et al. From “negative” trial to positive clinical impact: mitigating eligibility criteria–induced temporal selection bias in emulated clinical trials. npj Health Syst. 3, 36 (2026). https://doi.org/10.1038/s44401-026-00082-3

Ключевые слова: эмуляция испытаний, критерии допустимости, сердечная недостаточность, варфарин против аспирина, электронные медицинские записи