Clear Sky Science · ru

Комплексный европейский набор данных по когортам колоректального рака

· Назад к списку

Почему важен общий пул данных о раке

Колоректальный рак — один из самых смертоносных видов рака в мире, и врачи по-прежнему испытывают трудности с предсказанием, у каких пациентов будет благоприятный исход и кому потребуется дополнительное лечение. В этой статье описывается крупная европейская инициатива по объединению подробной информации более чем о десяти тысячах пациентов в одном тщательно проверенном ресурсе. Гармонизируя больничные записи, образцы тканей, микроскопические изображения и данные ДНК из разных стран, проект создаёт мощную основу для более ранней диагностики, более умных терапий и новых инструментов с поддержкой компьютера для лечения рака.

Общепризнанная европейская инициатива против распространённого рака

Колоректальный рак развивается медленно, часто в течение многих лет, что делает его привлекательной целью для скрининга и профилактики. Современные тесты варьируются от простых анализов кала до более инвазивных процедур, таких как эндоскопия; врачи также учитывают генетические изменения и другие «биомаркеры» для выбора терапии. Однако лишь немногие биомаркеры прочно внедрены в клиническую практику, и остаётся много вопросов, например, как лучше лечить пациентов со среднетяжёлыми стадиями заболевания. Чтобы заполнить эти пробелы, Инфраструктура исследований биобанкинга и биомолекулярных ресурсов (BBMRI-ERIC) координировала работу 26 биобанков в 12 европейских странах для создания совместной когорты колоректального рака, включающей 10 780 пациентов, у всех которых имеется стандартизированная базовая информация и связанные биологические образцы.

Figure 1
Figure 1.

Что именно входит в когорту?

Когорта даёт объёмную картину истории каждого пациента. В неё включены возраст, пол, детали диагноза, факторы риска, проведённые лечения и долгосрочная выживаемость, с особым вниманием к пациентам, наблюдаемым не менее пяти лет. Хранятся сведения об опухоли при микроскопическом исследовании, стадия заболевания и ключевые молекулярные характеристики, такие как определённые мутации генов и нарушения репарации ДНК. Помимо клинических данных, набор связан с образцами тканей, сохранёнными в больничных биобанках, более чем тремя тысячами цифровых слайдов колоректальных опухолей высокого разрешения и данными полного геномного секвенирования сотен пациентов. В совокупности эти уровни позволяют сопоставить то, что видят патологы, что показывает ДНК, и как на самом деле развивалось заболевание у пациентов с течением времени.

Преобразование разрозненных записей в единый согласованный ресурс

Создание такого ресурса далось нелегко. Каждый биобанк изначально хранил информацию в собственных форматах, часто в виде простых таблиц, и следовал разным локальным правилам и техническим стандартам. Команды проекта разработали общую модель данных через многократные обсуждения между врачами, патологами, IT‑специалистами и сотрудниками биобанков, согласовав, какие элементы информации являются обязательными и как их следует определять. Затем они создали программные инструменты для преобразования разнообразных локальных таблиц в единый структурированный формат и для сопоставления данных с широко используемыми медицинскими стандартами. Представляя одну и ту же информацию в форматах, таких как openEHR, OMOP и FHIR, когорту становится проще интегрировать с многочисленными больничными системами и исследовательскими платформами, что увеличивает её доступность и повторное использование.

Сохранение точности, конфиденциальности и полезности данных

Поскольку данные поступали из повседневной клинической практики и множества учреждений, качество и приватность были ключевыми задачами. Каждая запись лишалась прямых личных идентификаторов до передачи, и каждому пациенту присваивался кодированный идентификатор, который только исходный биобанк может сопоставить с человеком. Автоматизированные проверки оценивают, насколько правдоподобны и согласованы даты, возраст, стадии опухоли и лечения; подозрительные записи, например операции после зарегистрированной даты смерти, приводят к обратной связи с вкладом‑дающим биобанком для исправления. В статье также описана структурированная процедура доступа: исследователи из любой точки мира могут подать заявку на использование когорты, но специализированный комитет рассматривает каждую просьбу с точки зрения этики, принципа минимизации данных и соответствия целям когорты. Биобанки сохраняют за собой право возразить против передачи данных, если это противоречит местным правовым нормам или условиям согласия.

Figure 2
Figure 2.

Как исследователи могут использовать этот ресурс

Авторы связали набор данных с современными инструментами анализа, чтобы утверждённые пользователи могли безопасно работать с ним. Специализированный веб‑портал позволяет комбинированно просматривать клинические данные, генетические изменения и изображения цифровой патологии, поддерживая исследования от поиска новых биомаркеров до обучения систем искусственного интеллекта распознаванию паттернов опухолей. Системы защищённой передачи и шифрование обеспечивают безопасность данных при их переносе в вычислительные среды исследователей. Команда также поощряет исследователей возвращать производные результаты, такие как новые оценочные шкалы риска или методы анонимизации, чтобы когорте постоянно прибавлялась ценность.

Что это означает для пациентов и медицины

Для широкого читателя ключевое послание состоит в том, что проект создал общий, высококачественный «референтный каталог» реальных случаев колоректального рака по всей Европе. Вместо того чтобы каждая больница работала с небольшими изолированными наборами данных, учёные теперь могут изучать закономерности на тысячах пациентов, проверять результаты на разнообразных популяциях и тестировать новые диагностические инструменты надёжным образом. Хотя сама когорта не представляет собой единого нового теста или лекарства, она закладывает основу для более раннего выявления, более точной терапии и лучшего применения искусственного интеллекта в патологии. На практическом уровне такой продуманный подход к обмену данными может ускорить открытия, которые когда‑нибудь помогут врачам решить, кому действительно нужна химиотерапия, кто может безопасно её избежать и как выявлять опасные опухоли до их распространения.

Цитирование: Holub, P., Törnwall, O., Garcia Alvarez, E. et al. A comprehensive European Colorectal Cancer Cohort dataset. Sci Data 13, 662 (2026). https://doi.org/10.1038/s41597-026-06822-2

Ключевые слова: колоректальный рак, данные биобанка, цифровая патология, геномная когорта, обмен медицинскими данными