Clear Sky Science · ru

Интерпретируемая, гибкая и пространственно осознанная интеграция нескольких наборов данных пространственной транскриптомики из разных источников

2026-04-27 · Назад к списку

Видеть ткани как живые карты

Сейчас у биологов есть инструменты, позволяющие считывать, какие гены активны в тысячах небольших участков на срезе ткани, превращая органы, опухоли и эмбрионы в детализированные молекулярные карты. Но в каждом эксперименте используются разные приборы и настройки, поэтому полученные карты трудно сравнивать или объединять. В этой работе представлен INSPIRE — вычислительный метод, который «сшивает» эти разнообразные карты экспрессии генов в единое понятное представление, помогая учёным проследить, как строятся ткани, как они меняются при болезни и как развиваются во времени.

Figure 1. Как один метод объединяет множество пространственных карт экспрессии генов в единое понятное представление организации ткани

Почему многие карты генов трудно объединить

Современные технологии пространственной транскриптомики измеряют активность генов, сохраняя информацию о положении каждой клетки в ткани. Одни методы захватывают почти все гены, но при этом в каждой точке смешиваются несколько клеток. Другие точно локализуют отдельные клетки, но только по выбранной панели генов. Такие карты также поступают из разных лабораторий, на разных машинах, в разные моменты времени и от разных видов. В результате у каждого набора данных свои технические искажения и шум. Существующие инструменты анализа могут описать один срез или несколько похожих срезов, но часто не справляются при необходимости выровнять десятки секций, объединить разные технологии или сохранить как общие, так и уникальные особенности тканей.

Новая схема для объединения карт тканей

INSPIRE решает задачу интеграции с помощью фреймворка глубокого обучения, который учитывает и генетические сигналы, и физическую организацию клеток. Сначала для каждого среза строится «граф окрестностей», соединяющий близко расположенные точки. Графовая нейронная сеть затем преобразует исходные данные в общее внутреннее представление, которое смешивает сопоставимые клетки из разных секций, при этом позволяя сохранять секционно-специфические паттерны. Антагонистический компонент действует как критик: он выявляет, где секции ещё плохо совпадают в этом внутреннем пространстве, и подталкивает модель к улучшению выравнивания.

От скрытых паттернов к понятным признакам

После приведения данных в общее пространство INSPIRE разбивает оставшийся сигнал на набор повторяющихся пространственных паттернов, называемых факторами, каждый из которых связан с характерной генетической программой. Это достигается с помощью шага неотрицательной матричной факторизации, который поощряет представление данных как комбинации нескольких простых строительных блоков. Каждый фактор соответствует пространственному рисунку по срезам — например, конкретному слою коры мозга, ниши опухоли или области развивающегося органа. Поскольку INSPIRE также обучается, какие гены наиболее связаны с каждым фактором, исследователи могут интерпретировать эти паттерны в терминах известных типов клеток и биологических процессов, а не абстрактных чисел.

Figure 2. Как метод разъединяет смешанные карты тканей на отдельные пространственные паттерны, связанные с конкретной генетической активностью

Что INSPIRE выявляет в реальных наборах данных

Авторы показывают, что INSPIRE превосходит ряд популярных методов на симулированных и реальных наборах данных. В срезах человеческой коры мозга он выравнивает слои между донорами и восстанавливает тонкие различия между типами нейронов и вспомогательных клеток, включая нюансы расстановки, которые пропускали ручные метки. В мозге мыши он чётко отделяет общие структуры, такие как кора, от уникальных участков вроде мозжечка, одновременно правильно идентифицируя их отличительные генетические сигнатуры. INSPIRE также объединяет разные технологии, комбинируя карты одиночных клеток с более широкими обзорами, чтобы перенести детальную информацию о слоях и восстановить отсутствующие генетические паттерны, которые не были измерены напрямую.

Отслеживание болезни, развития и 3D‑структуры

Помимо здоровых тканей, INSPIRE обнаруживает скрытую вариабельность при болезни и развитии. В образцах рака молочной железы человека с сотнями тысяч клеток метод различает неинвазивные и инвазивные участки опухоли и выявляет разные подгруппы поддерживающих клеток вокруг них, связанные с известными маркерами агрессивности и ангиогенеза. В эмбрионах мыши INSPIRE интегрирует срезы, взятые на разных стадиях, чтобы построить пространственно-временной атлас, отслеживая, как такие органы, как сердце, печень, лёгкие и мозг, растут и реорганизуются. Точное выравнивание соседних срезов также поддерживает трёхмерные реконструкции органов и целых эмбрионов, превращая стопки двумерных изображений в согласованные 3D‑модели экспрессии генов.

Что это означает для будущих исследований тканей

Для неспециалиста INSPIRE можно представить как мощного переводчика, который превращает множество несовершенных, шумных карт экспрессии генов в общий язык пространственных паттернов и генетических программ. Он сохраняет контекст положения клеток в ткани, отфильтровывает технические артефакты и подчёркивает как общие, так и уникальные черты между экспериментами. По мере того как проекты пространственной транскриптомики масштабируются до целых органов, опухолей и организмов, такие методы, как INSPIRE, станут ключевыми для создания интегрированных атласов, которые учёные смогут исследовать, чтобы понять, как клетки взаимодействуют, как болезни нарушают архитектуру ткани и как сложные структуры возникают в ходе развития.

Цитирование: Zhao, J., Zhang, X., Wang, G. et al. Interpretable, flexible and spatially aware integration of multiple spatial transcriptomics datasets from diverse sources. Nat Genet 58, 1138–1150 (2026). https://doi.org/10.1038/s41588-026-02579-x

Ключевые слова: пространственная транскриптомика, архитектура ткани, карты экспрессии генов, интеграция данных, микроокружение опухоли