Clear Sky Science · ru
Топология соседства клеток указывает на выявление редких популяций клеток
Почему важны крошечные группы клеток
Наши тела состоят из огромного множества клеток, но одними из наиболее значимых участников оказываются редкие типы клеток, составляющие лишь малую долю от общего числа. Эти единичные клетки могут приводить к распространению рака, формировать патологии мозга или координировать иммунные ответы, однако их чрезвычайно трудно заметить на современных одиночноклеточных и пространственных картах тканей. В этом исследовании представлен RareQ — новый вычислительный подход, способный надежно находить такие скрытые группы клеток даже в огромных и сложных наборах данных.

Поиск паттернов в клеточных окрестностях
Традиционные методы обычно группируют клетки по уровням экспрессии генов и затем разбивают данные на кластеры. Это хорошо работает для распространённых типов клеток, но часто «поглощает» редкие типы, встраивая их в более крупные группы или считая шумом. RareQ идёт другим путём. Вместо того чтобы фокусироваться только на уровнях генов, он анализирует, как каждая клетка располагается внутри сети своих ближайших соседей. Если клетка и её ближайшие соседи очень плотно связаны между собой, но слабо связаны с остальной сетью, RareQ отмечает такую окрестность как особую. Эта идея формализована в мере Q, которая отражает, насколько «кликабельна» локальная окрестность клетки.
Преобразование клик в значимые клеточные группы
Используя Q-оценку, RareQ поэтапно строит клеточные группы. Каждая клетка начинает в собственной небольшой кластере, затем постепенно принимает метку соседа с более высоким Q в своей малой окрестности. Проще говоря, плотно связанные клеточные клики действуют как якоря, притягивающие похожие близлежащие клетки. После распространения меток метод проверяет, какие полученные кластеры сильно связаны внутри и слабо связаны с другими. Кластеры с высокой средней Q рассматриваются как кандидаты в редкие популяции, тогда как более слабые кластеры объединяются, формируя основные типы клеток. Этот процесс позволяет RareQ отделять как крупные, так и маленькие клеточные сообщества без предварительных знаний о числе типов.
Тестирование RareQ на различных тканях
Авторы протестировали RareQ на сотнях симулированных и реальных наборов данных, включая клетки крови, клетки выстилки дыхательных путей, ткани мозга, опухоли и пространственные карты. В этих тестах RareQ точнее выявлял редкие типы клеток по сравнению с семью ведущими методами, часто обнаруживая гораздо больше редких популяций с более высокой точностью и полнотой. Он также работал быстрее и использовал меньше памяти, успешно анализируя наборы данных более чем с миллионом клеток, где некоторые конкурирующие инструменты терпели неудачу. В мультимодальных данных, объединяющих активность генов с доступностью хроматина или поверхностными белками, RareQ можно было применять отдельно к каждому слою или к интегрированным представлениям, часто выявляя редкие типы клеток, невидимые для методов, основанных только на одном типе данных или тяжёлых глубоких моделях.

Выявление скрытых игроков в здоровье и болезни
Применяя RareQ к конкретным биологическим задачам, исследование демонстрирует, как эти скрытые популяции могут изменить наше представление о тканях. В дыхательных путях RareQ восстанавливал известные редкие эпителиальные клетки и обнаруживал новые подмножества, связанные с делением клеток, формированием ресничек и противовирусными ответами. В В-клеточной лимфоме и раке почки метод выявлял редкие иммунные и опухолево-ассоциированные группы, включая дендритные клетки с высокой активностью контрольных точек, которые могут влиять на ответ на иммунотерапию. В образцах мозга пациентов с болезнью Альцгеймера RareQ выделял редкие состояния микроглии и астроцитов, обогащённые у пациентов, с генными паттернами, связанными с воспалением, очисткой клеточного детрита и работой с амилоидными белками. В высокоразрешающих пространственных наборах данных мышиного мозга он обнаруживал небольшие анатомически точные популяции, такие как отдельные субрегионы нейронов в гиппокампе и специализированные ресничные эпителиальные клетки в сосудистой сплетении, которые другие методы либо пропускали, либо смешивали.
Что это значит для будущих карт клеток
Для неспециалиста ключевая мысль в том, что RareQ предлагает более чувствительный и эффективный способ находить редкие типы клеток, которые часто выступают в роли регуляторов болезней и функций ткани. Сосредоточившись на том, как клетки связаны с соседями, а не только на сырых уровнях генов, RareQ способен выделять маленькие, но когерентные группы клеток из огромных коллекций данных. Это делает будущие атласы клеток более полными и открывает возможности для изучения ускользающих клеточных состояний, которые могут стать мишенями для диагностики или терапии.
Цитирование: Fa, B., Huang, C., Ma, Y. et al. Cell neighborhood topology directs rare cell population identification. Nat Commun 17, 4618 (2026). https://doi.org/10.1038/s41467-026-71180-x
Ключевые слова: редкие клетки, анализ одиночных клеток, пространственная транскриптомика, клеточные сети, вычислительная биология