Clear Sky Science · ru
ProteoAutoNet: высокопроизводительный анализ ко-элюированных белков с применением робототехники и машинного обучения
Почему важно понимать партнёрства белков
Внутри каждой клетки белки редко действуют в одиночку. Они объединяются в динамичные союзы, чтобы создавать структуры, копировать ДНК, утилизировать повреждённые участки и обеспечивать рост. Многие виды рака перехватывают эти взаимодействия, но подробное картирование партнёрств шло медленно и кропотливо. В этом исследовании представлена система ProteoAutoNet на основе робототехники и машинного обучения, которая значительно ускоряет обнаружение белковых взаимодействий в клетках и показывает, как этот подход может выявлять скрытые уязвимости при раке щитовидной железы.

Создание более быстрой фабрики по выявлению белковых партнёрств
Традиционно учёные используют метод ко-фракционирования с масс-спектрометрией, чтобы разделить крупные белковые комплексы и затем идентифицировать их компоненты. Хотя метод мощный, он трудоёмок и имеет низкую пропускную способность: подготовка сотен фракций вручную может занять много дней. Авторы построили платформу с поддержкой робототехники, которая автоматизирует большую часть этого рабочего процесса. Содержимое клеток сначала осторожно разрушали, чтобы сохранить естественные белковые комплексы, затем пропускали через колонки по размеру, разделяя на десятки фракций. Жидкостные роботы и роботизированные манипуляторы затем вводят реагенты, переваривают белки на более мелкие фрагменты, очищают образцы и подают их в масс-спектрометр для измерения. Такая установка может обработать до 540 фракций из нескольких линий клеток щитовидной железы всего за два-три дня, примерно вдвое увеличивая пропускную способность по сравнению с прежними полуавтоматизированными системами.
Роботы, которые не просто быстрее, но и надёжнее
Один лишь рост скорости недостаточен, если результаты шумны или непоследовательны. Команда тщательно проверила, соответствует ли робо-пайплайн по качеству традиционной ручной обработке или превосходит её. На контрольных образцах они показали, что автоматизированная система постоянно выявляет почти 3000 белков на линию клеток щитовидной железы с очень большим пересечением между репликантами и хорошим согласием в измерениях количества белков. При прямом сравнении роботизированной и ручной обработки одинаковых образцов оба подхода обнаруживали похожие числа белков, но роботизированный метод давал немного меньшую изменчивость в подсчетах и более стабильные измерения уровней белков. Это значит, что новая платформа не только экономит время и труд, но и обеспечивает более воспроизводимые эксперименты — критически важное требование для крупных исследований и клинического применения.
Обучение компьютеров распознавать значимые связи
Даже при использовании быстрых приборов остаётся ключевая задача: решить, какие белки действительно взаимодействуют, а какие просто совпадают по фракциям случайно. Для этого авторы объединили курированную базу данных белковых комплексов с моделью машинного обучения на базе алгоритма XGBoost. Сначала они очистили и слили три основных ресурса по белковым комплексам, в результате получив 96 635 известных белково‑белковых взаимодействий. Затем профили появления белков по фракциям использовали как входные признаки, а пары белков маркировали как вероятных партнёров или не‑партнёров на основе баз данных. Поскольку надёжные положительные примеры относительно редки, применили целевую стратегию увеличения данных: создали множество чуть искажённых версий известных положительных примеров, чтобы научить модель распознавать устойчивые шаблоны, а не запоминать конкретные следы. Обученная на десятках миллионов таких примеров из трёх линий клеток щитовидной железы, модель показала высокую эффективность, правильно ранжируя истинные взаимодействия значительно выше случайного как в внутренних тестах, так и на независимой линии валидации.
Новые взгляды на клеточные машины рака
Вооружённые этим рабочим процессом, исследователи построили сети взаимодействий в нормальной линии клеток щитовидной железы и двух раковых линиях: папиллярного рака щитовидной железы и фолликулярной карциномы, способной метастазировать в лёгкие. Во всех этих клетках они выявили более 25 000 вероятных белковых взаимодействий и обнаружили сильные сигналы от известных клеточных машин, таких как рибосомы (строят белки) и протеасомы (разрушают их), что подтверждает способность метода восстанавливать устоявшуюся биологию. Сравнивая раковые клетки с нормальной линией, они обнаружили сети, активированные в патологии. В метастатической фолликулярной карциноме компоненты протеасомы и шаперонный комплекс префолдин были заметно более связаны и более представлены. Несколько субъединиц префолдина ранее связывали с другими типами рака, но глобальные протеомные обследования пропускали их согласованное поведение при раке щитовидной железы, возможно, потому что эти белки строго контролируются деградацией. Подход ко-фракционирования выявил их скоординированные изменения на уровне комплексов.

Скрытые связи, которые могут указать путь для будущих терапий
Исследование также выделило конкретные взаимодействия, которые могут быть важны для роста и распространения рака щитовидной железы. Один пример — предсказанное партнерство между HK1, ферментом, запускающим основной путь утилизации сахара в клетке, и TGM2, белком, известным стимулировать инвазии и метастазирование в опухолях щитовидной железы. Эта связь HK1–TGM2, отсутствующая в существующих базах взаимодействий, была подтверждена структурным моделированием и оказалась особенно активной в линии папиллярной карциномы, что наводит на мысль о возможной физической связи между метаболической перенастройкой и инвазивным поведением. В совокупности ProteoAutoNet демонстрирует, как сочетание робототехники и машинного обучения может превратить медленное, требующее экспертной оценки картирование белковых сетей в более масштабируемый процесс. Для неспециалистов главный вывод таков: эта технология может выявлять как широкие сдвиги в клеточной машине, так и неожиданные белковые партнёрства, которые со временем могут помочь врачам точнее предсказывать агрессивность некоторых раков щитовидной железы и предложить новые мишени для терапии.
Цитирование: Lyu, M., Hu, P., Zhang, G. et al. ProteoAutoNet: high-throughput co-eluted protein analysis with robotics and machine learning. Nat Commun 17, 1949 (2026). https://doi.org/10.1038/s41467-026-68686-9
Ключевые слова: взаимодействия белков, масс-спектрометрия, машинное обучение в биологии, рак щитовидной железы, протеасома и префолдин