Clear Sky Science · ru
От последовательности к структуре: выводы о биофизических свойствах Ласса-вируса на популяционном уровне и каталог структуры гликопротеина
Почему важны крошечные изменения в вирусе
Лихорадка Ласса поражает десятки тысяч человек в Западной Африке ежегодно, но вакцины до сих пор нет. Вирус, её вызывающий — Ласса-вирус — представлен несколькими региональными вариантами, или линиями, которые различаются по тяжести вызываемого заболевания и чувствительности к антителам. В этом исследовании поставлен простой, но мощный вопрос: насколько физически различаются эти вирусные линии друг от друга и могут ли эти различия помочь учёным в разработке более эффективных вакцин и терапий? 
Рассматривая вирус как набор частей
Исследователи рассматривали вирус как сконструированный объект, состоящий из четырёх основных частей: поверхностного шипа, обеспечивающего вход в клетки; оболочки, упаковывающей генетический материал; фермента, копирующего геном; и небольшого белка, помогающего формированию новых частиц. Они собрали сотни качественных последовательностей из публичных баз данных и измерили простые характеристики для каждого белка, такие как длина, оценочная масса и состав аминокислот. Сравнивая эти характеристики между линиями, авторы могли увидеть, производят ли некоторые линии последовательно более тяжёлые или по составу отличающиеся варианты одного и того же белка.
Более тяжёлые белки без увеличения длины
Один заметный паттерн проявился в двух белках, кодируемых на малом сегменте генома: в комплексе поверхностного гликопротеина и в нуклеопротеине. В Нигерии две линии, названные II и III, циркулируют в разных регионах. Их гликопротеины почти всегда имеют одинаковую длину, однако версия линии III в среднем примерно на 180 единиц массы тяжелее, чем у линии II. Та же тенденция наблюдается в нуклеопротееине, где версия линии III примерно на 140 единиц тяжелее, несмотря на точно такое же число аминокислот. Это означает, что линия III предпочитает более тяжёлые аминокислоты в ряде позиций, добавляя массу белкам без увеличения их длины.
Определение мест и способов различий в белках
Чтобы выяснить, где расположены эти различия в гликопротеине, команда использовала сочетание машинного обучения и статистических мер. Классификатор Random Forest научился угадывать линию по общей аминокислотной композиции последовательности и продемонстрировал высокую точность, показывая, что у каждой линии есть тонкий, но отличимый химический «акцент». При анализе отдельных позиций они обнаружили, что более половины гликопротеина фактически совпадает между линиями II и III, тогда как меньший набор сайтов показывает сильное смещение в сторону одной из линий. На этих позициях линия III склонна использовать более тяжёлые остатки, такие как аргинин и глутамин, в то время как линия II предпочитает более лёгкие, например валин и аланин. В сумме эти небольшие сдвиги по последовательности объясняют общий разрыв в массе между двумя линиями.
Крошечная вставка, которую вирус способен выдержать
Длина гликопротеина также варьирует на один остаток между некоторыми линиями. У большинства вирусов линий IV и V гликопротеин состоит из 491 аминокислоты, тогда как у линий II, III и VII чаще встречается длина 490. Тщательно выровняв последовательности и построив большое филогенетическое дерево, исследователи проследили эту разницу в размере до небольшой вставки или делеции вблизи самого начала гликопротеина, примерно в позициях 60–61. Затем они использовали современные программы предсказания структуры, чтобы смоделировать более 600 вариантов трёхкомпонентного шипа гликопротеина. 
От компьютерных моделей к клеткам
Структурные модели показали, что дополнительный остаток располагается на внешней поверхности головки гликопротеина и не нарушает основную архитектуру, общую для линий. Чтобы проверить, влияет ли это крошечное изменение в живой клеточной системе, команда экспрессировала несколько репрезентативных гликопротеинов с дополнительным остатком и без него в линиях человеческих клеток. Они измеряли, насколько хорошо белки достигают клеточной поверхности и насколько сильно их связывают два антитела, чувствительные к конформации. Во всех конструктах экспрессия и связывание антител были очень схожи, что указывает на то, что эта конкретная разница в длине хорошо переносится и в данном экспериментальном контексте существенно не меняет отображение или узнавание гликопротеина.
Что это значит для будущих вакцин
В целом исследование показывает, что линии Ласса-вируса не идентичны с точки зрения физических свойств белков. В частности, линия III склонна производить слегка более тяжёлые версии ключевых белков, предпочитая более тяжёлые аминокислоты в определённых позициях, тогда как небольшая вставка около вершины гликопротеина выглядит структурно и функционально допустимой. Сочетая анализ последовательностей в масштабе популяции с моделированием структуры и лабораторными тестами, авторы предоставляют подробный каталог форм гликопротеина по линиям. Этот ресурс может помочь разработчикам вакцин и лекарств выбирать репрезентативные мишени и фокусироваться на участках, консервативных по структуре, даже при продолжающейся эволюции последовательности вируса.
Цитирование: Daodu, R.O., Riccabona, J.R., Peter, A.S. et al. Sequence to structure insights into Lassa virus population-level biophysical properties and glycoprotein structure catalogue. npj Viruses 4, 26 (2026). https://doi.org/10.1038/s44298-026-00196-3
Ключевые слова: Вирус Ласса, гликопротеин, вирусные линии, структура белка, проектирование вакцин