Clear Sky Science · ru

КОД сверх FAIR: дорожная карта для повторно используемого научного ПО

· Назад к списку

Почему важен невидимый код, лежащий в основе науки

За почти каждым современным научным прорывом — от картографирования галактик до расшифровки ДНК — стоит программное обеспечение, тихо выполняющее тяжёлую работу. Тем не менее этот код часто воспринимают как нечто второстепенное: его скрывают, он хрупок и другим трудно его повторно использовать или проверить. В статье утверждается, что если мы хотим надёжную, воспроизводимую науку, то научное ПО нужно рассматривать как ключевой научный продукт, а не как одноразовый инструмент. Авторы предлагают практическую дорожную карту под названием CODE, которая поможет исследователям и организациям превратить сегодняшние одноразовые скрипты в надёжные, пригодные для совместного использования строительные блоки будущих открытий.

Figure 1
Figure 1.

Как наука стала зависеть от программного обеспечения

Всего за несколько десятилетий программное обеспечение стало центральным элементом практически каждой научной дисциплины. Исследования показывают, что почти в половине научных статей упоминается ПО — будь то для анализа данных, управления приборами, моделирования сложных систем или даже в качестве основного исследовательского результата. В отличие от готовой статьи или статичного набора данных, ПО — это «живой» объект: оно меняется по мере исправления ошибок, добавления функций и прихода новых участников. Сосуществуют многочисленные версии одной и той же программы, и каждая из них зависит от тонкой окружающей среды операционных систем и библиотек. Небольшое изменение в этой среде может изменить результаты или полностью сломать код. Такая живая, взаимозависимая природа означает, что традиционные принципы обмена данными, разработанные для статичных файлов, недостаточны, чтобы сделать ПО по-настоящему повторно используемым.

От FAIR к CODE: новый взгляд на научные инструменты

За последнее десятилетие принципы FAIR — Findable (находимое), Accessible (доступное), Interoperable (совместимое), Reusable (повторно используемое) — изменили подход учёных к данным. Попытки распространить FAIR на программное обеспечение достигли заметного прогресса, но авторы утверждают, что ПО требует более специализированных рекомендаций. Опираясь на многолетний опыт сообществ свободного и открытого ПО, они предлагают постепенную дорожную карту, организованную вокруг четырёх столпов, образующих аббревиатуру CODE: Open (Открытость), Document (Документирование), Execute (Выполнимость), Collaborate (Сотрудничество). Вместо требовать идеальной практики с самого начала, дорожная карта разбита на ступени, чтобы исследователи с минимальной подготовкой в инженерии программного обеспечения могли шаг за шагом внедрять лучшие привычки, а более продвинутые команды — стремиться к более высоким уровням надёжности и открытости.

Сделать код открытым, понятным и запускаемым

В рамках столпа «Открытость» авторы призывают учёных прекратить отправлять zip‑архивы по электронной почте по запросу и вместо этого публиковать исходный код на публичных платформах разработки, которые отслеживают историю и поддерживают совместную работу. Они подчёркивают важность долгосрочного архивирования в специализированных инфраструктурах, например в глобальных архивах исходного кода, чтобы проекты оставались доступными даже в случае закрытия хостинга. Чёткие лицензии с открытым исходным кодом и явное указание авторства необходимы, чтобы другие знали, что им разрешено делать юридически, и кого указывать при цитировании. Столп «Документирование» фокусируется на том, чтобы сделать ПО понятным: использовать осмысленные названия, добавлять комментарии, объясняющие логику, а не дословно повторяющие код, приводить простые примеры и руководства, а также писать отдельную справочную документацию для тех частей программы, с которыми взаимодействуют пользователи.

Обеспечить воспроизводимость и возможность обмена результатами

Столп «Выполнимость» решает распространённую проблему: код формально существует, но его нельзя запустить в другом месте. Дорожная карта призывает авторов перечислять аппаратное и программное окружение, от которых зависит их программа, по возможности предлагать готовые вычислительные окружения (через контейнеры или специализированные менеджеры пакетов), снабжать тестовые наборы, чтобы пользователи могли проверить правильность работы ПО на своих машинах, и делиться реальными, исполняемыми сценариями использования, которые отражают типичный анализ. Последний столп, «Сотрудничество», поощряет открытую, постоянную вовлечённость: отвечать на отчёты об ошибках и запросы на функции, объяснять, принимаются ли и как внешние вклады, честно говорить о пределах поддержки и, когда уместно, строить сообщество через учебные материалы, семинары и наставничество. В совокупности эти шаги превращают изолированный исследовательский код в общий инструмент, которому многие могут доверять и который они могут улучшать.

Роль каждого в поддержке лучшего научного ПО

В статье ясно говорится, что отдельные исследователи не смогут исправить проблему ПО в одиночку. Учреждения должны инвестировать в штатных инженеров по научному ПО, признавать ПО при найме и продвижении и предоставлять хорошо управляемые платформы для размещения кода. Спонсоры призываются поддерживать долгосрочное обслуживание широко используемых инструментов, а не только создание новых, и по возможности поощрять лицензирование с открытым исходным кодом как умолчание, чтобы помочь бороться с кризисом воспроизводимости. Библиотеки могут расширить свою традиционную роль, помогая архивировать ПО, управлять идентификаторами и кураторить каталоги, которые упрощают поиск важных программ. Наконец, издателей просят требовать, чтобы код, стоящий за опубликованными результатами, действительно был опубликован, связан со статьёй и всё чаще подвергался проверке, так же как и сама статья.

Figure 2
Figure 2.

Что эта дорожная карта означает для будущего науки

Проще говоря, авторы приходят к выводу, что хорошая наука теперь зависит от хорошего ПО, а хорошее ПО не возникает случайно. Их дорожная карта CODE предлагает реалистичный путь от нынешнего лоскутного набора скрытых скриптов к экосистеме, где научный код открыт, хорошо объяснён, запускается в других условиях и улучшается множеством людей. Следуя этим шагам — и при условии, что университеты, спонсоры, библиотеки и журналы выполнят свои роли — наука сможет приблизиться к миру, где результаты не только впечатляют при первом объявлении, но и проверяемы, повторно используемы и долговечны в течение многих лет.

Цитирование: Di Cosmo, R., Granger, S., Hinsen, K. et al. CODE beyond FAIR: a roadmap for reusable research software. Sci Data 13, 514 (2026). https://doi.org/10.1038/s41597-026-06705-6

Ключевые слова: научное программное обеспечение, открытый исходный код, воспроизводимость, устойчивость ПО, открытая наука