Clear Sky Science · ru

Накопленные локальные эффекты и графовые нейронные сети для предсказания связей

2026-02-12 · Назад к списку

Почему важно понимать скрытые связи

Многие системы, формирующие нашу жизнь — социальные сети, научные сотрудничества, сети мозга и даже сам веб — описываются как сети связанных между собой точек. Ключевой вопрос в том, какие новые связи с наибольшей вероятностью возникнут в будущем: кто с кем начнёт сотрудничать или какая работа процитирует какую. Современные графовые нейронные сети прекрасно справляются с такой задачей «предсказания связей», но при этом остаются чёрными ящиками: они дают хорошее качество, но трудно понять, почему модель приняла то или иное решение. В этой работе авторы решают эту проблему, адаптируя общий метод объяснения, чтобы увидеть, как изменение одного свойства узла влияет на вероятность появления связей к нему.

От простых счётчиков к непрозрачным графовым механизмам

Ранняя сетевая наука опиралась на простые правила для предположений о пропущенных или будущих связях. Например, у двух людей с многими общими друзьями выше шанс стать друзьями, а сильно связанные веб‑страницы обычно притягивают ещё больше ссылок. За последнее десятилетие такие вручную сконструированные метрики были превзойдены методами, которые обучаются вычислять компактные числовые описания, или встраивания, для каждого узла. Графовые нейронные сети идут дальше: они многократно передают сообщения по рёбрам, так что встраивание узла аккумулирует информацию от соседей и соседей соседей. Это делает их отличными для предсказания связей, но также запутывает их внутреннюю логику и затрудняет интерпретацию.

Как изменение одной характеристики сдвигает предсказания

Вне мира графов одним популярным способом интерпретации чёрных ящиков является метод накопленных локальных эффектов (Accumulated Local Effects, ALE). Вместо того чтобы просто указывать, какие признаки важны, ALE показывает, как предсказание модели меняется, если вы незначительно поднять или опустить один признак в пределах его возможных значений, а затем аккумулирует эти локальные изменения в гладкую кривую. Авторы адаптируют ALE для предсказания связей в графовых нейронных сетях, изменяя по очереди признак одного узла и проверяя, как на это реагирует предсказанная вероятность связей между этим узлом и множеством других. В результате получается визуализация, показывающая, например, как увеличение доли авторов из «больших технологических компаний» в статье или изменение вертикального положения сегмента сосуда в мозге сдвигает оценённую моделью вероятность появления связи.

Два подхода к вычислению эффектов: точный и быстрый

Графовые нейронные сети вносят важную особенность в ALE: когда вы изменяете сразу много узлов, они могут влиять друг на друга через передачу сообщений, что потенциально искажает объяснение. Поэтому авторы сравнивают две стратегии. В «точной» версии признак каждого узла модифицируется по отдельности, чтобы никакие два изменённых узла не могли загрязнить встраивания друг друга — но это вычислительно дорого. В «приближённой» версии одновременно меняют многие узлы, обращаясь с данными как с обычной таблицей и игнорируя эти взаимодействия; это гораздо быстрее, но может ввести смещение. Систематически варьируя, сколько узлов изменяют одновременно и с каким числом потенциальных партнёров их тестируют, авторы оценивают, как эти выборы влияют на ALE‑кривые.

Тестирование на синтетических графах и реальных данных

Чтобы проверить точность, команда сначала строит синтетическую сеть, где известен истинный закон образования связей: ребра более вероятны, когда у обоих концов высоко специальное «сигнальное» свойство. Здесь они могут напрямую сравнить ALE‑кривые с истинной зависимостью. Они обнаруживают, что по мере того как одновременно изменяют больше узлов, приближённый метод уходит от истинной зависимости, тогда как точный метод остаётся верным. На больших реальных наборах данных — сети цитирований работ по искусственному интеллекту и подробной 3D‑карте сосудов мозга мыши — истинное правило уже не видно напрямую, поэтому авторы используют точный метод, агрегированный по множеству запусков, как эталонное объяснение и проверяют, насколько приближённый метод отклоняется. Статистические тесты и эксперименты с перестановками показывают, что в большинстве сочетаний модель–датасет различия между двумя методами умеренны, хотя приближённые кривые более изменчивы от запуска к запуску.

Что эти эффекты говорят о мире

Помимо методологии, ALE‑кривые дают представление о том, чему модели действительно научились. В сети цитирований они указывают, что статьи с более высокой долей авторов, связанных с крупными технологическими компаниями, согласно модели, с большей вероятностью будут получать цитирования — что созвучно опасениям по поводу растущего влияния индустрии в исследованиях ИИ. В графе сосудов две разные архитектуры графовых нейронных сетей усваивают противоположные тенденции того, как высота сосуда в мозге соотносится с его связностью, подчёркивая, что ALE раскрывает убеждения модели, но не обязательно биологическую истину. Такие несоответствия могут сигнализировать о том, что архитектуру модели, обучающие данные или процедуру оценки следует пересмотреть.

Выводы для читателей и практиков

Исследование показывает, что метод накопленных локальных эффектов можно адаптировать для объяснения предсказаний связей в графовых нейронных сетях, получая интуитивные кривые, которые демонстрируют, как изменение признака узла повышает или понижает вероятность связи. Вычисление этих кривых точно надёжнее, но медленнее, тогда как более быстрая аппроксимация часто достаточна, если можно смириться с дополнительным шумом, особенно при усреднении по множеству запусков. Для тех, кто уже использует инструменты объяснения в стандартных моделях машинного обучения, это приносит знакомый визуальный способ заглянуть в сложные графовые системы и усомниться, действительно ли то, чему модель научилась, совпадает с нашим пониманием исследуемых сетей.

Цитирование: Kaczyńska, P., Sienkiewicz, J. & Ślęzak, D. Accumulated local effects and graph neural networks for link prediction. Sci Rep 16, 8574 (2026). https://doi.org/10.1038/s41598-026-39000-w

Ключевые слова: графовые нейронные сети, предсказание связей, объяснимость моделей, накопленные локальные эффекты, сетевая наука