Clear Sky Science · ru

Улучшенный метод seam carving для расширения поля зрения при туннельном зрении

· Назад к списку

Помогаем людям видеть больше при узком поле зрения

Для людей с туннельным зрением простая прогулка по оживлённой улице может быть опасной: автомобили, велосипеды и пешеходы могут находиться прямо за пределами их узкого поля зрения. В этом исследовании рассматривается интеллектуальный способ переформатирования обычных камерных изображений так, чтобы больше сцены помещалось в это ограниченное «окно», не уменьшая и не искажая важные объекты. Работа может лечь в основу будущих визуальных помощников, таких как умные очки или приложения для телефона, которые помогут пользователям передвигаться более безопасно и уверенно.

Сжатие сцены без потери важного

Современные дисплеи — от экранов телефонов до устройств с креплением на голову — часто показывают мир через камеру. Для человека с нормальным зрением места для отображения широкой сцены предостаточно. Но для человека с туннельным зрением видна только узкая центральная область. Простое решение — сжать или обрезать изображение, однако это часто отсекает ключевые объекты или деформирует лица и здания. Авторы опираются на технику, известную как seam carving, которая умно сужает изображение, удаляя тонкие пути «наименее значимых» пикселов. Их цель — переработать seam carving так, чтобы он лучше служил людям с тяжёлой потерей поля зрения, сохраняя критические детали и при этом сжимая сцену в меньшую ширину.

Обучение компьютера тому, что нужно сохранить

Первой задачей является решение, какие части изображения действительно важны. Вместо того чтобы полагаться на один признак, исследователи комбинируют четыре разных типа информации для каждого пиксела. Карта глубины оценивает, как далеко объекты находятся от зрителя, поэтому ближайшие препятствия считаются более важными. Карта сальентности выделяет области, которые скорее всего привлекут внимание человека — например, людей или яркие вывески. Сегментация переднего плана отмечает главные субъекты на фоне. Наконец, выявление границ находит контуры и тонкие структуры, формирующие форму объектов. Объединив эти четыре карты на нескольких масштабах, метод создаёт богатую «энергетическую карту», которая чётко помечает важный контент и принижает значимость пустых стен или неба.

Figure 1
Figure 1.

Более разумные пути для вырезания изображения

Когда энергетическая карта построена, системе нужно решить, где именно резать швы — тонкие, связанные пути пикселов для удаления. Традиционный seam carving идёт сверху вниз, удаляя пути с наименьшей суммарной энергией. Это может привести к тонким, но вредным искажениям, например, к изгибу кромок зданий или разрушению объектов, которые должны оставаться целыми. Новый подход вводит ориентированную вперёд стратегию «forward-middle». Вместо старта с верха он начинается с середины изображения — там, где внимание зрителя естественно концентрируется — и распространяет вычисления вверх и вниз. Также метод оценивает, как удаление каждого потенциального шва повлияет на соседние пикселы в будущем, отдавая предпочтение вариантам, которые сохраняют прямые края и непрерывность объектов. Затем изображение сужается пиксел за пикселем вдоль этих тщательно выбранных путей.

Figure 2
Figure 2.

Проверка метода на практике

Чтобы оценить эффективность своей системы, авторы запустили её на стандартной коллекции фотографий, используемой для тестирования методов изменения размера изображений, и сравнили с шестью существующими подходами, включая классический seam carving, варпинг и гибридные методы. Они измеряли, насколько ретаргетированные изображения сохраняют структуру, распознаваемые признаки, воспринимаемое качество и распределение цветов, используя семь различных показателей качества. По почти всем этим метрикам новый метод оказался лучшим, особенно в сохранении структуры и отличительных деталей, которые помогают человеку распознавать объекты и ориентироваться. Сводный показатель, объединяющий все метрики, улучшился примерно на 30 процентов по сравнению с базовым seam carving, а формальные статистические тесты подтвердили, что эти улучшения вряд ли случайны.

Что это значит для повседневных визуальных пособий

Проще говоря, исследование показывает, что изображение с камеры можно сжать по горизонтали, чтобы поместиться в туннельное поле зрения, при этом сохранив людей, препятствия и ключевые ориентиры чёткими и правильно сформированными. Учитывая глубину, привлекающие внимание области, основные объекты переднего плана и контуры — а также выбирая более разумные пути при удалении пикселов — метод даёт компактные представления, которым можно доверять визуально. Хотя работа сосредоточена на статичных изображениях, те же идеи могут лечь в основу видеопомощей, персонализированных настроек для разных пациентов и клинических испытаний, чтобы проверить, действительно ли такие ретаргетированные сцены помогают пользователям безопаснее передвигаться в мире.

Цитирование: El-Torky, D., El-Regaily, S., Moadamani, A. et al. An improved seam carving method for enhancing the visual field of tunnel vision patients. Sci Rep 16, 4814 (2026). https://doi.org/10.1038/s41598-026-35527-0

Ключевые слова: туннельное зрение, адаптация изображений, seam carving, визуальные вспомогательные средства, ассистивные технологии