Clear Sky Science · ru
Исследование обнаружения узоров на батиковых изображениях на основе улучшенного YOLOv11
Древняя ткань встречает современный код
Батиковая ткань народов мяо в Китае — не просто украшение: её бабочки, драконы, птицы и цветы тихо сохраняют историю, верования и повседневную жизнь в условиях отсутствия письменности. Но по мере того как эти ткани стареют, а молодое поколение отходит от традиционных ремёсел, важная культурная информация рискует потеряться в грудах неразмеченных фотографий и выцветших материй. В этом исследовании показано, как современные средства распознавания изображений могут автоматически находить и идентифицировать крошечные, перекрывающиеся мотивы в сложных батиковых изображениях, предлагая новый способ сохранять и изучать это живое искусство в масштабах.

Почему эти узоры важны
Китайский батик — это техника ручного окрашивания, развивавшаяся более двух тысячелетий, особенно среди народа мяо в провинции Гуйчжоу. Поскольку у этого сообщества исторически не было письменности, батиковые мотивы стали визуальным архивом мифов, ритуалов, эстетики и социальных обычаев. Учёные начали оцифровывать и анализировать эти узоры, используя методы математики, дизайна и искусственного интеллекта. Предшествующие работы могли довольно успешно классифицировать отдельные мотивы, но обычно это требовало их вырезания из оригинальной ткани, разрывая связь между каждым символом и большей композицией. Это затрудняло понимание того, как мотивы взаимодействуют на одежде или текстиле, чтобы передавать многослойные смыслы.
От простых меток к умному обнаружению
Авторы утверждают, что необходимо не просто классифицировать, а полностью осуществлять обнаружение объектов: находить каждый мотив на целой фотографии и определять его тип. Это сложная задача для реальных батиковых изображений, где узоры плотно расположены, сильно варьируются по размеру и часто выцветают, трескаются или частично скрыты. Стандартные системы обнаружения, включая ранние версии популярной семейства алгоритмов YOLO («You Only Look Once»), испытывали трудности с такими условиями. Они часто пропускали очень маленькие символы, путались из-за сложных фонов или давали сбои при неравномерном освещении и качестве изображения — именно с такими снимками чаще всего работают кураторы и полевые исследователи.
Обучение нейросети «читать» ткань
Чтобы справиться с этими задачами, команда сначала создала крупнейший на сегодняшний день датасет по обнаружению китайского батика: 861 изображение высокого разрешения с 9933 аннотированными ограничивающими рамками по семи категориям мотивов (бабочка, рыба, дракон, птица, барабан, цветок и фрукт). Они тщательно сбалансировали размер и качество изображений и расширили ограниченный набор данных, применив контролируемое размытие, изменения цвета, отражения, мозаики и другие преобразования, чтобы модель не просто запоминала обучающие образцы. На основе этого набора данных они построили улучшенную версию YOLOv11 — современного фреймворка для обнаружения объектов, выбранного за скорость и компактность, что важно, если инструмент должен работать на обычных компьютерах в музеях и культурных центрах.
Смотреть дальше и видеть яснее
Усовершенствованная модель вводит две ключевые идеи. Во‑первых, компонент, вдохновлённый механизмом VOLO («vision outlooker»), позволяет сети одновременно охватывать отдалённые участки изображения, а не только малые локальные окрестности. Это помогает распознавать, что два крохотных элемента, находящиеся далеко друг от друга, могут принадлежать одному смысловому узору, и что роль мотива зависит от его соседей. Во‑вторых, команда переработала способ обработки признаков изображения, используя структуру под названием Fused-MBConv. Этот редизайн поддерживает вычислительную эффективность и одновременно улучшает способность модели выделять тонкие детали на шумных, состаренных тканях. В тестах и тщательных абляционных исследованиях итоговая архитектура показала более высокую среднюю точность обнаружения по сравнению с базовой YOLOv11 и несколькими другими легковесными детекторами, при этом оставаясь достаточно быстрой для использования в реальном или почти реальном времени.

От автоматических тегов к культурным историям
Помимо чистых показателей обнаружения, исследователи связали свою модель с базой знаний по батиковым мотивам, которая связывает каждый тип узора с рассказами о его происхождении, символическом значении и похожих примерах. В прототипе программного обеспечения пользователь может загрузить фотографию ткани, увидеть выделенные обнаруженные мотивы и перейти по ним для изучения их культурного контекста. Для архивистов это означает более быструю и последовательную каталогизацию больших коллекций. Для педагогов и посетителей это превращает распознавание узоров в входную точку для изучения верований, ритуалов и эстетики мяо. Хотя текущая система обучена только на китайском батике, авторы рассматривают её как образец для транскультурных инструментов, которые однажды помогут защищать текстильные традиции от Индонезии до Индии, обеспечивая, чтобы рисунки на ткани продолжали «говорить», даже когда сами ткани стареют и выцветают.
Цитирование: Li, Y., Quan, H., Li, Q. et al. Research on batik image pattern detection based on improved YOLOv11. npj Herit. Sci. 14, 143 (2026). https://doi.org/10.1038/s40494-026-02404-y
Ключевые слова: обнаружение узоров батик, нематериальное культурное наследие, компьютерное зрение, обнаружение объектов YOLO, текстильное искусство мяо