Clear Sky Science · ru
Всеобъемлющий набор данных для чтения циферблатных водомеров в сложных условиях
Почему старые водомеры по‑прежнему важны
Во многих городах мечтают о «умной» инфраструктуре, но под улицами и в подвалах бесчисленные старые механические водомеры по‑прежнему выполняют основную работу по учёту потребления воды. Заменить все их на современные интеллектуальные счётчики дорого, особенно для маленьких населённых пунктов. В этой статье представлен большой, тщательно подготовленный набор изображений, который помогает компьютерам автоматически считывать такие традиционные циферблаты, даже когда грязь, тени, размытость и блики осложняют задачу как для людей, так и для машин. 
Проблема чтения счётчиков в реальных условиях
Снимать показания механического водомера по фотографии может показаться просто — достаточно разглядеть ряд цифр, — но реальные установки далеко не аккуратны. Счётчики часто находятся в подземных колодцах или тесных уголках, окружённые почвой, листьями или мусором. Их стекла могут быть запачканы или запотевшими, а освещение редко бывает идеальным: тени, слабый свет или резкие отражения от вспышки или солнца — обычное дело. Кроме того, фотографии, сделанные работниками на выезде, могут быть сняты под углом или не в фокусе, в результате чего циферблаты оказываются размытыми или искаженными. Все эти факторы сбивают с толку стандартные системы компьютерного зрения, рассчитанные на чистые фронтальные кадры.
Создание реалистичной коллекции изображений
Чтобы справиться с этим, авторы собрали более 50 000 фотографий с реальной ручной съёмки счётчиков в Ханчжоу — крупном китайском городе с развитой подземной водной сетью и множеством стареющего оборудования. Сначала они отфильтровали непригодные кадры и стандартизировали размер оставшихся изображений, чтобы алгоритмы могли обрабатывать их последовательно. Для каждого снимка они отметили точную область, где видны показания, создав «вырезную» маску, которая показывает только окно счётчика. Также к каждому фото прикреплялись простые булевы метки, описывающие его трудности — ясно ли видно, размыто ли изображение, есть ли пятна, покрытие почвой, тёмный кадр, отражения или шестизначный счётчик. Такая мульти‑меточная разметка отражает реальность: одно и то же фото может быть одновременно, например, и тёмным, и размытым.
От поиска циферблата до чтения колёсиков
Автоматическое считывание на практике включает две связанные задачи: сначала найти небольшое окно, где расположены вращающиеся счётные колёсики, а затем узнать сами цифры. Для первого шага набор данных предоставляет полные изображения и маски, очерчивающие область со значением, чтобы модели могли научиться обнаруживать и сегментировать этот фрагмент. Для второго шага авторы вырезают эти области и преобразуют их в прямые прямоугольные срезы, где колёсики цифр выстраиваются ровно. Затем они дают корректное пяти- или шестизначное показание для каждого среза, а также дополнительные метки, описывающие сложные случаи, такие как перевёрнутые полосы, частично повернутые колёсики, показывающие «половинчатые» цифры, и шестизначные счётчики. Такая структура позволяет исследователям обучать и тестировать системы, имитирующие реальную последовательность действий коммунальной службы: найти окно, выровнять его, затем прочитать цифры. 
Оценка способности компьютеров к обучению
Чтобы продемонстрировать полезность набора данных, авторы прогнали по нему несколько известных моделей сегментации и распознавания изображений. Для задачи поиска области показаний четыре разные подхода к сегментации быстро достигли высокой точности, корректно охватив почти всё окно счётчика в большинстве тестовых снимков. Когда они использовали сценарные метки — например тёмный или отражающий — вместе с изображениями, стало видно, какие условия сильнее всего ухудшают результаты и в какой степени. Тёмные сцены, например, приводили к заметно большему числу ошибок. Для чтения цифр сравнивали классические и более продвинутые модели глубокого обучения. Проще архитектуры работали быстрее, но допускали больше ошибок, тогда как более глубокие решения, такие как ResNet и DenseNet, правильно распознавали почти все показания, особенно если допускали отклонение на одну цифру в сложных случаях.
Что это значит для повседневного учёта воды
Проще говоря, эта работа не представляет одно новое устройство или приложение, а предлагает общее «поле для тренировок», которое другие могут использовать для создания и сравнения автоматических систем чтения старомодных водомеров. Поскольку изображения отражают реальную неаккуратность — грязь, размытость, тьму и блики — модели, показывающие хорошие результаты на этом наборе данных, с большей вероятностью будут надёжны в полевых условиях. А это, в свою очередь, может помочь коммунальным службам перейти к более эффективному, менее ошибочному и менее трудоёмкому контролю за расходом воды без немедленной замены миллионов существующих счётчиков, делая более разумное управление водными ресурсами доступным и более экономичным.
Цитирование: Zhao, S., Gao, Y., Liu, F. et al. A Comprehensive Dataset for Word-Wheel Water Meter Reading Under Challenging Conditions. Sci Data 13, 479 (2026). https://doi.org/10.1038/s41597-026-06809-z
Ключевые слова: водомеры, компьютерное зрение, умные города, распознавание изображений, набор данных