Clear Sky Science · de
Ein umfassender Datensatz zur Ablesung von Ziffernrollen-Wasserzählern unter schwierigen Bedingungen
Warum alte Wasserzähler weiterhin wichtig sind
Viele Städte träumen von „intelligenter“ Infrastruktur, doch unter den Straßen und in Kellern verrichten nach wie vor zahllose mechanische Wasserzähler die eigentliche Arbeit, unseren Wasserverbrauch zu erfassen. Alle diese Zähler durch moderne Smart Meter zu ersetzen ist teuer, besonders für kleinere Gemeinden. Dieses Paper stellt einen großen, sorgfältig zusammengestellten Bilddatensatz vor, der Computern hilft, diese traditionellen Zähler mit Ziffernrollen automatisch zu lesen — selbst wenn Schmutz, Schatten, Unschärfe und Reflexionen die Aufgabe für Menschen und Maschinen gleichermaßen erschweren. 
Das Problem beim Ablesen von Zählern in der Praxis
Ein mechanischen Wasserzähler auf einem Foto abzulesen klingt vielleicht nach dem einfachen Erkennen einer Zahlenreihe, doch reale Installationen sind unordentlich. Zähler stecken oft in Unterflurkastenern oder engen Ecken, umgeben von Erde, Laub oder Müll. Die Glasabdeckungen können verschmutzt oder beschlagen sein, und die Beleuchtung ist selten ideal; Schatten, wenig Licht oder harte Reflexe durch Blitz oder Sonne sind üblich. Hinzu kommen von Arbeitern vor Ort aufgenommene Fotos, die schief oder unscharf sind, sodass die Zahlenrollen verschwommen oder verzerrt erscheinen. All diese Faktoren verwirren Standard-Computer-Vision-Systeme, die saubere, frontale Bilder erwarten.
Aufbau einer realistischen Bildsammlung
Zur Bewältigung dieser Herausforderungen sammelten die Autoren mehr als 50.000 Fotos aus tatsächlichen manuellen Ablesearbeiten in Hangzhou, einer großen chinesischen Stadt mit einem komplexen Untergrundwassernetz und vielen alternden Zählern. Zunächst entfernten sie unbrauchbare Bilder und passten die übrigen auf ein Standardformat an, damit Algorithmen sie konsistent verarbeiten können. Für jedes Bild markierten sie den genauen Bereich, in dem die Ablesung erscheint, und erzeugten so eine „Ausschnitt“-Maske, die nur das Sichtfenster des Zählers zeigt. Außerdem versehen sie jedes Foto mit einfachen Ja/Nein-Kennzeichnungen, die seine Herausforderungen beschreiben — ob es klar, unscharf, verschmutzt, mit Erdaufschlag, dunkel, reflektiv oder von einem sechsstelligen Zähler ist. Dieses Multi-Label-Setup spiegelt die Realität wider, dass ein einziges Foto beispielsweise zugleich unscharf und dunkel sein kann.
Vom Auffinden des Sichtfensters bis zum Ablesen der Rollen
Automatisches Ablesen umfasst tatsächlich zwei verknüpfte Aufgaben: zuerst das Finden des kleinen Fensters, das die drehenden Ziffernrollen zeigt, und zweitens das Erkennen der Ziffern selbst. Für den ersten Schritt stellt der Datensatz Vollbilder plus Masken bereit, die den Ablesebereich umreißen, sodass Modelle das Erkennen und Segmentieren dieser Region lernen können. Für den zweiten Schritt schneiden die Autoren diese Bereiche aus und transformieren sie in gerade, rechteckige Streifen, in denen die Ziffernrollen sauber nebeneinander liegen. Anschließend liefern sie die korrekte fünf- oder sechsstellige Ablesung für jeden Streifen sowie zusätzliche Kennzeichnungen für schwierige Fälle wie umgekehrte Ziffernstreifen, teilweise gedrehte Rollen, die „halbe“ Ziffern zeigen, und sechsstellige Zähler. Diese Struktur erlaubt Forschern, Systeme zu trainieren und zu testen, die dem realen Workflow eines Versorgungsunternehmens folgen: Finden des Sichtfensters, Geradestellen und dann Ablesen der Zahlen. 
Tests zur Leistungsfähigkeit von Maschinenlernen
Um die Nützlichkeit des Datensatzes zu demonstrieren, führten die Autoren mehrere bekannte Modelle für Bildsegmentierung und -erkennung darauf aus. Beim Auffinden des Ablesebereichs erreichten vier verschiedene Segmentierungsansätze schnell hohe Genauigkeit und erfassten in den meisten Testbildern nahezu das gesamte Zählerfenster korrekt. Als sie die Szenariotags — etwa dunkel oder reflektiv — zusammen mit den Bildern verwendeten, ließen sich die Bedingungen identifizieren, die die Leistung am stärksten beeinträchtigen, und in welchem Ausmaß. Dunkle Szenen führten beispielsweise zu deutlich mehr Fehlern. Beim Ablesen der Ziffern wurden klassische und fortgeschrittene Deep-Learning-Modelle verglichen. Einfachere Netze waren schnell, machten jedoch mehr Fehler, während tiefere Architekturen wie ResNet und DenseNet nahezu alle Ablesungen korrekt erkannten, vor allem wenn man in schwierigen Fällen eine Abweichung von einer Ziffer zuließ.
Was das für den Alltag beim Wasserverbrauch bedeutet
Vereinfacht gesagt führt diese Arbeit kein einzelnes neues Gerät oder eine neue App ein, sondern ein gemeinsames „Trainingsgelände“, das andere nutzen können, um automatisierte Ablesesysteme für klassische Wasserzähler zu entwickeln und zu vergleichen. Da die Bilder die reale Unordnung von Schmutz, Unschärfe, Dunkelheit und Blendung abbilden, sind Modelle, die auf diesem Datensatz gut abschneiden, eher dazu geeignet, im Feld zuverlässig zu arbeiten. Das könnte Versorgungsunternehmen dabei helfen, auf effizientere, weniger fehleranfällige und weniger arbeitsintensive Wasserüberwachung umzusteigen, ohne sofort Millionen bestehender Zähler ersetzen zu müssen — und so intelligente Wasserwirtschaft erschwinglicher und breiter zugänglich zu machen.
Zitation: Zhao, S., Gao, Y., Liu, F. et al. A Comprehensive Dataset for Word-Wheel Water Meter Reading Under Challenging Conditions. Sci Data 13, 479 (2026). https://doi.org/10.1038/s41597-026-06809-z
Schlüsselwörter: Wasserzähler, Computer Vision, Smart Cities, Bilderkennung, Datensatz