Clear Sky Science · pl

Wielopoziomowa segmentacja obrazów oparta na nowym, ulepszonym mechanizmie algorytmu optymalizacji coati

· Powrót do spisu

Wyraźniejsze obrazy dzięki sprytniejszemu cyfrowemu cięciu

Każdy obraz cyfrowy, od zdjęć satelitarnych po skany medyczne, to w istocie siatka liczb. Aby analizować takie obrazy, komputery często muszą podzielić je na sensowne obszary — na przykład oddzielić guz od tkanki zdrowej czy drogę od tła. W artykule przedstawiono nowy sposób, który pozwala wykonać takie cięcie ostrzej i szybciej, nawet dla bardzo złożonych obrazów, ucząc wirtualny „rój” rozwiązywaczy problemów współpracować bardziej inteligentnie.

Figure 1
Figure 1.

Dlaczego dzielenie obrazów jest takie trudne

Zanim komputer zrozumie obraz, musi podzielić go na obszary należące do siebie — proces zwany segmentacją. Jednym z najprostszych i najczęściej stosowanych podejść jest progowanie: wybiera się jeden lub kilka progów na skali jasności obrazu i przypisuje każdy piksel do regionu w zależności od tego, gdzie jego wartość się znajduje. Przy jednym progu zadanie jest proste. Współczesne zadania często jednak wymagają wielu progów jednocześnie, aby oddzielić kilka tkanek w skanie czy różne typy pokrycia terenu na zdjęciu satelitarnym. Matematyczne poszukiwanie najlepszej kombinacji progów rośnie wykładniczo wraz z ich liczbą, szybko stając się problemem zbyt dużym do bezpośredniego obliczenia.

Puszczenie wirtualnych zwierząt do polowania na lepsze odpowiedzi

Aby poradzić sobie z tymi trudnymi przeszukiwaniami, naukowcy coraz częściej sięgają po metaheurystyki: cyfrowe roje przemierzające przestrzeń rozwiązań, przesuwające kandydatów w obiecujące rejony. Praca ta opiera się na niedawnym podejściu inspirowanym coati — społecznymi ssakami polującymi w grupach. W pierwotnym algorytmie optymalizacji coati niektóre wirtualne osobniki wspinają się w kierunku zdobyczy, podczas gdy inne czatują i skaczą, naśladując eksplorację globalną i lokalne dopracowywanie. Strategia ta sprawdza się w wielu zastosowaniach, ale nadal może utknąć w przeciętnych rozwiązaniach, zwłaszcza gdy liczba progów jest duża lub gdy obrazy i miary jakości są zróżnicowane.

Nauka roju eksplorowania i skupiania się

Autorzy zaprojektowali ulepszoną wersję nazwaną ENCOA, która wzmacnia roj coati na kilku poziomach. Po pierwsze, poprawili inicjalizację kandydatów, stosując starannie dobrany, chaotyczny wzorzec oraz trik z lustrzanym odbiciem „jak przez soczewkę”, aby równomierniej rozłożyć punkty startowe w przestrzeni poszukiwań. Następnie zapożyczyli pomysły z innego algorytmu inspirowanego środowiskiem morskim, tworząc adaptacyjny mechanizm poszukiwań (ASSM). Mechanizm ten stopniowo przesuwa zachowanie roju od szerokiego rozpoznawania na początku do bardziej ostrożnego dopracowywania później, pomagając uniknąć utknięcia w lokalnych minimach. Wreszcie wprowadzili hierarchiczne przeszukiwanie „pionowo-poziome”: elitarne rozwiązania są korygowane wymiar po wymiarze dla precyzyjnego dostrojenia, podczas gdy reszta roju krzyżuje fragmenty rozwiązań, by utrzymać wysoką różnorodność.

Weryfikacja metody na testach, zadaniach inżynierskich i rzeczywistych obrazach

Aby sprawdzić, czy te modyfikacje mają znaczenie, zespół najpierw uruchomił ENCOA na standardowym zestawie trudnych funkcji testowych. W większości tych wyzwań nowa metoda zbiega szybciej i osiąga dokładniejsze wyniki niż zarówno pierwotny algorytm coati, jak i 11 innych znanych metod rojowych. Następnie zastosowali ENCOA do czterech klasycznych problemów projektowania inżynierskiego, takich jak optymalizacja masy skrzyni biegów, gdzie ponownie znaleziono lżejsze lub tańsze rozwiązania niż w przypadku konkurencyjnych technik przy tych samych ograniczeniach. Na koniec zmierzyli się z głównym celem: segmentacją sześciu obrazów w skali szarości i czterech kolorowych obrazów testowych, obejmujących sceny naturalne i obrazy stylizowane na medyczne. Korzystając z dwóch różnych kryteriów jakości — jednego opartego na rozróżnialności regionów, drugiego na zachowaniu informacji — ENCOA konsekwentnie generuje segmentacje o wyższych wynikach w standardowych miarach podobieństwa obrazów, szczególnie gdy wymaganych jest wiele progów (do 32).

Figure 2
Figure 2.

Czystsze granice dla obrazów ze świata rzeczywistego

Mówiąc prościej, badanie pokazuje, jak lepiej zaprojektowany cyfrowy rój może dzielić obrazy na czystsze, bardziej znaczące części, nie zwalniając znacząco wraz ze wzrostem trudności problemu. Dzięki wyważeniu intensywnej eksploracji z ukierunkowanym dopracowywaniem, ENCOA znajduje ustawienia progów, które zachowują detale i redukują szum w szerokim zakresie obrazów i celów. Autorzy sugerują, że te korzyści mogą przełożyć się na wymagające dziedziny, takie jak obrazowanie medyczne, gdzie ostrzejsze, zautomatyzowane segmentacje mogą pomóc klinicystom lepiej dostrzec subtelne struktury i wspierać bardziej niezawodne diagnozy.

Cytowanie: Liu, J., Yang, S., Liu, W. et al. Multilevel threshold image segmentation based on a novel mechanism enhanced coati optimization algorithm. Sci Rep 16, 10338 (2026). https://doi.org/10.1038/s41598-026-40921-9

Słowa kluczowe: segmentacja obrazu, algorytmy optymalizacyjne, inteligencja rojowa, obrazowanie medyczne, analiza obrazów cyfrowych