Clear Sky Science · pl
Wysoce energooszczędna wielordzeniowa architektura neuromorficzna do trenowania głębokich sieci z impulsami
Mądrzejsze uczenie dla urządzeń brzegowych
Nasze telefony, aparaty i drobne czujniki stają się coraz mądrzejsze, lecz nauczanie ich nowych umiejętności zwykle wymaga energochłonnych centrów danych. Artykuł przedstawia nowy typ inspirowanego mózgiem układu scalonego, który potrafi uczyć się bezpośrednio na małych urządzeniach, zużywając znacznie mniej energii niż dzisiejsze procesory graficzne. Ma to na celu wprowadzenie elastycznego, przyjaznego dla prywatności uczenia do samochodów, dronów i innych gadżetów, które muszą reagować szybko bez ciągłego wsparcia chmury.

Dlaczego układy przypominające mózg mają znaczenie
Konwencjonalne układy, takie jak GPU, świetnie radzą sobie z przetwarzaniem dużych ilości danych, ale zużywają dużo energii i zależą od szybkich łączy z odległymi serwerami. W zadaniach takich jak monitorowanie ruchu czy nawigacja dronów wysyłanie surowych danych do chmury jest powolne i może ujawniać prywatne informacje. Obliczenia neuromorficzne stosują inne podejście, naśladując sposób, w jaki sieci komórek mózgowych wymieniają krótkie impulsy elektryczne. Sieci neuronowe z impulsami obiecują wysoką dokładność przy znacznie mniejszej liczbie operacji, co czyni je atrakcyjnymi dla energooszczędnych urządzeń brzegowych.
Brakujący element w sprzęcie impulsowym
Wiele układów badawczych już efektywnie uruchamia sieci impulsowe, ale niemal wszystkie mają kluczowe ograniczenie: dobrze działają z ustalonym, wytrenowanym modelem, lecz nie potrafią samodzielnie trenować dużych, głębokich sieci impulsowych. Większość polega na prostych lokalnych regułach uczenia lub zrzuca ciężki proces treningowy na GPU. Oznacza to, że projektanci nie mogą w pełni wykorzystać potencjalnych oszczędności energii podczas uczenia, a także utrudnia to małym urządzeniom adaptację w locie, gdy zmieniają się warunki, na przykład pojawienie się nowych znaków drogowych czy innych warunków oświetleniowych.
Nowy wielordzeniowy projekt do uczenia na układzie
Autorzy przedstawiają wielordzeniową architekturę neuromorficzną, w której każdy rdzeń zawiera trzy współpracujące jednostki: jedną obsługującą sygnały płynące do przodu przez sieć, drugą przesyłającą informacje o błędach wstecz, oraz trzecią aktualizującą siłę połączeń. Rdzenie są połączone w dwuwymiarową siatkę, dzięki czemu różne warstwy głębokiej sieci impulsowej mogą zostać umieszczone na odrębnych rdzeniach i pracować równolegle. Starannie zaprojektowana sieć komunikacyjna przenosi zarówno szybkie jednobitowe impulsy, jak i wolniejsze, precyzyjne wartości między rdzeniami zgodnie z czasowaniem impulsów, a rozwiązanie „near memory” utrzymuje większość danych na układzie, redukując kosztowne odwołania do pamięci zewnętrznej.

Więcej przy mniejszym ruchu danych
W każdej jednostce sprzęt jest dostrojony do charakteru zatrzaskowego aktywności impulsowej. Obwody wykrywają, kiedy grupy neuronów są nieaktywne, i pomijają niepotrzebne obliczenia oraz odczyty z pamięci — strategia ta zmniejsza zużycie energii około dwukrotnie podczas trenowania standardowych modeli rozpoznawania obrazów. Projekt ponadto ponownie wykorzystuje przechowywane dane tam, gdzie to możliwe, i zapisuje impulsy jako pojedyncze bity, co znacząco redukuje potrzebę pamięci zewnętrznej. W testach z popularnymi głębokimi impulsowymi wersjami sieci ResNet i VGG prototyp osiąga w przybliżeniu do jednej trzeciej prędkości trenowania potężnego GPU centrum danych A100, mimo że ma tylko około jednej dwudziestej jego surowej mocy obliczeniowej, i wyraźnie przewyższa system brzegowy Jetson Orin.
Od prototypu laboratoryjnego do rzeczywistego uczenia na brzegu
Aby pokazać, że pomysł działa poza symulacjami, zespół odwzorował mniejszą wersję architektury na kilku płytkach FPGA i trenował sieci impulsowe na standardowych zbiorach obrazów oraz zdarzeniowych zbiorach gestów. System poradził sobie z uczeniem ciągłym, gdzie modele są aktualizowane w miarę pojawiania się nowych rodzajów próbek, oraz z uczeniem federacyjnym, gdzie kilka urządzeń trenuje lokalnie i udostępnia jedynie zwarte aktualizacje. W obu przypadkach rozproszony system impulsowy poprawiał dokładność bez centralizowania surowych danych, co daje wskazówkę na przyszłe zastosowania w inteligentnych miastach i robotyce, gdzie wiele urządzeń uczy się razem, zachowując jednocześnie kontrolę nad zużyciem energii i przepustowością.
Co to oznacza dla codziennej technologii
Mówiąc w skrócie, praca ta pokazuje, jak zbudować silnik treningowy inspirowany mózgiem, który mieści się w ciasnych budżetach energetycznych urządzeń brzegowych. Poprzez łączenie wielu małych rdzeni uczących się, inteligentne trasowanie danych i agresywne pomijanie zbędnych operacji, architektura trenuje głębokie sieci impulsowe efektywnie, bez polegania na wielkich centrach danych. Jeśli zostanie zrealizowana jako układy scalone, podobne projekty mogłyby pomóc kamerom, samochodom i urządzeniom domowym uczyć się z otoczenia w czasie rzeczywistym, jednocześnie chroniąc prywatność i oszczędzając energię.
Cytowanie: Li, M., Zhou, H., Xu, X. et al. A highly energy-efficient multi-core neuromorphic architecture for training deep spiking neural networks. Nat Commun 17, 4403 (2026). https://doi.org/10.1038/s41467-026-70586-x
Słowa kluczowe: obliczenia neuromorficzne, sieci neuronowe z impulsami, edge AI, sprzęt niskiego poboru mocy, uczenie na układzie