Clear Sky Science · ru

Вывод глубоких нейронных сетей на интегрированном перенастраиваемом фотонном тензорном процессоре

· Назад к списку

Почему важны более быстрые мыслящие машины

Каждый раз, когда вы разблокируете телефон по лицу, говорите с голосовым помощником или видите, как система ИИ обнаруживает объекты в видео, за кулисами выполняются огромные объёмы численных вычислений. По мере того как эти модели искусственного интеллекта становятся больше и мощнее, им требуется больше энергии, больше аппаратных средств и больше времени. В этой статье рассматривается новый тип «оптического мозга», который использует свет вместо исключительно электричества для выполнения тяжёлых вычислений, с целью сделать будущие системы ИИ одновременно быстрее и более энергоэффективными.

Figure 1
Figure 1.

Свет как новый способ вычислений

Современный ИИ основан на глубоких нейронных сетях, которые сводятся к повторному применению схожих математических операций к большим таблицам чисел, называемым тензорами. Сегодня эти операции выполняются на электронных чипах, таких как GPU, которые приближаются к пределам по скорости и энергопотреблению. Авторы обращаются к фотонике — использованию света в крошечных интегрированных структурах — для выполнения тех же операций. Поскольку свет распространяется быстро и может идти по многим каналам одновременно, фотонный процессор в принципе способен выполнять множество вычислений параллельно с очень низкой задержкой, избегая при этом части энергетических потерь, присущих традиционной электронике.

Создание математического двигателя на свету

Команда разработала фотонный тензорный процессор, который помещается в стандартный 19‑дюймовый серверный отсек, делая его похожим на другое серверное оборудование. В его основе лежит кремниевый фотонный чип, изготовленный промышленным процессом, что повышает шансы на массовое производство таких устройств. На этом чипе входные электрические сигналы, представляющие данные, преобразуются в световые паттерны с помощью специальных модуляторов. Эти световые сигналы затем проходят через сетку крошечных волноводов, действующих как матрица настраиваемых связей, где каждое пересечение может усиливать или ослаблять проходящий свет. В конце каждого столбца встроенные фотодетекторы преобразуют суммарную яркость обратно в электрические сигналы, соответствующие результату умножения матрицы на вектор — базовой операции во многих слоях нейронных сетей.

Стабилизация света и точность вычислений

Для питания чипа исследователи используют единый продвинутый источник света, называемый микрокомбом, который одновременно генерирует много равноудалённых цветов света. Каждый цвет служит отдельным каналом, несущим часть входных данных, позволяя выполнять несколько вычислений параллельно. Однако работа с аналоговыми световыми сигналами влечёт за собой шум и искажения. Авторы решают эти проблемы с помощью тщательной калибровки: они измеряют отклик каждого модулятора и детектора и затем регулируют управляющие напряжения и уровни мощности так, чтобы требуемый математический коэффициент соответствовал конкретной оптической настройке. Они также компенсируют перекрёстные помехи между каналами и искажения, вносимые оптической упаковкой. При необходимости усредняя повторные измерения, они обменивают немного дополнительного времени на более высокую точность.

Запуск реальных задач ИИ на свету

Чтобы показать, что их система — не просто лабораторная демонстрация, команда подключает фотонный процессор напрямую к PyTorch, широко используемому фреймворку для ИИ. Они цифровым образом обучают две нейросети для распознавания изображений, а затем донастраивают их с учётом моделируемого аппаратного шума. После обучения те же сети запускаются на фотонном процессоре без необходимости переделывать их под чип. На простом наборе рукописных цифр MNIST оптическая система достигает примерно 98,1% точности в режиме повышенной точности и 91% в режиме низкой задержки, близко к полностью цифровому эталону. На более требовательном наборе цветных изображений CIFAR‑10 она достигает 72% в режиме точности — ниже цифрового варианта, но всё ещё демонстрируя практическую работоспособность на более сложной задаче.

Figure 2
Figure 2.

Что это значит для будущего аппаратного обеспечения ИИ

Хотя текущий прототип менее энергоэффективен по сравнению с передовыми электронными ускорителями, большая часть его энергопотребления уходит на вспомогательную электронику, а не на оптическое ядро. Результаты показывают, что программируемый фотонный процессор в серверном корпусе может выполнять практически всю тяжёлую линейную алгебру в реальных нейронных сетях, демонстрируя стабильную производительность во времени и настраиваемый баланс между скоростью и точностью. По мере масштабирования технологии до больших оптических ядер, большего числа длин волн и улучшенных преобразователей такие тензорные процессоры на свету могут предложить сверхбыстрые, с низкой задержкой ИИ‑движки, дополняющие или в некоторых случаях разгружающие работу традиционных чипов, помогая будущим системам эффективнее справляться с неизбежно растущими задачами ИИ.

Цитирование: Meyer, L., Dijkstra, J., Tebeck, S. et al. Deep neural network inference on an integrated, reconfigurable photonic tensor processor. Nat Commun 17, 3396 (2026). https://doi.org/10.1038/s41467-026-71599-2

Ключевые слова: фотонные вычисления, оптический ускоритель ИИ, глубокие нейронные сети, кремниевая фотоника, тензорная обработка