Clear Sky Science · ru

Перенастраиваемые всехоптические нелинейные активаторы с порогом в фемто‑джоул для пикосекундных импульсных оптических нейронных сетей

· Назад к списку

Почему крошечные вспышки света могут питать ИИ будущего

Современный искусственный интеллект работает на больших фермах энергоёмких электронных чипов. По мере того как мы требуем более интеллектуальные телефоны, автомобили и центры обработки данных, потребление электроэнергии и тепловыделение становятся серьёзными ограничениями. В этой работе описан способ переложить часть этой нагрузки на свет вместо электронов, используя крошечные оптические устройства, выполняющие роль «активационных» переключателей в нейронной сети. Эти переключатели работают с невероятно малыми энергиями света и с потрясающей скоростью, открывая перспективу ультрабыстрого, энергоэффективного аппаратного обеспечения для ИИ.

От медленной горячей электроники к быстрой прохладной фотонике

Обычные компьютерные чипы перемещают электрические заряды по металлическим проводам и транзисторам. Этот подход хорошо служил нам, но он достигает пределов по скорости и энергоэффективности. Оптические нейронные сети заменяют переносящие заряды фотоны, движущиеся по волноводам — по сути, крошечным оптическим каналам на кристалле. Свет способен быстро передавать информацию, одновременно в нескольких цветах и с минимальным нагревом. Однако для практической всехоптической нейронной сети требуется ключевой элемент: компактное устройство, которое принимает световой сигнал и выдает его преобразованную версию нелинейным образом, так же как нейрон в мозге «срабатывает» только при превышении входом порога. До сих пор такие всехоптические «активаторы» обычно были слишком большими, слишком медленными или требовали слишком много энергии.

Figure 1
Figure 1.

Микроскопическая ловушка для света, которая учится изгибать сигналы

Авторы сначала создают кремниевую полость фотонного кристалла — перфорированную пластину из кремния, которая захватывает и замедляет свет на определённых длинах волн. Тщательно располагая ряд отверстий, они формируют крошечную область, где короткий световой импульс может резонировать и накапливаться, усиливая свою интенсивность. Это повышает слабый эффект в кремнии, называемый эффектом Керра, при котором показатель преломления материала слегка меняется при высокой внутренней интенсивности света. Это небольшое изменение смещает резонансную частоту полости и, как следствие, изменяет долю проходящего светового импульса. Выбирая входную длину волны относительно пика резонанса полости, исследователи могут заставить устройство вести себя как несколько различных активационных кривых, используемых в машинном обучении, включая линейные, похожие на ReLU (выпуклый линейный), и похожие на сигмоиду отклики. Даже в этой чисто кремниевой версии активатор имеет размеры всего около 15 на 10 микрометров — меньше пылинки — и реагирует менее чем за 2 триллионных доли секунды.

Добавление графена для сверхнизкоэнергетического переключения

Чтобы снизить порог активации ещё сильнее, команда интегрирует одноволновый слой графена поверх кремниевой полости. Графен естественным образом поглощает свет, но при высоких интенсивностях его поглощение насыщается: когда многие электроны возбуждены, дополнительные фотоны проходят легче. Сочетая это «насыщаемое поглощение» с усилением в режиме «медленного света» полости, устройство достигает энергии насыщения всего в 4 фемто‑джоуля — примерно столько, сколько несут несколько десятков тысяч фотонов в телекоммуникационной полосе — и времени отклика примерно 1 пикосекунду. На близких длинах волн та же структура по‑прежнему может использовать эффект Керра кремния для изменения своей активационной кривой по запросу, переключаясь между поведением, похожим на сигмоиду, на ReLU и почти линейным, с порогами вплоть до 30 фемто‑джоул. По параметрам скорости и требуемой энергии эта характеристика превосходит предыдущие on‑chip оптические активаторы на несколько порядков.

Figure 2
Figure 2.

Создание импульсного оптического «мозга» на кристалле

Используя эти активаторы как строительные блоки, авторы описывают полную архитектуру оптической нейронной сети, управляемую ультрабыстрыми световыми импульсами вместо непрерывных лучей. Лазер с высокой частотой повторения генерирует ряд пикосекундных всплесков, которые кодируются данными с помощью высокоскоростных модуляторов и затем разделяются по множеству длин волн. На кристалле специализированные компоненты для мультиплексирования по длине волны направляют и взвешивают эти цвета с помощью невозвратно изменяемых фазовых материалов, которые запоминают настройки без потребления энергии. После линейного взвешивания сигналы проходят через графен‑кремниевые активаторы, которые накладывают требуемую нелинейную трансформацию, прежде чем свет направляется на следующий слой. Симуляции показывают, что при энергиях активации ниже примерно 30 фемто‑джоул такая система может достигать плотностей вычислений порядка 10³ триллионов операций в секунду на квадратный миллиметр и энергоэффективности близкой к 10⁶ триллионов операций на ватт на квадратный миллиметр — далеко за пределами типичных электронных ускорителей.

Что это значит для повседневного ИИ

Чтобы проверить, ведут ли себя эти экзотические оптические активации как их электронные аналоги, команда внесла измеренные активационные кривые в программные модели и обучала их на стандартных задачах классификации — от простых двумерных шаблонов до рукописных цифр (MNIST) и сложных цветных изображений (CIFAR‑10). Графен‑кремниевые активаторы соответствовали или превосходили простые линейные отклики, особенно на более сложных задачах с изображениями, где поведение, похожее на ReLU, оказалось особенно эффективным. Проще говоря, эта работа демонстрирует, что миниатюрный чип из тщательно структурированного кремния и графена однажды сможет выполнять ключевые шаги в вычислениях ИИ с помощью крошечных вспышек света вместо электричества. При масштабировании и интеграции с отработанными фотонными технологиями такие всехоптические нелинейные активаторы могут обеспечить более быстрое, холодное и энергоэффективное аппаратное обеспечение для следующих поколений искусственного интеллекта.

Цитирование: Liu, R., Wang, Z., Zhong, C. et al. Femto-joule threshold reconfigurable all-optical nonlinear activators for picosecond pulsed optical neural networks. Light Sci Appl 15, 128 (2026). https://doi.org/10.1038/s41377-025-02175-4

Ключевые слова: оптические нейронные сети, графеновая фотоника, полости фотонного кристалла, нелинейная активация, энергоэффективное аппаратное обеспечение ИИ