Clear Sky Science · ja

集積フォトニック3Dテンソル処理エンジン

· 一覧に戻る

なぜより速い思考機械が重要か

自動運転車から医療用スキャナー、バーチャルリアリティに至るまで、私たちの世界はリアルタイムで複雑な三次元データを理解できるコンピュータにますます依存しています。現在の人工知能システムは強力ですが、それらを駆動する電子チップは、より大規模で高速なニューラルネットワークへの需要に圧迫されています。本稿は、電気の代わりに光を用いてこうした3Dデータを扱う新しい手法を提示し、より高速で効率的な「思考」機械を実現する可能性を示します。これにより将来的には自動車の安全性向上、診断の迅速化、オンライン体験の没入感向上が期待できます。

平面画像から3Dワールドへ

多くの馴染みあるAIシステムは、畳み込みニューラルネットワークとして知られる手法でピクセルの二次元グリッド、つまり平面画像を扱います。しかし現代のセンサー、例えば医療用スキャナーや自動運転車のレーザーベースのLiDARは、時間を通じて完全な3Dシーンを取得します。これらの豊富なデータは多次元配列、すなわちテンソルとして自然に記述されます。3Dニューラルネットワークで処理することは非常に強力ですが、次元が増えるごとに必要な計算量とメモリが急速に増大するため非常に負荷が高くなります。GPUやTPUといった従来の電子アクセラレータは主に平面の二次元行列演算を処理するよう設計されているため、3Dデータを頻繁に変形・移動させる必要があり、時間、エネルギー、メモリを浪費してしまいます。

Figure 1
Figure 1.

重い処理を光に任せる

研究者らは、3Dニューラルネットワークの重要なステップを光で直接実行する集積フォトニック3Dテンソル処理エンジンを導入します。データをメモリと電子プロセッサ間で何度も移動させる代わりに、システムは情報をチップ上の小さな導波路や共振器を通る光信号として送ります。データを同時に符号化・処理するために三つの異なる“軸”が用いられます:光の色(波長)、パルスが通過する時間、そしてチップ上を通る物理的経路です。これら三次元を組み合わせることで、システムは多数の小さなタスクに切り分けたり嵩張る電子制御ハードウェアに依存したりすることなく、完全な3D畳み込み演算を処理できます。

組み込みの光学メモリと同期

高速計算における中心的な課題は、多数のデータチャネルを時間的に正確に整列させることです。従来のシステムはこれに複雑な電子クロック回路や大容量バッファを用いてきました。本研究ではこの問題を光学領域だけで解決しています。主要な計算ブロックの前後に、可変遅延線で構成された二つの光学メモリユニットを追加しました。これらの遅延線はパルスの“待合室”として機能し、各パルスがチップ上を移動する時間を単に変更することでデータをキャッシュしチャネルを同期させることができます。遅延はピコ秒(1兆分の1秒)精度で微調整でき、追加の電子タイミングハードウェアを使わずに約2000億演算毎秒に相当する有効クロック率をサポートします。

高度な光回路で重い数学に対応

計算ブロックの中核は、小さなリング状の光共振器の格子で、各光チャネルが最終結果にどれだけ寄与するかを制御します。これはニューラルネットワークの可変重みと類似しています。著者らは多層フォトニックプラットフォーム上で特殊な二重リング設計を採用し、これにより温度変化や製造誤差に対する感度が低く、広帯域で平坦な光学応答を実現しています。つまり、このリングは高速度信号を歪み少なく処理でき、単純な較正で7ビット以上に相当する有効精度を保ちます。試験では、このチップが記号(シンボル)レート最大30ギガボーで四チャネルの行列乗算を正常に実行し、速度と精度の両立を示しました。

Figure 2
Figure 2.

3Dレーザーセンシングでの実地試験

エンジンが単なる実験室のベンチマークを超えて有用であることを示すため、研究チームは実用的な3D認識問題に適用しました:LiDARポイントクラウドデータで歩行者と車両を識別する課題です。既知のリアルタイムモデルに類似したコンパクトな3Dニューラルネットワークを使用し、そのパラメータはデジタルで学習した後、重要な3D畳み込みステップをフォトニックエンジンに委ねました。20ギガボーの記号レートで動作させたところ、光学システムが生成した特徴マップはデジタル計算と高い一致を示し、分類精度は約97パーセントに達しました。これは伝統的なコンピュータとほぼ同等の結果でありながら、重い3D計算を光で実行した例です。

日常技術への意味

簡潔に言えば、本研究は3D AIワークロードの最も難しい部分を直接扱える小型の光学「数学エンジン」を構築することが可能であることを示しています。これによりメモリ使用量や電子部品が減り、従来設計に比べて潜在的に大幅なエネルギー削減が期待できます。データのキャッシング、タイミング整列、計算を全て光学領域で完結させることで複雑さが減り、より高速で高並列な処理への道が開かれます。フォトニック集積が進み、オンチップ光源や増幅器が成熟すれば、このような3Dテンソルエンジンは自動運転、医療画像、映像解析、没入型バーチャル環境といった将来の機器における重要な構成要素となり得ます—光のビームを静かに使って、機械が我々の三次元世界をリアルタイムで見て理解するのを助けるのです。

引用: Wu, Y., Ni, Z., Li, X. et al. Integrated photonic 3D tensor processing engine. Light Sci Appl 15, 154 (2026). https://doi.org/10.1038/s41377-026-02183-y

キーワード: フォトニックコンピューティング, 3Dニューラルネットワーク, 光学アクセラレータ, LiDAR認識, テンソル処理