Clear Sky Science · ja

LIMO: エッジコンピューティング向けの低消費電力インメモリアニーラと行列乗算プリミティブ

· 一覧に戻る

より賢い経路とスリムなチップ

企業は日々、何千もの停留所を訪れる配送トラックの最短ルートを見つける問題や、バッテリー駆動のカメラで顔を素早く検出するために画像を走査する問題などに直面しています。これらはメモリとプロセッサ間で大量のデータを往復させる現行のコンピュータに大きな負荷をかけます。本稿は、データをそのまま保持したまま困難な経路計画問題やAIモデルの実行を行う新しい低消費電力コンピューティングブロック「LIMO」を紹介し、将来のエッジデバイスをより高速かつ省電力にする可能性を示します。

なぜ良い経路を見つけるのは難しいのか

本研究の中心にあるのはよく知られた巡回セールスマン問題です:多数の都市が与えられたとき、各都市を一度だけ訪れて出発点に戻る最短巡回を見つけよ、という問題です。地図が小さい場合は厳密な数学的手法で最適解が得られますが、都市の数が数万に達すると、可能な巡回の数は爆発的に増え、高性能な計算機でも処理が追いつきません。シミュレーテッドアニーリングのようなヒューリスティックは、ときには悪化する中間解を受け入れて局所解に陥るのを避けながら、完全ではないが良好な巡回を探索します。しかし、標準的な手法は非常に大規模な問題では探索空間を非効率に調べ、メモリとCPU間のデータ移動に時間を浪費してしまい、いわゆる「メモリ壁」に直面します。

Figure 1
Figure 1.

可能性の探索における新しい手法

著者らは、Significance Weighted Annealed Insertion(SWAI)と呼ぶ新しいアルゴリズムを提案し、候補巡回の探索方法を再構成します。都市のペアを入れ替え続ける従来の手法は、都市数が増えるとスケールが悪くなりますが、SWAIは巡回を一度に一つずつ都市を挿入して段階的に構築します。各ステップでは、次の都市を貪欲に最寄りのものから選ぶこともあれば、短い候補辺を好むが長い辺を完全には排除しない制御された乱択に依存することもあります。このバイアスは時間とともに調整され、探索の初期ではより冒険的に、進行するにつれて保守的になります。各ステップが都市数に対して線形にしか増えない方法で選択肢を検討するため、従来のシミュレーテッドアニーリングよりも長距離の改善をより効果的に探索できます。

組み込みの乱数でメモリ内計算を実現

LIMOは回路と探索手法を密に協調設計することでこのアルゴリズムをハードウェア化します。中核には現在の巡回と都市間距離を格納し、主要な更新ステップを別のプロセッサと頻繁にやり取りすることなく実行する改変メモリアレイがあります。アルゴリズムで必要となるランダムな選択は、スピン転送トルク磁気トンネル接合(STT-MTJ)と呼ばれる小さな磁気デバイスから得られ、適切な電流を与えると自然に予測不能に状態が反転します。設計者はこの物理的な乱数をデジタルビットに変換し、単純な比較回路でアルゴリズムの確率的判断を実装します。多くの演算がデジタルのままメモリ内部で行われるため、巨大なコンバータや扱いにくいアナログ回路を避けられ、消費電力と面積の節約につながります。

大きな問題を分割して解く

85,900都市にも及ぶ非常に大きな経路計画問題に対処するため、システムは分割統治戦略を採用します。軽量な幾何学的手法で近接する都市をクラスタにまとめ、各クラスタが単一のLIMOブロックに収まる大きさになるまで繰り返します。ハードウェアはこれら多数の部分巡回を並列に解き、後でそれらを結合して完全な巡回にします。さらに改良ステップで全体ルートを磨き上げます:巡回の区間をハードウェアで再最適化し、通常のプロセッサで古典的な「2-opt」クリーンアップを行って交差経路を除去します。標準ベンチマーク上の試験では、この複合的アプローチは従来の専用アニーリング機より高品質な巡回を生成し、最大規模の問題では解答をおおむね5倍程度高速に得られました。

Figure 2
Figure 2.

困難な経路問題から効率的なAIへ

LIMOは経路計画に限られません。同じメモリアレイはベクトル–行列乗算を実行することでニューラルネットワークの構成要素としても機能します。これは画像認識やパターン認識の基幹演算です。アナログ信号を読み取るための高精度で消費電力の大きいコンバータを使う代わりに、LIMOは蓄積信号の符号(サイン)だけを捉える非常に簡素な検出回路に依存し、この粗さをハードウェアを意識した学習で補償します。画像分類や顔検出のタスクでは、これらのネットワークは標準的なソフトウェアモデルに近い精度を達成しつつ、従来の計算インメモリチップと比べて消費エネルギーと応答時間を削減しました。日常の利用者にとって、これは将来カメラやドローンなどのエッジデバイスが複雑な計画問題を解き、より長時間バッテリでAIモデルを実行できるようになることを意味します。それはすべて、データが存在する場所で直接より賢く探索し計算することによって実現されます。

引用: Holla, A., Chatterjee, S., Sen, S. et al. LIMO: Low-power in-memory-annealer and matrix-multiplication primitive for edge computing. npj Unconv. Comput. 3, 10 (2026). https://doi.org/10.1038/s44335-026-00054-8

キーワード: インメモリコンピューティング, 巡回セールスマン問題, ハードウェアアニーリング, 低消費電力AI, エッジコンピューティング