Clear Sky Science · ru

Аналоговые вычисления в памяти для неотрицательной матричной факторизации

· Назад к списку

Почему важно разбивать большие данные на части

Повседневные сервисы — от рекомендаций фильмов до приложений для фотографий и генетического анализа — опираются на поиск закономерностей в огромных таблицах чисел. Популярный метод для этого называется неотрицательной матричной факторизацией (NMF): он разбивает большую таблицу данных на более простые строительные блоки, которые легче интерпретировать. Но по мере того как наборы данных разрастаются до миллионов пользователей, объектов или пикселей, современные цифровые чипы испытывают затруднения при обработке в реальном времени. В этой работе показано, как аналоговый подход с вычислениями в памяти способен выполнять эту тяжёлую математическую работу гораздо быстрее и с куда меньшими затратами энергии, открывая путь к более отзывчивым и эффективным сервисам на базе ИИ.

Figure 1
Figure 1.

Вычленение закономерностей из гигантских таблиц

В основе работы лежит неотрицательная матричная факторизация (NMF) — метод, который принимает большую сетку неотрицательных чисел, например оценки пользователей фильмов или значения пикселей изображения, и переписывает её как произведение двух меньших матриц. Одна матрица представляет скрытые «признаки» (например, склонность пользователя к боевикам или романтике), а другая показывает, насколько сильно каждый объект или пиксель проявляет эти признаки. Поскольку все значения остаются неотрицательными, эти признаки часто выглядят как интуитивно понятные части: компоненты лица на изображениях или профили предпочтений в данных рекомендаций. Это делает NMF популярной в системах рекомендаций, биоинформатике, обработке изображений и кластеризации, но одновременно и вычислительно требовательной при очень больших и разреженных наборах данных.

Почему цифровые чипы упираются в пределы

Традиционные процессоры — CPU, GPU и даже FPGA — выполняют матричные операции как длинные последовательности базовых шагов, постоянно перемещая данные между памятью и вычислительными блоками. Для задач умеренного размера это работает неплохо, но для современных наборов данных с миллионами строк и столбцов затраты времени и энергии становятся огромными. Замедление закона Мура и так называемое «бутылочное горлышко фон Неймана», когда доступ к памяти доминирует по энергопотреблению и задержке, всё сильнее затрудняют масштабирование NMF до приложений в реальном времени — например, для живых рекомендаций или быстрой обработки изображений. Даже продуманные цифровые алгоритмы сталкиваются с полиномиальной сложностью и интенсивным трафиком памяти, когда матрицы нужно многократно обновлять.

Вычисления внутри памяти с помощью аналоговых сигналов

Авторы идут иным путём, используя аналоговые матричные вычисления на основе резистивных элементов памяти, известных как мемристоры. Эти устройства можно размещать в плотных кроссбар‑массивах, где каждое пересечение хранит значение проводимости. При подаче напряжений с одной стороны массива тока, снимаемые с другой стороны, естественным образом выполняют множество операций умножения и суммирования параллельно. Соединив такие массивы в замкнутую петлю с небольшим числом операционных усилителей, исследователи создают компактную схему обобщённого инверсного блока (GINV), которая решает целые регрессионные задачи по существу за один аналоговый шаг, а не в многочисленных цифровых итерациях. Они совершенствуют конструкцию с помощью схемы компенсации проводимости, которая поддерживает стабильность цепи и при этом резко сокращает число усилителей, экономя площадь кристалла и энергию.

Figure 2
Figure 2.

От математического приёма к рабочему оборудованию

Чтобы сделать это практичным для NMF, исследователи сочетают компактную схему GINV с хорошо известной стратегией, называемой поочерёдным методом неотрицательных наименьших квадратов. Вместо того чтобы пытаться решить за раз обе матрицы факторов — что является трудной невыпуклой задачей — метод поочерёдно улучшает одну матрицу, фиксируя другую, разбивая задачу на цепочку более простых неотрицательных задач регрессии, которые аналоговая схема способна решать. Они изготовили массивы мемристоров на оксиде гафния и собрали платформу на печатной плате, после чего продемонстрировали два ключевых применения. Для сжатия изображений фотографию туманности разбивают на маленькие патчи, факторизуют, что позволяет сократить объём хранения вдвое при воспроизведении изображения с лишь незначительной потерей визуального качества. Для систем рекомендаций они факторизуют данные оценок пользователей‑предметов, например набор MovieLens 100k, точно предсказывая пропущенные оценки, даже при экстремальной разреженности матрицы.

Скорость, энергоэффективность и устойчивость в реальных условиях

Помимо базовой корректности, аналоговый решатель демонстрирует впечатляющие преимущества по скорости и энергии. Поскольку ток через кроссбар отражает множество операций, выполненных одновременно, время на решение задачи регрессии становится почти независимым от размера матрицы, что резко контрастирует с цифровыми методами. Оценки на уровне системы указывают на ускорения от сотен до тысяч раз по сравнению с современными реализациями на FPGA и GPU, а также на улучшение энергоэффективности на несколько порядков. Возможно неожиданно, аналоговая природа аппаратуры оказывается не уязвимостью, а преимуществом: алгоритм NMF естественным образом терпим к шуму устройств и ошибкам программирования, и в моделированиях итоговое качество изображений и рекомендаций остаётся высоким даже при заметной неточности значений мемристоров или их дрейфе с изменением температуры.

Что это значит для повседневных технологий

Проще говоря, исследование показывает, что новый вид «калькулятора в памяти» может выполнять один из базовых инструментов современной науки о данных гораздо быстрее и эффективнее, чем современные цифровые чипы. Встраивая матричную факторизацию прямо в компактные аналоговые схемы, такие сервисы, как рекомендательные ленты, персонализированная ранжировка контента и обработка изображений на устройстве, в будущем смогут работать в реальном времени и при этом потреблять гораздо меньше энергии. Работа предлагает как схему цепи, так и экспериментальное подтверждение того, что аналоговые вычисления в памяти способны обрабатывать реалистичные наборы данных с точностью, близкой к программной обработке с полной точностью, указывая на будущее аппаратное обеспечение, которое сможет просеивать массивные потоки данных так же легко, как свет проходит сквозь стекло.

Цитирование: Wang, S., Luo, Y., Zuo, P. et al. In-memory analog computing for non-negative matrix factorization. Nat Commun 17, 1881 (2026). https://doi.org/10.1038/s41467-026-68609-8

Ключевые слова: аналоговые вычисления в памяти, неотрицательная матричная факторизация, мемристорный кроссбар, сжатие изображений, системы рекомендаций