Clear Sky Science · ru
Единая система классификации временных рядов через адаптивное представление в виде гауссовских изображений
Преобразование сложных временных сигналов в изображения
От сердечных ритмов и мозговых волн до цен акций и транспортных потоков — большая часть цифровых данных представлена в виде временных рядов: чисел, меняющихся во времени. Эти запутанные потоки трудно надёжно классифицировать компьютерам, особенно когда данные поступают сразу от множества датчиков или имеют разную длину. В этой статье предложен способ превратить такие неупорядоченные сигналы в изображения, понятные современным моделям компьютерного зрения, что упрощает создание надёжных систем для мониторинга здоровья, финансов и повседневных устройств. 
Почему временные ряды так трудно классифицировать
Временные ряды в реальном мире редко ведут себя аккуратно. Разные датчики могут записывать с разной частотой, вдруг останавливаться или запускаться, а также давать зашумлённые показания. В одних задачах отслеживают один сигнал, например сердечный ритм, в других объединяют десятки каналов — движение, мышечную активность и мозговые волны вместе. Традиционные методы либо вручную выделяют признаки, либо используют глубинные модели, работающие напрямую с сырыми последовательностями. Эти подходы могут давать результаты, но часто слабо обобщаются на разные наборы данных и требуют тщательной настройки для каждой новой задачи.
От одномерных волн к двумерным изображениям
Авторы предлагают TS2Vision — систему, преобразующую временные ряды в изображения перед классификацией. Сначала каждый канал стандартизируется и плавно масштабируется так, чтобы более короткие и более длинные последовательности получили общую длину. Затем адаптивное отображение, называемое Adaptive Time Series Gaussian Mapping, превращает каждый момент времени в маленькую квадратную плитку на изображении. Внутри этой плитки каждому каналу соответствует круглая область. Внутри каждого круга рисуется колоколообразный профиль, управляемый текущим значением сигнала. Этот подход фиксирует локальные подъёмы и спады плавно и робустно к шуму.
Упаковка множества сигналов в единый обзор
Ключевая задача — как разместить все эти круглые области так, чтобы они не перекрывались и при этом эффективно использовали ограниченное пространство плитки. Авторы рассматривают это как задачу упаковки кругов: как плотно поместить равные круги в квадрат. Они опираются на проверенные схемы из геометрических исследований, чтобы расположить круги для любого числа каналов. Эти схемы фиксированы заранее, поэтому модель не тратит ресурсы на обучение расположения каждого канала. По мере движения времени плитки упорядочиваются в последовательность, формируя больший образ, который сохраняет и изменения каждого сигнала, и отношения между каналами. 
Позволяя моделям зрения «читать» время
Когда временной ряд преобразован в изображение, TS2Vision передаёт его Vision Transformer — тип модели, изначально разработанный для распознавания изображений. Эта модель разбивает картинку на небольшие плитки и использует механизмы внимания, чтобы связывать шаблоны в отдалённых частях изображения, которые здесь соответствуют отдалённым временным моментам. Авторы математически показывают, что их отображение стабильно: небольшие изменения входных сигналов приводят лишь к ограниченным изменениям изображения, что помогает классификатору оставаться устойчивым при зашумлённости данных или дрожании датчиков.
Тестирование на множестве реальных наборов данных
Чтобы оценить практическую эффективность TS2Vision, исследователи протестировали его на 158 эталонных наборах данных из двух крупных архивов. Они охватывают широкий спектр областей: показания устройств, захват движения, медицинские записи, изображения, превращённые во временные ряды, и другие. Как на задачах с одним каналом, так и с несколькими каналами, TS2Vision показал лучшее среднее ранжирование среди современных методов глубокого обучения и сопоставимую точность по сравнению с ведущими неди́повыми методиками, сохраняя при этом разумное время обучения. Метод также продемонстрировал высокую стойкость при добавлении искусственного шума, ухудшаясь более мягко, чем конкурирующие модели.
Что это значит для повседневных систем
Проще говоря, TS2Vision показывает, что обработка временных рядов как тщательно продуманных изображений может раскрыть потенциал компьютерного зрения для временных данных. Комбинируя стабильный, адаптивный способ отрисовки сигналов в виде изображений с мощной моделью зрения, этот фреймворк предлагает единый метод, работающий с самыми разными датчиками и длинами последовательностей. Для разработчиков систем мониторинга и принятия решений это означает более универсальный инструмент, способный работать с разнообразными и зашумлёнными данными, оставаясь достаточно эффективным для практического применения.
Цитирование: Ren, X., Li, D., Gao, X. et al. A unified time series classification framework via adaptive Gaussian image representation. Sci Rep 16, 14817 (2026). https://doi.org/10.1038/s41598-026-44760-6
Ключевые слова: классификация временных рядов, представление в виде изображения, vision transformer, многомерные датчики, устойчивое кодирование