Clear Sky Science · ru
Оптимизация выборки тестовых случаев для валидации безопасности систем автоматического вождения
Почему более безопасные «водители‑роботы» важны для всех
Автомобили с автономным управлением обещают меньше аварий, более плавные поездки и новую мобильность для тех, кто сейчас не может водить. Но прежде чем общество начнёт доверять таким системам, требуется убедительное доказательство того, что они по крайней мере не уступают людям по безопасности. Это доказательство зависит от того, как мы их тестируем: в каких ситуациях подвергаем проверке и как определяем «прошёл/не прошёл». В статье рассматривается центральная проблема этого процесса — как выбрать небольшое, но информативное множество дорожных ситуаций, которое действительно отражает запутанный, непредсказуемый реальный мир, включая редкие, но опасные моменты, в которых происходят аварии.

От бесконечных дорог к разумному списку тестов
На реальных дорогах большинство поездок проходит без происшествий. Серьёзные аварии редки, но именно они имеют ключевое значение для безопасности. Если регуляторы пытались бы проверять автономные автомобили, просто проезжая миллиарды миль и ожидая исхода, проверка заняла бы годы и потребовала бы огромных затрат. Инженеры вместо этого формируют библиотеки тестовых случаев — коротких фрагментов поездки, которые можно проигрывать на полигонах или в симуляторах. Сложность в том, какие случаи включить. Традиционные подходы опираются на несколько знакомых шаблонов, например следование за другим автомобилем или плавное торможение, либо на модельные симуляции, лишь приблизительно имитирующие поведение участников дорожного движения. В результате многие тонкие или необычные ситуации, приводящие к реальным авариям, могут быть упущены, и итоговые показатели безопасности окажутся смещёнными.
Добыча из реального трафика ключевых моментов
Авторы опираются на крупнейшее в США натуралистичное исследование вождения: проект, в рамках которого тысячи автомобилей были оснащены камерами, радаром и датчиками движения, и записано десятки миллионов миль обычных поездок и аварий. Из этого массива они формируют пул примерно из 56 000 обычных 15‑секундных поездок и 90 реальных последовательностей аварий, каждая из которых описана 48 измерениями — как двигался автомобиль, как вели себя рядом находящиеся транспортные средства и насколько плотной была обстановка. Тестовый случай может, например, показывать автомобиль, едущий по шоссе с высокой скоростью, когда другой внезапно вклинивается, или спокойный участок на неровной дороге без близких соседей. Этот пул служит статистически верной миниатюрой того, что реально происходит на дорогах США.
Баланс между обычными сценами и редкой опасностью
Чтобы превратить огромный пул в практический список тестов, команда предлагает метод Kernel Test Case Sampling (KTCS). Метод строится вокруг двух простых целей. Во‑первых, представительность: выбранные случаи в совокупности должны напоминать полную смесь повседневного вождения, так чтобы доли спокойных и напряжённых моментов соответствовали тому, что люди действительно испытывают. Во‑вторых, покрытие: в список также должны попасть достаточное количество необычных, высокорисковых ситуаций — длинный хвост редких, но информативных событий, в которых автономные системы с большей вероятностью дают сбой. Математически KTCS использует инструменты современной статистики и машинного обучения для поиска в пространстве признаков маленькой группы случаев, которые одновременно распределены так, чтобы покрывать экстремальные условия и, при соблюдении аккуратно подобранных весов, имитировать общую распределённость реального вождения.

Как тестируется новый метод
Исследователи сравнивают KTCS с несколькими ведущими стратегиями выборки, которые либо равномерно распределяют случаи, либо сосредотачиваются на плотных областях, либо таргетируют редкие выбросы. Всем методам предложено выбрать всего 118 случаев из большого пула. Визуальные диаграммы и численные оценки показывают, что KTCS лучше всего захватывает форму исходных данных: он тесно соответствует реальному вождению по каждому из 48 измеряемых признаков, при этом выбирает множество далёких от типичных случаев, где условия более экстремальны. Конкурирующие методы либо чрезмерно концентрируются на самых безопасных, часто встречающихся сценах, либо гонятся практически только за экстремумами, теряя связь с повседневной реальностью. KTCS, напротив, даёт компактный набор, который статистически похож на весь трафик, но при этом включает самые критичные для безопасности сценарии.
Преобразование результатов тестов в понятную оценку безопасности
Построив этот уточнённый набор тестов, авторы показывают, как его использовать для оценки системы автоматического вождения. Каждый случай прогоняется один раз в симуляторе или на полигоне; «прошёл» означает отсутствие аварии, «не прошёл» — авария. Поскольку у каждого случая есть связанный вес и подразумеваемое пройденное расстояние, команда комбинирует шаблон «прошёл–не прошёл» в оценённую частоту аварий для системы, выраженную на метр проезда. Затем эту частоту сравнивают с частотой аварий водителей‑людей, измеренной в том же национальном исследовании, определяя величину, называемую «Scaling Risk» — насколько раз рискованнее или безопаснее автоматизированная система по сравнению с людьми. Критически важно, что провал в распространённом, тяжело взвешенном сценарии вносит куда больший вклад против системы, чем провал в редком крайнем случае, отражая то, как часто люди действительно сталкиваются с каждой ситуацией на дороге.
Что это значит для будущих автономных автомобилей
Главный вывод исследования в том, что можно заменить метод «гнать километры силой» на тщательно подобранный набор реальных сценариев и при этом получить справедливую оценку безопасности. KTCS предлагает принципиальный способ собрать такой набор так, чтобы он покрывал как рутинные, так и рискованные ситуации, и превратить результаты в понятную оценку «насколько это безопаснее или опаснее людей». Такой стандартизованный, статистически обоснованный тест может помочь регуляторам, компаниям и общественности уверенно судить о том, что системы автоматического вождения оцениваются по реалистичным, всесторонним данным, а не по ретиво отобранным демонстрациям или чрезмерно упрощённым лабораторным тестам.
Цитирование: Qian, C., Xu, J., Xing, X. et al. Test case sampling optimization for safety validation of automated driving systems. Nat Commun 17, 3114 (2026). https://doi.org/10.1038/s41467-026-69675-8
Ключевые слова: безопасность автоматического вождения, выборка тестовых случаев, натуралистичные данные вождения, сценарии крайних случаев, валидация самоуправляющегося автомобиля