Clear Sky Science · ru

Подход на основе YOLOv12 для автоматического обнаружения цефалометрических ориентиров на двухмерных боковых рентгенограммах черепа

2026-03-10 · Назад к списку

Почему важно находить крошечные точки на рентгенах черепа

Когда ортодонт планирует брекетную терапию, операцию на челюсти или лечение лицевых дисбалансов, он опирается на подробные измерения, выполненные по боковым рентгенограммам головы. Эти измерения зависят от десятков мелких анатомических реперных точек, разбросанных по черепу и лицу. Сегодня многие из этих точек по-прежнему отмечаются вручную — это медленный и частично субъективный процесс. В этой работе исследуется, как современная система искусственного интеллекта (ИИ) — усовершенствованная версия известной семьи детекторов изображений YOLO — может автоматически находить эти ключевые ориентиры на рентгенах черепа, с целью сделать ортодонтическую помощь быстрее, более согласованной и доступной.

От тщательной разметки к автоматическому руководству

В течение почти столетия «цефалометрический анализ» оставался основой ортодонтической диагностики. Врачи рассматривают стандартизованную боковую рентгенограмму и отмечают на черепе и мягких тканях определённые точки — на челюсти, зубах, носу, губах и основании черепа. По этим координатам вычисляют углы и расстояния, которые задают направление лечения. Ручная разметка может занимать 10–15 минут на снимок, и даже опытные специалисты могут расходиться на несколько миллиметров, что важно при тонком планировании терапии. По мере роста нагрузки в стоматологических практиках и стремления к более высокой точности усиливается давление на ускорение этой работы и уменьшение вариабельности, не теряя контроля со стороны экспертов.

Как современный ИИ «видит» рентген

Недавние достижения в области ИИ, особенно в глубоком обучении, изменили способы компьютерной интерпретации изображений. Вместо программирования набора правил, глубокие нейронные сети учатся напрямую на больших наборах размеченных примеров. В медицинской визуализации особенно успешны сверточные нейронные сети, поскольку они автоматически обнаруживают паттерны — от простых границ до сложных анатомических форм. В этом контексте выделяется семейство «You Only Look Once» (YOLO) за быструю однопроходную детекцию объектов. Новейшее поколение, YOLOv12, включает механизмы внимания и мульти масштабную обработку, что особенно полезно для поиска маленьких, плотно расположенных структур, таких как цефалометрические ориентиры.

Создание более умного средства для поиска ориентиров

Авторы объединили две общедоступные коллекции боковых рентгенограмм черепа, всего чуть менее 500 изображений, каждое из которых было аннотировано опытными клиницистами с указанием 19 важных цефалометрических ориентиров. Они преобразовали изображения в более компактный формат и превратили координаты каждой точки в небольшой квадратный «ящик», центрированный на точке, чтобы YOLOv12 — рассчитанный на обнаружение объектов в виде боксов — мог рассматривать каждый ориентир как крошечную цель. С помощью платформы Roboflow они удалили дубликаты и применили умеренные трансформации, такие как небольшие повороты, изменения яркости и шум. Эти вариации фактически утроили количество тренировочных изображений, помогая модели стать более устойчивой к различиям в качестве снимков и анатомии пациентов.

Как происходило обучение и тестирование ИИ

Исследователи обучали крупную модель YOLOv12 на мощном графическом процессоре в течение 50 эпох. Во время обучения внутренние слои модели научились преобразовывать сырой рентген в набор признаков, выделяющих важные области, а выходная «голова» научилась обводить каждый ориентир небольшим ящиком и присваивать ему показатель уверенности. После завершения обучения модель протестировали на 94 рентгенах, которых она ранее не видела. Для оценки производительности команда измеряла расстояние между предсказанными ориентирами и отметками экспертов. Также анализировали кривые precision–recall, шаблоны ошибок между разными ориентирами и подробные графики согласия по конкретным точкам.

Что ИИ сделал хорошо — и где были сложности

В целом система нашла примерно половину всех ориентиров в пределах 1 миллиметра от экспертных отметок и чуть более 80 процентов в пределах 2 миллиметров — диапазон, считающийся приемлемым для многих клинических задач. Лучшие результаты наблюдались для ориентиров с чёткими формами и хорошим контрастом, таких как Sella, Gnathion, Menton и некоторые точки, связанные с зубами: более трёх четвертей предсказаний оказались в пределах 1 миллиметра и свыше 93 процентов — в пределах 2 миллиметров. Модель также неожиданно хорошо справлялась с разделением кластеров близко расположенных точек вокруг подбородка и передних зубов, что указывает на понимание тонких пространственных соотношений, а не только отдельных пикселей. Однако ей было труднее работать с ориентирами в более расплывчатых областях, таких как Gonion, Subspinale, Orbitale, Articulare и Porion. Эти области сложны даже для людей из‑за наложения костей и низкого контраста, а плохое качество рентгена ещё больше снижало точность.

Что это значит для будущей ортодонтической помощи

Авторы приходят к выводу, что их система на базе YOLOv12 ещё не готова заменить человеческих специалистов, но представляет собой убедительный доказательный пример полуавтоматического цефалометрического анализа. Практически такой инструмент мог бы быстро размещать предварительные ориентиры, которые клиницисты затем уточняют, сочетая скорость и согласованность ИИ с профессиональным суждением. При наличии больших и более разнообразных обучающих наборов, улучшенной обработке низкокачественных изображений и дальнейшем совершенствовании модели будущие версии могут приблизиться к клиническому уровню. Если это произойдёт, ортодонты вскоре смогут тратить меньше времени на ручную разметку рентгенов и больше — на использование измерений для разработки персонализированных планов лечения.

Цитирование: Akre, P.D., Ghavghave, Y.G. & Pacharaney, U. A YOLOv12-based approach for automatic detection of cephalometric landmarks on 2D lateral skull X-ray images. Sci Rep 16, 12837 (2026). https://doi.org/10.1038/s41598-026-43250-z

Ключевые слова: цефалометрический анализ, ортодонтическая визуализация, глубокое обучение, обнаружение ориентиров, YOLOv12