Clear Sky Science · ru

HQA2LFS — оценка качества почерка с использованием активного обучения на смартфонах

· Назад к списку

Почему ваш почерк всё ещё важен

Даже в эпоху ноутбуков и планшетов ручное письмо по‑прежнему влияет на то, как учителя оценивают домашние работы и как клиницисты выявляют учебные или двигательные нарушения. Но проверка почерка страницу за страницей медленна и субъективна. В этом исследовании представлена система для смартфона, которая фотографирует рукописные страницы и автоматически оценивает, насколько разборчиво, аккуратно и правильно расположено письмо. Сочетая человеческую экспертизу и машинное обучение, она призвана превращать стопки тетрадей в быстрые и надёжные рекомендации для учеников, педагогов и специалистов здравоохранения.

Figure 1
Figure 1.

Преобразование страниц в измеримые закономерности

Исследователи исходят из того, что уже есть у учителя: отсканированные или снятые на телефон страницы учеников, в линейку или в клетку. Программа сначала очищает каждую страницу, устраняя шум и переводя изображение в чёткое чёрно‑белое представление, чтобы чернила явно выделялись на фоне. Движок оптического распознавания затем находит каждое рукописное слово и разбивает страницу на множество маленьких «пятен слова». Для каждого пятна система измеряет распределение штрихов сверху вниз, наклон или прямолинейность строк, равномерность интервалов между словами и то, как текст прилегает к воображаемой базовой линии или отклоняется от неё. Эти измерения переводят визуальное впечатление от страницы в структурированную таблицу чисел, на которой компьютер может обучаться.

Видеть аккуратность так, как это делает человек

Чтобы оценки имели смысл, команда разработала «восприятельный» балл, имитирующий то, как человек оценивает слово с первого взгляда. Балл формируется из четырёх компонентов: насколько плавно выглядят штрихи, насколько контрастно чернила выделяются, сколько посторонних пятен или каракулей присутствует и насколько непрерывны и хорошо сформированы штрихи. Пятно каждого слова также делится на шесть горизонтальных зон сверху вниз, чтобы отследить, правильно ли буквы располагаются на воображаемой базовой линии, насколько последовательно выглядят высокие элементы вроде штрихов‑восходящих частей и не выглядят ли строки стеснёнными или растянутыми. Дополнительные проверки анализируют поведение по краям горизонталей, выявляя текст, который «плавает» над линией или «тонет» ниже неё, а также нерегулярные промежутки между словами и строками.

Обучение системы с меньшим числом размеченных страниц

Ключевая проблема в том, что экспертные оценки дороги: учителям нужно промаркировать много страниц, прежде чем модель начнёт учиться. Для решения авторы применяют стратегию «активного обучения». Изначально 10–12 опытных преподавателей оценивают умеренное количество страниц по простой четырёхуровневой шкале от «плохо» до «отлично». Режессия (регрессионная) модель, особенно древовидные методы вроде Random Forest и XGBoost, обучается предсказывать числовой показатель качества почерка по измеренным признакам. Вместо того чтобы случайно запрашивать новые пометки, система ищет образцы, в которых она наиболее неуверенна или ошибается. Эти страницы показывают в интерактивной панели, где эксперты могут быстро подтвердить или скорректировать предлагаемые оценки. Такой цикл концентрирует человеческие усилия там, где они дают модели наибольшую обучающую пользу, повышая точность без необходимости разметки каждой страницы в большой коллекции.

Figure 2
Figure 2.

Что числа говорят о письме и усталости

На основе двух больших наборов данных — свободно написанных страниц, проверяющих собственное чувство выравнивания писавшего, и страниц в линейку, написанных утром и днём — система обнаруживает закономерности, соответствующие классическому школьному опыту. Большая часть страниц попадает в категории «хорошо» или «отлично», но многие показывают плотные участки, проблемы с интервалами или скошенные строки. На бумаге в линейку оценки склонны слегка снижаться во второй половине дня, а признаки, связанные с потерей концентрации и неравномерными интервалами, становятся более частыми — намёк на усталость или снижение внимания. Модели, обученные на этих признаках, очень точно воспроизводят оценки учителей: корреляции превышают 0.9, а погрешности достаточно малы, чтобы надёжно отличать аккуратную работу от проблемного почерка, даже у тех писавших, которых система раньше не встречала.

От сырых баллов к полезной обратной связи

Проще говоря, исследователи создали ассистента на базе камеры, который может «читать» визуальное качество почерка почти так же последовательно, как комиссия учителей, при этом требуя гораздо меньше экспертной разметки, чем традиционные подходы. Сочетая человеческое суждение, тщательно подобранные визуальные признаки и цикл активного обучения, фокусирующийся на сложных случаях, их рамочная система превращает рукописные страницы в интерпретируемые оценки по аккуратности, интервалам и выравниванию. С дальнейшей доработкой такие инструменты могут лечь в основу школьных приложений, которые выявляют учеников, нуждающихся в дополнительной поддержке, отслеживают усталость или стресс во время экзаменов, а также помогают клиницистам и судебным экспертам, которым важны не только слова, но и то, как именно человек пишет.

Цитирование: Koushik, K.S., Nair, B.J.B., Rani, N.S. et al. HQA2LFS-handwriting quality assessment using an active learning framework in smartphones. Sci Rep 16, 8186 (2026). https://doi.org/10.1038/s41598-026-38330-z

Ключевые слова: оценка качества почерка, съёмка смартфоном, машинное обучение, активное обучение, образовательные технологии