Clear Sky Science · ru
Исследование качества работы ИИ при переводе литературной автобиографии: насколько близки модели ИИ к человеческому переводу
Почему это важно для обычных читателей
Сегодня большинство из нас пользуются онлайн‑переводчиками, а некоторые используют ИИ, чтобы читать романы или мемуары на других языках. Но способны ли эти системы по‑настоящему передать эмоции, ритм и культурную глубину житейской истории? В этом исследовании проанализировано, как три популярных ИИ‑системы и профессиональные переводчики справляются с известной китайской литературной автобиографией: где машины демонстрируют силу, где спотыкаются, и что это значит для читателей, которые знакомятся с мировой литературой через экран. 
Истории, переходящие через языки
Исследователи сосредоточились на книге The Great Flowing River — широко признанной китайской автобиографии, которая сочетает личную память с бурной историей военного Китая и послевоенного Тайваня. Англоязычная версия была создана в течение нескольких лет командой опытных переводчиков, тесно работавших с автором, чтобы сохранить и фактическую точность, и сдержанный, эмоционально сдержанный стиль. Этот тщательный человеческий перевод принят за эталон. Против него авторы сравнивают три вывода ИИ: нейронную систему Google Translate, универсальную модель большого языка (ChatGPT‑4o) и более новую модель, сосредоточенную на рассуждении (OpenAI‑o1). Всем им было поручено перевести те же главы с китайского на английский в повседневных, стандартных настройках, как сделал бы типичный пользователь.
Заглядывая под капот языка
Чтобы уйти от субъективных впечатлений о «хорошем» или «плохом» переводе, исследование использует инструмент Coh‑Metrix, который измеряет более ста характеристик английских текстов. Это включает простые подсчёты — например, сколько глаголов или прилагательных встречается — и более тонкие свойства, такие как плотность связности предложений, конкретность словоупотребления и легкость восприятия отрывка. Авторы группируют эти измерения в шесть широких областей: выбор слов, структура предложений, явные связи между идеями, более глубокие концептуальные связи, поверхностные характеристики вроде длины предложений и общая читаемость. Сравнивая показатели по этим измерениям, они количественно показывают, насколько стиль и структура каждого ИИ близки к человеческому переводу. 
Как ведут себя разные ИИ
Три системы ИИ оказываются обладателями различных «личностей». Google Translate склонен использовать более распространённую лексику и относительно простые предложения, делая текст лёгким для чтения, но менее насыщенным и менее привязанным к персональному голосу рассказчика. Он использует меньше местоимений первого лица множественного числа, таких как «we», и меньше выразительных глаголов по сравнению с людьми, что ослабляет ощущение совместного опыта, центральное для автобиографии. Напротив, две модели большого языка отдают предпочтение большему количеству прилагательных и наречий и более широкому словарному запасу. Их формулировки могут казаться более развёрнутыми и динамичными, иногда добавляя описательные штрихи, которые не были подчеркнуты человеческими переводчиками. Это может усилить ясность в некоторых местах, но также рискует нарушить сдержанный тон оригинала, особенно в фрагментах, где сила книги строится на сдержанности, а не на пышности.
Глубина, связность и эмоциональные подтексты
Когда речь идёт о связях идей между предложениями и абзацами, ни одна из систем ИИ полностью не соответствует человеческим переводчикам. Человеческий перевод последовательно использует повторяющиеся существительные, тщательно подобранные связки и явные признаки причинно‑следственных связей, которые помогают читателю следить за сложными событиями и эмоциональными сдвигами. ИИ часто меньше полагаются на такие явные указатели. В то же время они иногда чрезмерно подчёркивают действие и причинность, употребляя много причинно‑следственных и целевых глаголов, что делает ситуации более прямолинейными, но и более буквальными по сравнению с оригиналом. Модель, ориентированная на рассуждение — OpenAI‑o1, — особенно склонна выводить дополнительные детали, например уточнять полное имя политического лидера или превращать «изменение обстоятельств» в «кризис». Такие догадки могут сделать повествование более прямым, но также отдалить его от того, что действительно написал автор.
Какая ИИ кажется наиболее похожей на человека
По многим измерениям ChatGPT‑4o оказывается ближе всего к профилю человеческих переводчиков. В целом он предлагает более богатую лексику и формулировки, чувствительные к контексту, чем Google Translate, при этом избегая некоторых более смелых интерпретаций, свойственных OpenAI‑o1. Google Translate, хотя и менее нюансирован, часто остаётся ближе к поверхностному словоупотреблению и даёт очень читаемый текст, особенно для неспециализированной аудитории. OpenAI‑o1, несмотря на разработку с упором на «более глубокое мышление», в целом наименее согласуется с человеческим переводом. Его сильные стороны в рассуждении приводят к тому, что он переформулирует или расширяет отдельные выражения способами, которые могут быть стилистически неуместны или культурно неточны для этого типа литературного текста.
Что это значит для читателей и переводчиков
Для обычного читателя вывод таков: современные ИИ уже способны производить переводы литературной автобиографии, которые выглядят плавно и порой впечатляют — однако им всё ещё недостаёт мастерства человеческих экспертов в сохранении голоса, тонких эмоциональных оттенков и культурной нюансировки. Среди протестированных систем ChatGPT‑4o в настоящий момент предлагает наиболее приближённый к профессиональной работе результат, а Google Translate не сильно отстаёт в практической читаемости. Модель, ориентированная на рассуждение, в этой задаче отстаёт. Тем не менее люди‑переводчики остаются незаменимы: их способность учитывать историю, культуру и стиль позволяет создавать цельные, эмоционально слоистые повествования, которые машины лишь частично воспроизводят. По мере совершенствования инструментов ИИ исследование показывает, что их лучше рассматривать не как замену литературным переводчикам, а как мощные помощники, которым по‑прежнему требуется человеческое суждение, чтобы полностью перенести жизненные истории через языки.
Цитирование: Huang, Y., Cheung, A.K.F. Exploring AI’s performance in literary autobiography translation: how closely do AI models match human translation. Humanit Soc Sci Commun 13, 518 (2026). https://doi.org/10.1057/s41599-026-06630-4
Ключевые слова: художественный перевод, машинный перевод, модели большого языка, китайская автобиография, ИИ против человеческих переводчиков