Clear Sky Science · ru
Набор задач по естествознанию на китайском языке для генерации процесса решения задач
Помощь детям в изучении науки с помощью более умного ИИ
Родители и учителя все чаще воспринимают искусственный интеллект как потенциального партнера по обучению, но текущие чат-боты часто дают объяснения, которые либо слишком поверхностны, либо чрезмерно сложны для детей. В этой статье представлен новый набор вопросов для начальной школы на китайском языке (CSQ), разработанный, чтобы научить большие языковые модели объяснять научные понятия так, как это делает хороший учитель начальной школы: шаг за шагом, на подходящем уровне сложности и в тесном соответствии с тем, чему дети действительно учатся в классе.

Новый банк вопросов для юных изучающих науку
Набор CSQ — это коллекция из 12 000 тщательно составленных научных вопросов, взятых из китайской программы начальной школы, школьных экзаменов и надежных онлайн-источников. Вопросы охватывают четыре широкие области — биологию, физику, науку о Земле и космосе, а также технологии и инженерию — для классов с 1 по 6. В отличие от многих существующих банков, которые содержат только вопрос и правильный ответ, каждый элемент CSQ также включает информацию об уровне класса, теме и проверяемых научных навыках, а также полный, соответствующий возрасту объяснительный разбор решения.
Фиксация того, как дети действительно мыслят
Ключевой инновацией CSQ является фокус на «мыслительном процессе решения» за каждым ответом. Для каждого вопроса эксперты подробно описывают процесс рассуждения языком и в той степени подробности, которая подходит для целевого класса. Для младших детей объяснения остаются конкретными и наблюдательными — например, описывается то, что можно увидеть или почувствовать. Для старших учеников постепенно вводятся более абстрактные идеи, такие как системы, причинно-следственные связи или простые модели. Каждый элемент также помечает ключевые задействованные навыки, такие как наблюдение явления, сравнение двух объектов или определение функции инструмента. Такая структура позволяет моделям ИИ не просто называть правильный ответ, но и практиковаться в проведении того типа рассуждений, которым ожидается овладеть учащимся.
Создание набора с учетом реальной школьной практики
Создание CSQ потребовало структурированного, ориентированного на человека процесса. Команда из 19 исследователей с опытом в области естественного образования и ИИ разделила работу на этапы. Старшие участники команды собирали вопросы из официальных учебных стандартов, экзаменационных материалов и энциклопедий, обеспечивая их законную повторную использование. Аспиранты затем адаптировали и аннотировали вопросы так, чтобы они соответствовали форматам множественного выбора или верно/неверно и соответствовали официальным Стандартам по естествознанию для обязательного образования (2022). В их обучении делался упор на использование словарного запаса и когнитивной глубины, соответствующих уровню класса. Каждый элемент данных — вопрос, свойства дисциплины и решение — проверялся другим аннотатором, а разногласия относительно правильных навыков или глубины объяснения решались с опорой на национальные стандарты.
Обучение ИИ показывать свои рассуждения
Чтобы оценить ценность CSQ, исследователи дообучили несколько моделей открытого исходного кода, а также оценили ведущую коммерческую модель на этом наборе данных. Они измеряли не только то, правильно ли модели выбирают вариант в тестах множественного выбора. Они также оценивали качество генерируемых рассуждений с помощью автоматических текстовых метрик и экспертных человеческих оценок. После дообучения на CSQ модели с открытым кодом продемонстрировали явный рост точности и улучшение ясности и полноты объяснений. Например, модель, которая ранее отвечала на детский вопрос о звуке, используя продвинутую волну теории, после дообучения сместилась к более простому, соответствующему возрасту описанию. Человеческие судьи отметили, что дообученные модели гораздо лучше удерживаются в рамках уровня класса ребенка, избегая «избыточного знания», когда чрезмерно технические идеи скорее запутывают, чем помогают.

Ограничения сегодня, шаблон для завтра
Авторы признают, что CSQ отражает структуру китайской учебной программы по науке и фокусируется только на форматах вопросов вроде множественного выбора и верно/неверно, а не на практических экспериментах или открытых проектах. Объяснения были написаны обученными аспирантами, а не школьными учителями или самими детьми, поэтому предстоит еще работа, чтобы полностью соответствовать реальному языку классов. Несмотря на это, основа CSQ — связь каждого вопроса с предметом, темой, классом, конкретными навыками и пошаговым рассуждением — достаточно универсальна, чтобы вдохновлять аналогичные ресурсы для других языков и школьных систем. Проще говоря, эта работа показывает, как тщательно продуманные наборы вопросов могут помочь ИИ стать более надежным и чувствительным к возрасту научным репетитором для юных учеников.
Цитирование: Li, D., Liu, Z., Wen, C. et al. A Chinese Elementary Science Question Dataset in Problem-Solving Process Generation. Sci Data 13, 291 (2026). https://doi.org/10.1038/s41597-026-06618-4
Ключевые слова: начальное естественное образование, большие языковые модели, набор вопросов и ответов, персонализированное обучение, китайская учебная программа