Clear Sky Science · ja
PISA 2018「グローバル・コンピテンス」評価の妥当性と公平性:説明的項目反応モデルによる論証的評価
この研究が日常生活にとって重要である理由
今日のティーンエイジャーは、ニュースや友人、将来の仕事が国境を越えて行き交う世界で育っています。学校は、異なる文化を渡り歩き、オンライン情報を見分け、異質な人々と協働する力を育てようとしています。国際的な学習到達度調査(PISA)は2018年にこの「グローバル・コンピテンス」を測る試みを行いました。本研究は単純だが重要な問いを投げかけます:そのテスト得点を本当にグローバル・コンピテンスを示すものとして信頼できるか、そして異なる学生集団に対して公平か、という点です。

世界規模の学校テストを詳細に見る
PISA 2018のグローバル・コンピテンステストは多くの国の15歳が受験し、教育システムが相互に結びついた世界に若者をどれだけ備えさせているかの重要な指標と見なされました。しかし、研究者や教育関係者の間では、グローバル・コンピテンスという概念は定義しにくく、西洋的視点や文化的偏りに影響されるのではないかという懸念がありました。本稿は、テストを受けたカナダの生徒に焦点を当て、問題と結果を綿密に精査します。著者は妥当性に関する体系的なアプローチを採り、まず解答の採点が一貫して行われているかを問い、次に異なるテスト版で得点が類似するか、他のグローバル・コンピテンス指標と一致するか、そして最後に男女に対して公平であるかを検討します。
テストと生徒の分析方法
研究者は、項目を正答したか否かにとどまらず、問題の特徴や受験者の特徴が各設問の難易度にどう影響するかを同時に扱う現代的な統計手法群を用いました。PISAのグローバル・コンピテンス項目は「テストレット」と呼ばれる小さな物語形式のセットにまとめられ、複数のブックレット(フォーム)で配布されます。本研究では各ブックレット群を個別に扱い、少量の欠損データは慎重に代入し、その後メタ解析で群を統合しました。テスト得点に加えて、グローバル問題への対応に対する自信、他文化の人々への敬意、異文化コミュニケーションへの気づき、移民に対する態度といった生徒の調査回答も用いられました。
得点の質についての所見
解析の結果、物語形式の問題群自体が項目の難易度を歪めることはほとんどありませんでした。つまり、シナリオ内に設問をまとめただけで、全体的な能力を考慮すれば結果が強く左右されることはなかったのです。ただし、いくつかのブックレットは他より若干難しくなっており、どのフォームが配られたかによって得点がわずかに上下する可能性が示唆されました。生徒レベルでは、グローバル問題に対応する自信が高いこと、文化的多様性への敬意があること、異文化間コミュニケーションへの感度が高いことは、認知的課題での成績向上と結びつく傾向がありました。これらの関連は概して各ブックレットで安定していました。一方で、グローバル志向や世界問題への意識といった一部の測定は、テスト成績と弱い、あるいはわずかに負の関連を示し、グローバル・コンピテンスがいかに複合的で多層的かを示しています。

男女間の公平性の検証
研究はまた、全体的な能力を統制した上で特定の設問が女子または男子に不当に有利になっていないかを調べました。大半の項目では性別差はごく小さく一貫性に欠け、両群で項目の振る舞いは類似していました。ただし一部の設問では中程度から大きめの有利さが見られ、よりしばしば女子に有利で、稀に男子に有利なケースもありました。これらは数は少ないものの、テストフォームを通じて一貫していたため、再検討に値します。重要なのは、テスト全体がいずれかの性別に対して不利に偏っているという兆候はなく、個別の設問を改良または置き換える余地があるという点です。
グローバル・コンピテンス得点の活用に向けての意味合い
テスト分野外の読者にとっての結論は、カナダの生徒に対するPISA 2018のグローバル・コンピテンス得点は概ね妥当であるということです:得点は若者がグローバルかつ異文化的状況をどのように考え、反応するかに関わる実在の能力を捉えており、概して公平な方法で測られています。と同時に、本研究は、どのブックレットが配られたかや調査特性の定義といったテスト設計の細部が結果に微妙に影響を与えうることを強調します。グローバル・コンピテンスのように豊かな概念を測ることは可能ですが、設問の書き方、設問のまとめ方、異なるタイプの生徒に対する働き方に常に注意を払うことが求められます。
引用: Yavuz, E. Validity and fairness of the PISA 2018 Global Competence assessment: an argument-based evaluation via explanatory item response models. Humanit Soc Sci Commun 13, 570 (2026). https://doi.org/10.1057/s41599-026-06979-6
キーワード: グローバル・コンピテンス, PISA 2018, 教育評価, テストの公平性, 項目反応モデリング