Clear Sky Science · ar
فهم تأثير بيانات ما قبل التدريب على نماذج القاعدة الشبكية للشبكية باستخدام مجموعتين كبيرتين من صور قاع العين
لماذا تفحصات العين وبيانات تدريب الذكاء الاصطناعي مهمة
لم تعد فحوصات العين تُستخدم فقط لاكتشاف أمراض العين، بل باتت تكشف أيضاً دلائل عن الصحة العامة، من مرض السكري إلى خطر السكتة الدماغية. يمكن لأنظمة ذكاء اصطناعي قوية تُدعى نماذج القاعدة أن تتعلم من ملايين هذه الصور ثم تُكيَّف لمهام طبية متعددة. يطرح هذا البحث سؤالاً بسيطاً لكنه مهمّاً: هل نوع البيانات التي نستخدمها لتدريب هذه النماذج—من هم المرضى، من أين جاؤوا، وكيف تبدو صورهم—يُغيّر من مدى كفاءة وعدالة عمل النماذج؟

مجموعتان هائلتان من صور العين على قارتين مختلفتين
بنى الباحثون تحقيقهم حول مجموعتين كبيرتين جداً من صور الشبكية، احتوت كل منهما على نحو 900,000 صورة. جاءت إحداهما من مستشفى مورفيلدز للعيون في المملكة المتحدة، وهو مستشفى متخصص يُرجّح أن يكون مرضاه أكبر سناً ولديهم مزيد من أمراض العين. بينما أتت الأخرى من برنامج شنغهاي للوقاية من السكري في الصين، وهو برنامج فحص مجتمعي يضم بالغين أصغر سناً ومعظمهم بصحة جيدة. إلى جانب الاختلاف في العمر والحالة الصحية، اختلفت المجموعتان في توازن الجنسين، والتركيب الإثني، وأجهزة الكاميرا المستخدمة لالتقاط الصور. قام الفريق بقياس هذه الاختلافات بعناية باستخدام معلومات أساسية مثل العمر والجنس، وميزات صور مستخرجة حاسوبياً، ومقاييس سريرية ذات مغزى للأوعية الدموية والعصب البصري في الجزء الخلفي من العين.
تدريب نموذجين توأمين لاختبار الأداء العام
باستخدام إجراءات تدريب متطابقة، أنشأ الفريق نموذجَيْن "توأمَيْن" لأساسيات الشبكية: أحدهما تدرب فقط على صور المستشفى البريطانية والآخر فقط على صور برنامج الفحص الصيني. تعلّم كلا النموذجين بطريقة ذاتية من صور غير معنونة، ثم تكيّفا لمهام محددة مثل الكشف عن أمراض شبكية مرتبطة بالسكري والتنبؤ بخطر السكتة الدماغية. الاختبار الرئيسي كان ما إذا كان نموذج مدرّب في بيئة معينة سيظل يؤدي جيداً عند تطبيقه على بيانات من بيئة أخرى أو من مجموعات بيانات عامة جُمعت في عدة دول أخرى. عبر معظم المهام والمجموعات، أدّى النموذجان أداءً متشابهاً، حتى عند التقييم على صور تختلف كثيراً عمّا رآه النموذجان سابقاً. يشير هذا إلى أن نماذج القاعدة للشبكية، بمجرد تدريبها على كمية كافية من البيانات، يمكن أن تعمم أداءها جيداً عبر المستشفيات والدول وأنواع الكاميرات.

أين تظهر شقوق العدالة: العمر مقابل الجنس والإثنية
الدقة المتوسطة الجيدة غير كافية إذا كان النظام يعمل أفضل لبعض الأشخاص مقارنة بآخرين. للتحقق من العدالة، قارن المؤلفون أداء النموذجين في شرائح عمرية وجنسية وإثنية مختلفة باستخدام مجموعة اختبار مُنتقاة بعناية. تبين أن العمر هو العامل الأكثر تأثيراً. تميل نتيجة النموذج المدرب على بيانات المملكة المتحدة، المبنية من مرضى أكبر سناً، لأن تكون أفضل في الفئات العمرية الأكبر، بينما كان النموذج المدرب على بيانات الصين، المبنية من بالغين أصغر سناً، أفضل في الفئات الأصغر سناً. ظهرت هذه الفجوات باستمرار عبر عدة مهام متعلقة بأمراض العين. بالمقابل، كانت فروق الأداء بين الذكور والإناث أو بين المجموعات الإثنية الكبرى أصغر وغير متسقة، ولم تكن مرتبطة بطريقة بسيطة بكيفية تمثيل تلك المجموعات في بيانات التدريب.
كيف يتغير مظهر العين مع التقدم في العمر
لفهم سبب تأثير العمر بقوة، فحص الفريق كيف يتغير مظهر الشبكية مع العمر في مجموعات التدريب. نظروا إلى مقاييس سريرية—مثل مدى تعقيد وتفرع الأوعية الدموية—وإلى ميزات مجردة يستخرجها النموذج الحاسوبي نفسه من الصور. أظهرت الفئات العمرية اختلافات واضحة ودالة إحصائياً في كلا النوعين من المقاييس، حتى بعد التحكم في الجنس والإثنية. بعبارة أخرى، تتغير بنية الشبكية فعلاً مع العمر بطريقة يمكن للنماذج اكتشافها. وبسبب ذلك، قد يصبح النموذج المدرب كثيراً على نطاق عمري واحد أكثر توفيقاً لهذا النطاق، ما يؤدي إلى فجوات عدالة دقيقة لكنها مهمة.
استخدام صور تركيبية لمعادلة الفرص
لاختبار ما إذا كان بالإمكان تقليل هذه الفجوات المتعلقة بالعمر، أنشأ الباحثون مئات الآلاف من صور شبكية تركيبية صُممت لتشبه مرضى أصغر سناً. خلطوها مع صور المستشفى الحقيقية لإنشاء مجموعة تدريب أكثر توازناً من ناحية العمر ثم دربوا نموذجاً جديداً. ظل الأداء العام مماثلاً، لكن تحسّنت الدقة للفئات الأصغر سناً في بعض المهام، مما قلّص عدم الإنصاف بين الفئات العمرية. تشير هذه التجربة إلى أن إضافة بيانات تركيبية بعناية يمكن أن تساعد في ملء النقائص في الذكاء الاصطناعي الطبي دون الحاجة إلى جمع كميات هائلة إضافية من الصور الحقيقية.
ما معنى هذا للذكاء الاصطناعي الطبي في المستقبل
تُظهر الدراسة أن "نظام التغذية" من البيانات الذي يُقدم إلى أنظمة الذكاء الاصطناعي الطبي يشكّل بقوة ليس فقط مدى قوتها، بل أيضاً من يستفيد منها بالدرجة الأكبر. يمكن لنماذج القاعدة للشبكية أن تعمل باستقرار عبر الدول والأجهزة، وهو أمر واعد للاستخدام العالمي. وفي الوقت نفسه، تكشف الدراسة أن سمات بيانات معينة—في هذه الحالة العمر—لها تأثير أكبر على العدالة من سمات أخرى. للمرضى والممارسين، الرسالة هي أن الشفافية حول بيانات التدريب والموازنة المقصودة للصفات الرئيسية ضرورية إذا كنا نريد أدوات ذكاء اصطناعي تخدم الأشخاص من كل الأعمار بشكل منصف.
الاستشهاد: Zhou, Y., Wang, Z., Wu, Y. et al. Understanding pre-training data effects in retinal foundation models using two large fundus cohorts. Nat Commun 17, 3309 (2026). https://doi.org/10.1038/s41467-026-70077-z
الكلمات المفتاحية: تصوير الشبكية, إنصاف الذكاء الاصطناعي الطبي, نماذج القاعدة, بيانات ما قبل التدريب, اعتلال الشبكية السكري