Clear Sky Science · ar

مجموعة بيانات واسعة للخلايا الدموية المحيطية للتحليل الدموي الآلي

· العودة إلى الفهرس

لماذا تهم صور خلايا الدم

تخبئ اختبارات الدم الروتينية عالماً مجهرياً من الخلايا يمكنه الكشف عن عدوى أو فقر دم أو حتى سرطانات دموية قبل أن تصبح الأعراض واضحة. تقليدياً يفحص الأطباء هذه الخلايا بالعين تحت المجهر، وهو عمل دقيق لكن يستغرق وقتاً. تقدم هذه الدراسة مجموعة كبيرة للغاية وموسومة بعناية من صور خلايا الدم صممت لتعليم الحواسيب التعرف على هذه الخلايا تلقائياً. الهدف هو جعل اختبارات الدم المستقبلية أسرع وأكثر اتساقاً وأكثر توفراً عبر تزويد الذكاء الاصطناعي بالخبرة البصرية التي يحتاجها لمساعدة الأطباء في قراءة مسحات الدم بدقة.

Figure 1
الشكل 1.

من العدّات البسيطة إلى التصوير الذكي

الخلايا البيضاء هي خط الدفاع الرئيسي في جهاز المناعة، وتركيبتها ومظهرها يعطيان دلائل حاسمة عن صحتنا. قد يشير ارتفاع أنواع معينة من الخلايا إلى عدوى أو حساسية، بينما وجود خلايا «الانفجار» غير الناضجة فجأة يمكن أن ينبه إلى اللوكيميا. تستخدم المختبرات آلات آلية بالفعل لعد الخلايا، لكن التغيرات الطفيفة في الشكل ما تزال تتطلب غالباً نظر خبير. يمكن أن يختلف مراجِعو البشر في تفسيرهم، وفحص الشرائح واحداً تلو الآخر يستغرق وقتاً. مع ميل الطب نحو التصوير الرقمي والذكاء الاصطناعي، يبرز حاجز متزايد إلى مجموعات صور كبيرة وموثوقة يمكنها تدريب الحواسيب على اكتشاف أنماط الخلايا ذات الدلالة بنفس موثوقية أخصائي أمراض الدم المتمرّس.

بناء مكتبة ضخمة لخلايا الدم

أنشأ المؤلفون ما يعد حالياً أكبر مجموعة عامة لصور خلايا الدم المحيطية، تسمى مجموعة بيانات KU-Optofil PBC. تحتوي على 31,489 صورة عالية الدقة لخلايا فردية موزعة عبر 13 فئة، بما في ذلك الخلايا الدفاعية الشائعة مثل الخلايا اللمفاوية والعدلات المقطّعة، وكذلك الأنواع الأندر ولكن الطبية الحرجة مثل الخلايا المنفجرة (blasts) والميالوسايت والخلايا اللمفاوية التفاعلية. جميع الصور مأخوذة من مسحات دم مصبوغة أُعدت بشروط موحدة في مستشفى واحد باستخدام نظام تصوير واحد. تعني هذه الاتساقية أن الحواسيب المتعلمة من البيانات ترى عرضاً ثابتاً ومتحكماً لكل نوع خلية بدلاً من فسيفساء من صور غير متوافقة.

عيون خبيرة وتنقيح دقيق

لجعل مجموعة البيانات موثوقة، وُسِمت كل صورة بشكل مستقل بواسطة فنيي مختبر ذوي خبرة اثنين، مع خبير ثالث يقوم بحل أي خلافات. أظهرت الفحوصات الإحصائية اتفاقاً قوياً جداً بين المراجعين لكل نوع خلية رئيسي، بما في ذلك اتفاق تام لبعضها. كما طبّق الفريق قواعد صارمة لتحديد الصور التي تُحتفظ بها، مستبعدين الصور الضبابية أو المتداخلة أو ضعيفة التلوين. الصور النهائية كلها بنفس الحجم ونفس صيغة الألوان، ومنظمة في مجلدات تدريب وتحقق واختبار حتى يتمكن باحثون آخرون من مقارنة الخوارزميات بشكل عادل. ملفات إضافية تربط كل صورة بمريض مجهول الهوية، مما يتيح دراسات تختبر ما إذا كان النموذج يعمم فعلاً من شخص إلى آخر.

Figure 2
الشكل 2.

اختبار نماذج الذكاء الاصطناعي

لإظهار مدى فائدة هذه المكتبة، درّب الباحثون 14 نموذجاً حديثاً للتعرف على الصور، من شبكات الالتفاف التقليدية إلى تصميمات أحدث قائمة على المحولات. أدى عدد من النماذج الصغيرة والفعالة أداءً مفاجئاً جيداً، وأحد البنى، DenseNet-121، صنّف الخلايا بشكل صحيح لأكثر من 95 في المئة من الحالات في المتوسط. ومع ذلك، أبرزت النتائج أيضاً صعوبة مهمة في العالم الحقيقي: الأنواع الشائعة من الخلايا ذات الآلاف من الأمثلة تم التعرف عليها تقريباً بشكل مثالي، بينما بقيت الخلايا النادرة جداً التي تملك بضعة عشرات من الصور أصعب بكثير في التصنيف. حتى عندما عدّل الباحثون التدريب لـ «إعطاء اهتمام أكبر» لهذه الفئات النادرة، انخفضت الدقة الإجمالية، وكانت المكاسب للفئات النادرة متواضعة، مما يؤكد تحدي التعلم من أمثلة محدودة.

ماذا يعني هذا لاختبارات الدم المستقبلية

لغير المتخصصين، الرسالة الأساسية هي أن هذا العمل يزوّد أنظمة الحواسيب بالخبرة البصرية الخام التي تحتاجها لتصبح شريكاً موثوقاً في قراءة مسحات الدم. من خلال تجميع مكتبة كبيرة ومتنوعة ومفحوصة بعناية لصور خلايا الدم وإظهار أن نماذج ذكاء اصطناعي مختلفة يمكنها التعلم منها، يضع المؤلفون أساساً لأدوات قد تُسرّع التشخيص وتقلل الخطأ البشري وتمدّ التحليل على مستوى الخبراء إلى عيادات تفتقر إلى الأخصائيين. في الوقت نفسه، تذكرنا النتائج المتباينة حول أنواع الخلايا النادرة أن حتى مجموعات البيانات الكبيرة لها ثغرات، وأن تحسين رعاية المرضى ذوي الحالات غير الاعتيادية أو في مراحل مبكرة سيتطلب توسيع وصقل هذه المجموعات الصورية أكثر.

الاستشهاد: Yarıkan, A.E., Örer, C., Akyıldız, V. et al. A Large-Scale Peripheral Blood Cell Dataset for Automated Hematological Analysis. Sci Data 13, 417 (2026). https://doi.org/10.1038/s41597-026-06761-y

الكلمات المفتاحية: تصوير خلايا الدم, الذكاء الاصطناعي الطبي, أمراض الدم, التعلم العميق, مجموعات بيانات طبية