Clear Sky Science · ar

نحو تقارير آلية: مجموعة بيانات تقارير تنظير القصبات لتعزيز نماذج اللغة الكبيرة متعددة الوسائط

· العودة إلى الفهرس

مساعدة أذكى لأطباء الرئة

عندما ينظر الأطباء داخل المجاري الهوائية بواسطة كاميرا صغيرة، يكتسبون معرفة واسعة عن رئات المريض — لكن تحويل ما يرونه إلى تقارير واضحة ومفصلة يتطلب وقتًا وخبرة. تقدم هذه الدراسة مجموعة جديدة ومبنية بعناية من صور وتقارير تنظير القصبات الحقيقية مصممة لتعليم أنظمة الذكاء الاصطناعي المتقدمة كيفية المساعدة في كتابة هذه التقارير. بالنسبة للمرضى، قد يعني هذا في المستقبل تقارير أسرع وأكثر اتساقًا وتقليل فرص تفويت تفاصيل مهمة.

لماذا يهم النظر داخل الرئتين

تنظير القصبات هو إجراء تُدخَل فيه أنبوبة رقيقة مزودة بكاميرا إلى المجاري الهوائية لفحص القصبة الهوائية والفروع الشُعبية للرئتين. يساعد هذا الأطباء على اكتشاف مشكلات مثل الالتهاب أو العدوى أو الأورام أو النزيف، ويمكنه أيضًا توجيه علاجات مثل إزالة أجسام غريبة أو وضع دعامات صغيرة للحفاظ على فتح المجاري. بعد الفحص، يجب على الطبيب وصف ما شوهد في تقرير رسمي يصبح جزءًا من السجل الطبي للمريض ويُوجِّه قرارات العلاج. كتابة هذه التقارير عمل تفصيلي ومتكرر يعتمد بشدة على تدريب الطبيب وذاكرته.

لماذا كانت البيانات المتاحة غير كافية

في السنوات الأخيرة، أحرزت نماذج ذكاء اصطناعي قوية يمكنها معالجة الصور والنصوص تقدمًا في قراءة الفحوصات الطبية وصياغة التقارير. ومع ذلك، بالنسبة لتنظير القصبات، كانت البيانات المتاحة لتدريب هذه النُظم ضيقة وغير مكتملة. غالبًا ما شملت مجموعات البيانات السابقة مهام محدودة — مثل رصد ورم أو تحديد وضع الكاميرا — بينما تجاهلت العديد من الاكتشافات اليومية مثل المخاط أو النزيف الخفيف أو التورم التي يصفها الأطباء بشكل روتيني. كانت بعض هذه المجموعات أيضًا خاصة أو صغيرة أو تركز فقط على قرارات بنعم/لا بسيطة، مما يجعلها معلمًا ضعيفًا لذكاء اصطناعي يحتاج إلى كتابة أوصاف غنية تشبه الأسلوب البشري لما تلتقطه الكاميرا.

Figure 1
الشكل 1.

بناء مكتبة صور أكثر ثراءً

لسد هذه الفجوة، أنشأ المؤلفون BERD، مجموعة بيانات جديدة لفحوصات تنظير القصبات مُستمدة من إجراءات حقيقية في مستشفى كبير في الصين. من بين 8,477 تنظيرًا أُجري بين عامَي 2022 و2023، اختاروا 3,692 حالة مريض ممثلة و6,330 صورة رئيسية أشار الأطباء إلى أنها مفيدة على نحو خاص. لكل صورة، ربطها أخصائيون مدربون بوصف كتابي دقيق لما كان مرئيًا، مثل الأورام أو التورم أو الترسبات أو الأنسجة الطبيعية. عندما لم تُظهر الصورة مشكلة، استخدموا عبارة معيارية بسيطة مثل «طبيعي» للحفاظ على اتساق البيانات. أُزيلت التفاصيل الشخصية، وترجمت التقارير الصينية الأصل إلى الإنجليزية باستخدام نموذج لغوي محلي حمايةً للخصوصية.

كيف عمل الخبراء والذكاء الاصطناعي معًا

بعيدًا عن الأوصاف البسيطة، رغب الفريق أيضًا في وسم كل صورة بفئة طبية واحدة أو أكثر — مثل «ورم» أو «احتقان» أو «وذمة» — حتى تتمكن نماذج الذكاء الاصطناعي من التعلم سواء على الوصف أو التصنيف. لتحقيق ذلك بكفاءة، وضع كبار أخصائيي تنظير القصبات أولًا قائمة مفصلة من الفئات بناءً على الإرشادات الطبية. ثم مسح نموذج لغوي محلي النصوص الوصفية ليقترح أي الفئات تنطبق على كل صورة. تحقق الخبراء البشريون بعناية من هذه الاقتراحات وصححوها، محافظين على التحكم النهائي في الجودة الطبية. النتيجة مورد مشروح بعناية حيث تربط كل صورة بوصف واضح وموقع تشريحي وتسميات مؤكدة من الخبراء، كلها منظمة في ملفات بسيطة يمكن للباحثين استخدامها مباشرة.

Figure 2
الشكل 2.

تعليم الذكاء الاصطناعي كتابة تقارير أفضل

لإظهار أن BERD مفيد حقًا، استخدم الباحثون المجموعة لتدريب عدة نماذج ذكاء اصطناعي متعددة الوسائط رائدة. أولًا، اختبروا أنظمة ذكاء اصطناعي عامة وطبية لم ترَ صور تنظير القصبات من قبل. غالبًا ما أسأت هذه النماذج فهم ما رأت، فوفت الأورام أو اخترعت تفاصيل، وسجلت نتائج ضعيفة مقارنة بالنصوص المكتوبة من قِبل الخبراء. ثم قام الفريق بضبط نماذج مفتوحة المصدر على صور ووسوم BERD. بعد هذا التدريب الإضافي، أنتج أفضل نموذج أوصافًا تطابقت مع صياغة الخبراء بشكلٍ أكبر بكثير وقُدمت على أنها مقبولة من قبل الأطباء أكثر من 80% من الوقت — ما يعني أن النص المولَّد آليًا يمكن غالبًا إدراجه مباشرة في تقرير حقيقي مع تحرير طفيف.

ماذا يعني هذا للرعاية المستقبلية

بعبارات بسيطة، يوفر هذا العمل «مكتبة تدريب» مفقودة يحتاجها أنظمة الذكاء الاصطناعي لتصبح مساعدين موثوقين في إعداد تقارير تنظير القصبات. مع أن البيانات مأخوذة من مستشفى واحد وتمت إزالة بعض التفاصيل العددية عمدًا لتجنب تضليل النماذج، فإن مجموعة البيانات عامة وموثقة جيدًا وكبيرة بما يكفي لوضع معيار جديد في هذا المجال. ومع استمرار الباحثين في البناء على BERD، قد يستفيد المرضى في النهاية من تقارير تنظير قصبات أسرع وأكثر توحيدًا، مما يمنح الأطباء وقتًا أكبر للتركيز على اتخاذ القرار والعلاج بدلًا من الأعمال الورقية.

الاستشهاد: Luo, X., Huang, X., Liang, X. et al. Towards Automated Reporting: A Bronchoscopy Report Dataset for Enhancing Multimodality Large Language Models. Sci Data 13, 339 (2026). https://doi.org/10.1038/s41597-026-06692-8

الكلمات المفتاحية: تنظير القصبات, التصوير الطبي, التقارير السريرية, الذكاء الاصطناعي متعدد الوسائط, مجموعات البيانات الطبية