Clear Sky Science · ar
مجموعة بيانات متعددة الوسائط لتنوّع الحشرات تتضمن صورًا وبيانات DNA على مستوى الفخّ والفرائس الفردية
لماذا تهم الحشرات الصغيرة والبيانات الضخمة
في جميع أنحاء العالم، تتغير أعداد الحشرات بسرعة، مع تراجع بعض المجموعات قبل أن يتسنّى للعلماء حتى وصفها. الطرق التقليدية لفرز وتسميات وتعداد الحشرات تعتمد على وقت الخبراء النادر والعمل الدقيق باستخدام الميكروسكوبات. يقدم هذا المقال نوعًا جديدًا من الموارد يجمع بين صور مفصّلة ومعلومات DNA لعشرات الآلاف من المخلوقات الصغيرة التي جُمعت في فخاخ ميدانية حقيقية. من خلال إقران البيولوجيا برؤية الحاسوب الحديثة، يهدف المؤلفون إلى تسريع طرق قياس ومراقبة حياة الحشرات على كوكب يتغير.

من خيام الحقل إلى العينات الرقمية
يبدأ المشروع، المسمى MassID45، في الغابات الشمالية والمناطق الرطبة في السويد وفنلندا، حيث توجّه فخاخ مالايس الشبيهة بالخيام الحشرات الطائرة نحو قوارير التجميع. على مدار موسم 2021، تم اختيار 45 عينة أسبوعية من 19 موقعًا للتحليل العميق. في المختبر، وُزنت كل مجموعة مختلطة، وعُولِجت بلطف لاستخراج DNA، وصُبّت في صينية ضحلة بطبقة رقيقة من الكحول. وُسّعت الحشرات وصُورت من الأعلى بكاميرا عالية الدقة تحت إضاءة مضبوطة بعناية، لتنتج "صورة جماعية" واحدة يظهر فيها آلاف الأفراد كأشكال بحجم دبابيس.
رؤية نفس الحشرات بطريقتين
بعد التقاط الصور الجماعية، فرّق الفريق العينات إلى حشرات فردية للعمل التفصيلي. وُضع كل عيّنة في بئر صغير خاص بها أو تُثبّت وصُورت عن قرب. في الوقت نفسه، قُرِئ مقطع DNA قصير موحّد—يُسمى غالبًا "شريطًا"—لكل حشرة باستخدام آلات تسلسل عالية الإنتاجية الحديثة. نتج عن ذلك أكثر من 35,000 تسلسل شريطي فردي. سمح مقارنة هذه التسلسلات مع قواعد بيانات مرجعية كبيرة للباحثين بوضع معظم العينات داخل مجموعات معروفة جيدًا، مثل الذباب والخنافس وعائلات العتّات (الفراشيات)، موفّرين قائمة مرجعية معززة بالـDNA لأنواع المفصليات التي وُجدت في كل عينة فخ.
تدريب الحواسيب على العثور على مخلوقات صغيرة
لجعل صور الصواني الجماعية قابلة للأتمتة، كان على المؤلفين تعليم الحواسيب مكان كل حشرة وإلى أي مجموعة عامة تنتمي. استخدموا عملية وسم من خطوتين. أولاً، خَرَج خوارزم خُطوطًا تقريبية حول كل جسم داكن في صورة الصينية، ثم قام المعلّقون البشر بتحسين هذه الخطوط باستخدام أداة ويب مدعومة بالذكاء الاصطناعي، مما ضمن أن كل حشرة—غالبًا بعرض بضعة بيكسلات فقط—نالت قناعًا نظيفًا خاصًا بها. ثانيًا، فحص خبير كل حشرة مقنعة وقام بتصنيفها إلى أدق مستوى تصنيفي يمكن رؤيته من الصورة، مسترشداً بقائمة مخصصة من المجموعات المتوقعة المشتقّة من أشرطة DNA المطابقة. ركزت هذه الاستراتيجية جهد الخبراء على التعرف بدلًا من الرسم الممل، وأسفرت عن ربط أكثر من 17,000 مفصّل في الصور الجماعية بأسماء مجموعات موثوقة.

ما مدى فعالية النظام؟
ثم تعامل الفريق مع MassID45 كاختبار ضغط لرؤية الحاسوب الحديثة. قُسِّمت الصور الجماعية إلى بلاطات متداخلة حتى تبقى الحشرات الصغيرة حادة بما يكفي للتحليل، وقُيّمت عدة نماذج متقدمة لتجزئة الصور. واجهت الأنظمة العامة "صفرية التدريب"، التي لم ترَ هذه البيانات من قبل، صعوبات: إذ كانت تميل إلى تفويت أصغر الحشرات وخلطها مع قطع الحطام. بالمقابل، أتت النماذج التي أعيد تدريبها على صور MassID45 الموسومة بعناية بنتائج أفضل بكثير في العثور على الأفراد وتحديد محيطهم، لا سيما المجموعات الشائعة مثل الذباب والدبابير. ومع ذلك، بقيت أصغر القافزات الربيعية وغيرها من الأشكال الشاحبة الشبيهة بالنِقَاط صعبة التمييز عن الخلفية، مما يبرز حدًا بصريًا جوهريًا.
ما الذي يعنيه هذا لتتبع الحياة على الأرض
MassID45 ليس خوارزمية جديدة واحدة بل مجموعة مرجعية غنية يمكن للباحثين الآخرين تنزيلها والبناء عليها. من خلال ربط صور مستوى الصينية، وصور العينات الفردية، وتسلسلات DNA، وتسميات المجموعات الخبيرة من عينات ميدانية حقيقية، يوفر أرض تدريب واقعية للحواسيب لتعلّم كيفية عدّ ووصف أسراب من المفصليات الصغيرة. بينما نادرًا ما تسمح الصور بتحديد المستوى النوعي، فإنها تلتقط المجموعات الأوسع بشكل موثوق، والتي تكفي غالبًا للكشف عن تحوّلات في مجتمعات الحشرات عبر الزمن والمكان. عمليًا، يعني ذلك أن برامج المراقبة المستقبلية قد تجمع بين تصوير الفخاخ البسيط وأخذ عينات DNA والتعلّم الآلي لتقديم رؤى أسرع وأكثر تفصيلاً وقابلة للتوسيع عن تنوع الحشرات عما كان ممكنًا أبدًا بواسطة خبراء البشر وحدهم.
الاستشهاد: Orsholm, J., Quinto, J., Autto, H. et al. A multi-modal dataset for insect biodiversity with imagery and DNA at the trap and individual level. Sci Data 13, 630 (2026). https://doi.org/10.1038/s41597-026-07251-x
الكلمات المفتاحية: تنوع الحشرات البيولوجي, تشفير DNA, رؤية الحاسوب, مراقبة بيئية, مجموعة بيانات للتعلّم الآلي