Clear Sky Science · ar
تصنيف الأخطاء ونهج تصحيحها في التخزين القائم على الحمض النووي التركيبي
تخزين بيانات العالم في الحمض النووي
تغرق هواتفنا وخوادمنا ومراكز السحابة في المعلومات، وتقنيات التخزين التقليدية تكافح لمجاراة هذا النمو. يوفر الحمض النووي — نفس الجزيء الذي يحمل المعلومات الوراثية في الكائنات الحية — بديلاً جذابًا: فهو عالي الكثافة للغاية وذو عمر طويل ويحتاج القليل من الطاقة للحفاظ عليه. تستكشف هذه الورقة شكلاً قويًا من تخزين البيانات على الحمض النووي يُسمى الترميز التركيبي، وتبين كيف يمكن لنوع جديد من تصحيح الأخطاء أن يجعله أكثر موثوقية في التطبيق العملي.
كيفية حشر مزيد من البتات في الحمض النووي
يكتب التخزين التقليدي على الحمض النووي البيانات باختيار أحد القواعد الأربع (A، C، G، T) في كل موضع على شريط الحمض النووي الصناعي. يتبع الترميز التركيبي نهجًا مختلفًا: بدلاً من استخدام قطعة قصيرة واحدة من الحمض النووي في كل موضع، يستخدم مجموعات مُختارة بعناية من قطع قصيرة. يُمثل كل موضع في رسالة رقمية ليس بتسلسل قصير واحد بل بمجموعة منها مأخوذة من مكتبة محددة سلفًا. هذا يعزز كثيرًا كمية المعلومات التي يمكن إدخالها في كل خطوة تخليق، مما يقلل التكلفة والوقت. ومع ذلك، فإنه يعني أيضًا أنه لقراءة «حرف» واحد من الرسالة المخزنة بشكل صحيح، يجب على النظام اكتشاف كل القطع التي يجب أن تكون حاضرة في ذلك الموضع.

عندما تختفي بعض القطع بهدوء
نظرًا لأن جزيئات الحمض النووي تُنتَج وتُقرأ بأعداد كبيرة، يظهر نفس التسلسل التركيبي عدة مرات، وكل نسخة تُنتج وتُقرأ مع بعض العيوب البسيطة. فحص المؤلفون عدة مجموعات بيانات تجريبية واكتشفوا أن نوعًا محددًا من الأخطاء يطغى في التخزين التركيبي على الحمض النووي: محو قطعة واحدة من مزيج صحيح خلافًا لذلك. بعبارة أخرى، أحد عناصر المجموعة ببساطة لا يُرصد أبدًا في قراءات التسلسل، مع أنّ العناصر الأخرى موجودة. تصبح هذه «مسوحات تركيبيّة أحادية الاتجاه» شائعة بشكل خاص عندما يكون عدد القراءات لكل تسلسل مخزن منخفضًا — وهو وضع واقعي في الأنظمة واسعة النطاق حيث إن القراءة بعمق أكبر مكلفة. تحت نحو 50 قراءة لكل تسلسل، ترتفع وتيرة هذه القطع المفقودة بشكل حاد، مما يجعل من الصعب أو المستحيل إعادة بناء البيانات المقصودة باستخدام الطرق القياسية.
استقصاء الأخطاء على نطاق أوسع
للانتقال إلى ما هو أبعد من العروض الصغيرة، تعاون الفريق مع شريك صناعي لبناء نظام تخزين إثبات مفهوم واسع النطاق باستخدام الحمض النووي التركيبي. رمَّزوا آلاف البتات من النص إلى 640 تسلسلاً تركيبيًا مميزًا، كل منها يمتد عبر ثمانية مواضع تحمل معلومات. جمعت البروتوكولات المخبرية المتخصصة حمامات من جزيئات الحمض النووي حيث مثلت كل جزيئة تركيبة واحدة من القطع القصيرة. ثم قام الباحثون بتسلسل ملايين القراءات واستخدموا خط أنابيب تحليل مخصصًا يستند إلى BLAST، وهي أداة محاذاة تسلسلية معروفة، للعثور على أي القطع ظهرت في كل موضع. أكدت هذه المجموعة الكبيرة من البيانات الملاحظة السابقة: عندما كان تغطية القراءة عالية، كان بالإمكان إعادة تركيب معظم التركيبات، لكن عندما انخفض متوسط عدد القراءات لكل تسلسل، أصبحت القطع المفقودة—ومن ثم أخطاء المحو—العقبة الأساسية أمام فك الترميز بدقة.

كود يتوقع أخطاء أحادية الاتجاه
تفترض مخططات تصحيح الأخطاء التقليدية المستخدمة في تخزين الحمض النووي غالبًا أن الأخطاء متقاربة في السلوك—فالأحرف قد تُختلط أو تُضاف أو تُفقد باحتمالات متشابهة. لا تتوافق هذه الفرضية مع الترميز التركيبي، حيث الفشل النموذجي هو أن قطعة كانت موجودة في التركيبة الأصلية لا تظهر مطلقًا، بينما القطع الزائفة الإضافية نادرة نسبيًا. لمواجه هذا، صمم المؤلفون كود تصحيح أخطاء جديدًا يُدعى كود VT التركيبي، مهيأ لهذا السلوك أحادي الاتجاه. يمثلون كل حرف تركيبي كسطر في مصفوفة ثنائية ويعاملون القطع المفقودة كبِتات تنقلب فقط من واحد إلى صفر. يستخدم الكود بصمة رياضية، أو «سيندروم»، لكل حرف يمكن أن تكشف أي قطعة فُقدت، حتى عندما يُلاحَظ جزء فقط من التركيبة. تُحمى هذه السيندرومات نفسها بواسطة كود ريد–سولومون، مما يتيح استرداد عدة أخطاء من هذا النوع عبر التسلسل.
اختبار الأسلوب الجديد
واجه الباحثون كودهم المصمم مباشرةً بمخطط ريد–سولومون ثنائي البعد الأكثر تقليدية الذي كان مستخدمًا سابقًا في تخزين الحمض النووي. اختبروا كلاهما في محاكيات برمجية وفي تجربة واسعة النطاق ثانية، حيث حُمي نصف التسلسلات بالطريقة التقليدية والنصف الآخر بالكود التركيبي الجديد، تحت نفس مقدار الزيادة الاحتياطية. عبر مجموعة من الظروف التي تهيمن عليها أخطاء المحو، أعاد النهج الجديد في كثير من الأحيان بناء البيانات الأصلية بشكل صحيح، وكان أداؤه متميزًا خاصة عندما كانت تغطية القراءة منخفضة. في هذه الظروف الأصعب، فشل النهج التقليدي كثيرًا في فك ترميز تسلسلات كاملة، بينما ظل مخطط VT التركيبي قادرًا على استردادها.
لماذا هذا مهم لأرشيفات الحمض النووي المستقبلية
تُظهر الدراسة أن جعل تخزين البيانات على الحمض النووي عمليًا ليس مجرد حشر المزيد من البتات في الجزيئات—بل يتطلب أيضًا تصحيح أخطاء يتوافق مع أنماط الأخطاء الواقعية لعمليات المختبر المستخدمة. من خلال دراسة كيفية فشل التخزين التركيبي بدقة، وتصميم أكواد تتوقع تحديدًا فقدان القطع، يبيّن المؤلفون مسارًا واضحًا نحو أرشيفات حمض نووي أكثر موثوقية وقابلية للتوسع. مع نمو الأنظمة القائمة على الحمض النووي للتعامل مع مجموعات بيانات أكبر فأكبر، ستكون مثل هذه الاستراتيجيات المخصصة لتصحيح الأخطاء غير المتماثلة ضرورية لتحويل الخلطات الجزيئية الهشة إلى ذكريات طويلة الأمد موثوقة.
الاستشهاد: Preuss, I., Sabary, O., Gabrys, R. et al. Error characterization and error correction approaches in combinatorial DNA-based storage. Sci Rep 16, 8093 (2026). https://doi.org/10.1038/s41598-026-38599-0
الكلمات المفتاحية: تخزين البيانات على الحمض النووي, تصحيح الأخطاء, الترميز التركيبي, أخطاء المسح (الإرذاذ), كثافة المعلومات