Clear Sky Science · ar

ألماس الحمض النووي يصوغ نموذجًا قابلاً للتفكيك لكوكبة أحرف مركبة لتخزين البيانات في الـ DNA

· العودة إلى الفهرس

لماذا قد تعيش بيانات المستقبل في الـ DNA

تولد هواتفنا وشركاتنا وأجهزتنا العلمية بيانات بسرعة تفوق قدرة الأقراص الصلبة والأشرطة المغناطيسية على التوسع. يمكن استخدام الـ DNA—وهو نفس الجزيء الذي يحمل المعلومات الوراثية في الكائنات الحية—لتخزين الملفات الرقمية بشكل مضغوط للغاية وطويل الأمد. يقدم هذا البحث طريقة جديدة لحزم مزيد من المعلومات داخل سلاسل DNA الاصطناعية مع الحفاظ على إمكانية القراءة العملية والموثوقة، مما قد يجعل تخزين الـ DNA أرخص وأكثر قابلية للتوسع.

من أربع حروف في الـ DNA إلى خلطات أكثر ثراءً

يعتمد التخزين التقليدي في الـ DNA على القواعد الأربع الطبيعية—A وT وG وC—لتمثيل البتات الرقمية، تمامًا كما الصفر والواحد على القرص. في هذا النظام، يمكن لكل موضع في سلسلة الـ DNA أن يحمل على الأكثر بتين من المعلومات، لأنه مقيد بأحد الخيارات الأربعة. يبني المؤلفون على فكرة ناشئة: بدلًا من وضع قاعدة واحدة عند كل موضع، ينشئون خلطات مُتحكَّمًا بها بعناية من القواعد، تُسمى أحرفًا مركبة. على سبيل المثال، قد يتكون موضع ما من خليط بنسبة 50:50 من A وT، أو خليط متساوٍ 25:25:25:25 من القواعد الأربع. عند تصنيع نسخ عديدة من كل سلسلة، تكشف عملية التسلسل عن نسب القواعد وبالتالي عن رمز رقمي يمكن أن يمثل أكثر من بتين.

Figure 1
الشكل 1.

خريطة على شكل ماسة لرموز الـ DNA

تصميم مثل هذه الخلطات معقد. إذا كان رمزان متشابهان جدًا—على سبيل المثال، أحدهما يتألف من 50% A و50% T والآخر 55% A و45% T—قد تمحو ضوضاء التسلسل الفرق بينهما، مما يسبب أخطاء ويضطر العلماء إلى تسلسل نسخ أكثر مما يرغبون. لمواجهة ذلك، يقترح الفريق نموذج "ألماس الـ DNA" المنظم: مجموعة من 15 حرفًا مركبًا مرتبة كنقاط على رباعي الوجوه (تتراهِدرون) تكون رؤوسه A وT وG وC. تشمل المجموعة قواعد نقية عند الزوايا، وخلطات متساوية لقاعدتين على الحواف، وخلطات لثلاث قواعد على كل وجه، ومزيجًا متوازنًا تمامًا من القواعد الأربع في المركز. هذه الكوكبة المختارة بعناية ترفع المعلومات النظرية لكل موضع إلى نحو 3.9 بت، مع الحفاظ على تميز الرموز بدرجة تُمكّن من تمييزها عمليًا.

فك تشفير أذكى بالانتروبيا والفهرسة

قراءة البيانات من الـ DNA تعني استنتاج أي حرف مركب كان مقصودًا عند كل موضع من قياسات ضوضوية لترددات القواعد. يستعير المؤلفون استراتيجية من اتصالات الاتصالات تُدعى تقسيم المجموعة (set partitioning). أولًا، ينظرون إلى مدى "اختلاط" الموضع باستخدام كمية تُسمى الانتروبيا، التي تكون منخفضة للقواعد النقية وأعلى للخلاطات المعقدة. هذا يعيّن بسرعة كل موضع إلى إحدى أربع مجموعات: القواعد النقية، وخلطات القاعدتين، وخلطات الثلاث قواعد، أو خليط القواعد الأربع. ثم، داخل المجموعة المختارة، تختار حسابات الاحتمالية الأدق الحرف الأكثر احتمالًا. تقلل هذه النهج المرحلتين الالتباس بين الرموز وتخفض زمن الحساب مقارنة بالأساليب السابقة. ولمنع خلط السلاسل مع بعضها، تحمل كل قطعة DNA تتابعات فهرسة محمية من الأخطاء على كلا الطرفين، ويتم تصفية القراءات التي بطول خاطئ—التي تنتج غالبًا عن أخطاء إدراج أو حذف—قبل فك التشفير.

Figure 2
الشكل 2.

حزم مزيد من البيانات مع قراءات أقل

اختبر الباحثون نظامهم في أحواض DNA صغيرة وكبيرة، مستخدمين منصات تصنيع تجارية. باستخدام أبجدية مركبة من ثمانية أحرف، وصلوا إلى كثافة حمولة 2.5 بت لكل موضع في الـ DNA وتمكنوا من استعادة الملفات تمامًا بمتوسط 14 قراءة تسلسل لكل سلسلة—كثافة أفضل من مخططات ستة أحرف سابقة مع حاجة لقراءات أقل. وبالأبجدية الكاملة ذات الـ 15 حرفًا (ألماس الـ DNA)، حققوا 3.125 بت لكل موضع للبيانات الأساسية وما زالوا يسترجعون كل شيء بلا أخطاء عند تغطية بمقدار 33 مرة. أظهرت المحاكاة والتجارب أيضًا أن طريقتهم المعتمدة على الانتروبيا تعمل تقريبًا بمثل دقة النهج الأكثر دقة ولكنه أبطأ، وتتفوق بوضوح على التقنيات الأقدم، خاصة عند أعماق تسلسل أقل.

ماذا يعني هذا لذاكرة المستقبل

للقارئ العام، الرسالة الأساسية هي أن المؤلفين وجدوا طريقة لتعليم الـ DNA "حيلًا جديدة" دون اختراع كيمياء جديدة: عبر مزج القواعد الأربع الحالية بذكاء وفك تشفيرها بشكل أذكى، يمكنهم تخزين مزيد من البتات لكل جزيء مع السيطرة على التكلفة. تُظهر أبجديتهم على شكل الماسة، مقترنة بفهرسة قوية وتصحيح للأخطاء، أن تخزين البيانات عالي السعة في الـ DNA ممكن بجهد تسلسل متواضع نسبيًا. ومع استمرار انخفاض تكلفة تصنيع وتسلسل الـ DNA، يمكن لمثل هذه التصاميم أن تساعد في تحويل الـ DNA من فضول مخبري إلى وسيط واقعي لأرشفة الذكريات الرقمية للعالم.

الاستشهاد: Ge, Q., Ren, M., Qi, T. et al. DNA diamond formulates a decomposable composite letter constellation model for DNA data storage. Nat Commun 17, 1704 (2026). https://doi.org/10.1038/s41467-026-68861-y

الكلمات المفتاحية: تخزين البيانات في الـ DNA, أحرف مركبة, كثافة المعلومات, تصحيح الأخطاء, الأرشفة الرقمية