Clear Sky Science · ar

TamilSTARNet: التجزئة عبر بنية ثلاثية المراحل والتعرّف المعتمد على الانتباه لأحرف التاميل اليدوية

· العودة إلى الفهرس

إدخال الكتابة التاميلية القديمة إلى العصر الرقمي

في أنحاء جنوب الهند وما وراءها، تقبع قصص وقصائد وسجلات ثمينة مكتوبة بالتاميل داخل أوراق وصفائح نخيل ودفاتر تتلاشى. وبما أن كثيراً من هذه المواد مكتوب باليد، تكافح الحواسيب لقراءتها، ما يجعل أجزاء كبيرة من الثقافة التاميلية صعبة البحث والمشاركة والدراسة. تقدم هذه الورقة TamilSTARNet، نظام رؤية حاسوبية جديد مصمم تحديداً لقراءة التاميل المكتوب يدوياً، حتى يمكن حفظ قرون من التراث والوصول إليها بصيغة رقمية.

Figure 1
Figure 1.

لماذا الكتابة التاميلية اليدوية صعبة على الحواسيب

الحروف التاميلية غنية ومعبرة: مجموعة صغيرة من الحروف الصوتية والساكنة الأساسية تتحد لتشكيل أكثر من 300 حرف مركب. على الصفحة تتدفق هذه الحروف مع حلقات ومنحنيات وعلامات صغيرة فوق وتحت وبجانب الضربات الرئيسية. يكتبها الناس بأنماط شخصية متعددة، مع ضربات تنضم وتتشابك أو تختلف في السمك. أدوات التعرّف الضوئي القياسية، التي تعمل جيداً على النص الإنجليزي المطبوعة بعناية، غالباً ما تفشل هنا. فهي تقرأ الحروف الملتحمة بشكل خاطئ، وتفقد العلامات الدقيقة التي تغير المعاني، وتتعثّر عندما يتلاشى الحبر أو تكون المسافات غير منتظمة. أحرزت الأبحاث الحالية للتاميل تقدماً باستخدام قواعد مصممة يدوياً أو شبكات عصبية عامة، لكن معظم الطرق إما تفترض حروفاً مقطوعة ونظيفة واحداً تلو الآخر، أو تنهار عندما تلتصق الحروف وتتكدس.

طريقة ثلاثية المراحل لتقسيم الصفحة

لمعالجة هذا، أعاد المؤلفون تصميم طريقة تقسيم الصفحة قبل أي عملية تعرّف. تتعامل خطّة التجزئة ثلاثية المراحل مع المستند المكتوب يدوياً كأنه لغز متعدد الطبقات. في المرحلة الأولى يُنظف ويُحسّن الصفح باستخدام خطوات معالجة صور قياسية، ثم يقسم إلى أسطر أفقية من النص. في المرحلة الثانية يُجزأ كل سطر إلى كلمات منفصلة، مع ضبط دقيق لمدى دمج الضربات المجاورة حتى لا تُفقد العلامات الصوتية الدقيقة. في المرحلة الثالثة تُقسم كل كلمة إلى حروف فردية باستخدام الحدود والمربعات المحيطة التي تتبع ضربات الحبر الفعلية. النتيجة مصفوفة ثلاثية الأبعاد مُنظَّمة—سطر، كلمة، حرف—تحفظ ترتيب القراءة وتوصل أحرفاً معزولة بوضوح إلى محرك التعرّف.

Figure 2
Figure 2.

طريقة أكثر ذكاءً ليولي الحاسوب الانتباه

بمجرد تجزئة الأحرف، يستخدم TamilSTARNet نموذج تعلم عميق مُفصّل ليحدد كل حرف. في جوهره توجد طبقات تلافيفية تتعلّم الأنماط البصرية من الصور. وعلى هذا تُضاف عدة أنواع من آليات «الانتباه». تساعد هذه الوحدات الشبكة في تقرير أي أجزاء الصورة وأي الميزات الداخلية هي الأهم. يبرز مكوّن معين قنوات محددة تلتقط اختلافات ضاربة دقيقة—ذاتها الخطافات والحلقات الصغيرة التي تميّز حروف التاميل المتشابهة. يركز مكوّن آخر على مواضع الضربات المهمة على سطح الحرف. وطبقة انتباه ذاتي أخيرة تطالع الحرف ككل، رابطَةً الضربات البعيدة التي تُعرِّف شكله معاً. من خلال دمج هذه الأشكال من الانتباه، يصبح النظام أفضل في تفكيك الأحرف التي تختلف بعلامة أو منحنى صغيرين فقط.

مدى أداء النظام

اختبر الباحثون TamilSTARNet على مجموعتي بيانات علنيتين كبيرتين تحتويان معاً على أكثر من 160,000 مثال تغطي 156 فئة حرفية من مئات الكتاب. بعد التدريب، تعرف النموذج بشكل صحيح على نحو 96% من أحرف الاختبار، متفوقاً على بدائل معروفة مثل Tesseract OCR وعدة نماذج أساسية للشبكات العصبية العميقة. كما أثبتت التجزئة ثلاثية المراحل أهميتها: عندما استُخدم نفس نموذج التعرّف من دون هذا التقسيم الدقيق سطر–كلمة–حرف تراجعت الدقة والموثوقية. قيّم الفريق نهجهم أيضاً على مخطوطات صفائح النخيل الصعبة، حيث الحبر باهت والأسطح غير منتظمة. كان الأداء بطبيعة الحال أقل في هذا السياق القاسي لكنه لا يزال قوياً بما يكفي ليوضح أن الطريقة قابلة للامتداد إلى المواد التاريخية الحقيقية.

ما يعنيه هذا لحفظ التراث التاميلي

بعبارة بسيطة، يمنح TamilSTARNet الحواسيب طريقة أكثر عناية للنظر في التاميل المكتوب يدوياً: أولاً ينظم الصفحة الفوضوية إلى أجزاء مفصولة جيداً، ثم يدرس كل حرف مع انتباه مركز للضربات المهمة. هذا المزيج يسمح للنظام بقراءة الخط اليدوي المعقد بثقة أكبر بكثير من الأدوات السابقة. ومع أن حالات صعبة تبقى—مثل الكتابة شديدة التشكيل أو الصفحات المتضررة بشدة—فإن النهج يمثل خطوة عملية نحو رقمنة واسعة النطاق للنصوص التاميلية. ومع تحسّن وانتشار مثل هذه الأنظمة، يمكن تحويل الدفاتر والرسائل والمخطوطات القديمة إلى مكتبات رقمية قابلة للبحث، مما يساعد على ضمان أن التراث الأدبي التاميلي لا يُنقذ فقط من التعفن المادي بل يصبح أيضاً أسهل للأجيال القادمة للاستكشاف.

الاستشهاد: Anbalagan, S., Krishna, H., Raju, J.S. et al. TamilSTARNet: segmentation via tri-phase architecture and attention-based recognition for handwritten Tamil characters. npj Herit. Sci. 14, 258 (2026). https://doi.org/10.1038/s40494-026-02335-8

الكلمات المفتاحية: التعرّف الضوئي على الأحرف التاميلية المكتوبة يدوياً, رقمنة الوثائق, الشبكات العصبية المعتمدة على الانتباه, حفظ التراث الثقافي, التعرّف على الخطوط