Clear Sky Science · ar
شبكة عصبية عميقة من نوع inception مع اتصالات متبقية للتعرّف على الحروف اليدوية التاميلية
حفظ الخط اليدوي في العصر الرقمي
من المخطوطات القديمة المكتوبة على أوراق النخيل إلى الملاحظات اليومية، لا تزال الكثير من تراث الكتابة التاميلية موجودة على الورق. تحويل هذا المزيج الغني من الصفحات المكتوبة باليد إلى نص رقمي قابل للبحث أمر أساسي للحفاظ على الثقافة، ودعم التعليم، وبناء تقنيات لغوية أفضل. تعرض هذه المقالة نظام رؤية حاسوبية جديدًا يُدعى TamHNet يقرأ الخط التاميلي بدقة تكاد تكون كاملة، حتى عندما تبدو الحروف متشابهة بشكل مضلل.

لماذا الحروف التاميلية صعبة على الحواسيب
يتحدث التاميل أكثر من 80 مليون شخص ويستخدم كتابة تضم 247 رمزًا، بما في ذلك حروف العلة والحروف الساكنة والعديد من تراكيب الاثنين معًا. تختلف العديد من الحروف بفروق صغيرة مثل حُليَّات دقيقة أو ضربات إضافية، ويتفاوت كتاب الحروف اختلافًا كبيرًا في كيفية تشكيل كل رمز. أزواج مثل எ/ஏ أو ஒ/ஓ قد تبدو متطابقة تقريبًا للوهلة، ويمكن أن يُخلَط بين حروف مثل ல و வ بسهولة. كثير من البرامج القديمة وحتى أنظمة التعلم الآلي الحديثة كانت تكافح هذه الفروق الدقيقة، مما يؤدي إلى كلمات مُقروءة بشكل خاطئ ورقمنة غير موثوقة للوثائق.
بناء مجموعة بيانات من الكتابة الواقعية
لتدريب واختبار نظامهم في ظروف واقعية، أنشأ الباحثون مجموعة بيانات جديدة للحروف التاميلية المعزولة باستخدام عينات مكتوبة بخط اليد من 1000 طالب جامعي. بدلًا من الاعتماد على صور اصطناعية أو مُولَّدة حاسوبيًا، جمعوا أحرفًا حقيقية بالقلم على الورق تغطي 12 حرف علة و18 حرف ساكن و214 تراكيب شائعة. قام الفريق بوضع علامات دقيقة على هذه العينات وجعلوا مجموعة البيانات متاحة للجمهور حتى تتمكن مجموعات أخرى من مقارنة الطرق والبناء على هذا العمل. بتنظيم الأبجدية إلى 104 رموز أساسية تُمثّل جميع 247 حرفًا، قللوا التكرار مع الحفاظ على تمثيل كامل لتشكيلات الأشكال التي تظهر في الكتابة اليدوية الحقيقية.
تنظيف وتمديد وتعليم الصور
قبل أن يبدأ أي تعلم، تُنقَّح كل صورة ممسوحة لإزالة الخلفيات الضوضائية والبقع والإضاءة غير المتساوية مع الحفاظ على الضربات الرقيقة التي تُعرّف كل حرف. تُحوَّل الصور إلى أبيض وأسود واضحة وتُعيد تحجيمها إلى صيغة قياسية حتى يرى الحاسوب كل مثال بنفس الطريقة. لجعل النظام صلبًا أمام عادات الكتابة المختلفة، يستخدم المؤلفون تشوهات متحكمًا بها: يزحزحون نقاطًا رئيسية في الصورة قليلًا ويطبقون تشوهات ناعمة، مولدين نسخًا جديدة من كل حرف لا تزال تُرى كالحرف نفسه من قبل الإنسان. تساعد مجموعة التدريب المُوسّعة هذه النموذج على التعرف على الحروف حتى عندما تكون مائلة أو مضغوطة أو مكتوبة بنسب غير معتادة.

شبكة عميقة تتعلم الفروق الدقيقة
في قلب TamHNet بنية قوية للتعلّم العميق تُدعى Inception-ResNet-v2، صُمِّمت في الأصل للتعرّف العام على الأشياء. يقوم المؤلفون بتكييف وضبط هذه الشبكة بشكل خاص لخط التاميل. يعالج النموذج كل صورة عبر طبقات كثيرة تحول تدريجيًا البكسلات الخام إلى أنماط أعلى مستوى، مثل الحواف والمنحنيات وأجزاء الحرف. الاتصالات المختصرة الخاصة، المعروفة بالروابط الباقية (residual)، تُثبّت التدريب وتساعد الشبكة على التركيز على الفروق الصغيرة لكن الحاسمة بين الحروف المتشابهة. بدلًا من تعديل كل الإعدادات الداخلية مرة واحدة، يقوم الفريق بـ «إلغاء تجميد» انتقائي لأكثر الطبقات فائدة ويضبطها لهذه المهمة. يستخدمون تقنية تحسين تُسمى آدم (Adam)، التي تكيف تلقائيًا معدل تغيّر كل معامل، ما يسمح للشبكة بالتعلم بكفاءة من خط اليد المعقّد وأحيانًا الفوضوي.
مدى دقة النظام في قراءة الخط
قيم الباحثون TamHNet على مجموعة البيانات الجديدة باستخدام مقاييس قياسية لجودة التعرّف. يحقق النظام دقة تقارب 99.8% عبر 104 فئات حروف، متفوقًا على طيف واسع من الطرق السابقة المبنية على آلات دعم القرار، وشبكات الالتفاف التقليدية، وتصميمات متقدمة أخرى للتعلّم العميق. تظهر الاختبارات التفصيلية أن حتى الحروف ذات الأشكال المتشابهة للغاية تتم تمييزها بشكل صحيح في معظم الحالات، وتؤكد المنحنيات الإحصائية أن النموذج نادرًا ما يخلط بين حرف وآخر. مقارنة بالأعمال السابقة، يمثل هذا خطوة واضحة إلى الأمام من حيث الموثوقية في التعرّف على الحروف التاملية المكتوبة باليد.
ماذا يعني هذا للقراء والأرشيفات
بالنسبة لغير المتخصصين، الخلاصة الأساسية هي أن الحواسيب تتحسن بشكل كبير في قراءة الخط التاميلي. يمكن لنظام مثل TamHNet تشغيل أدوات تحول كومات من دفاتر الملاحظات والمخطوطات التاريخية والنماذج المكتوبة يدويًا إلى نص رقمي قابل للبحث مع تصحيح بشري قليل. بينما النموذج الحالي لا يتعامل بعد مع بعض الرموز القائمة على النقاط ونسخ الخطوط القديمة، يحدد المؤلفون خططًا لتمديده إلى أساليب كتابة قديمة أيضًا. عمليًا، يقربنا هذا البحث من رقمنة واسعة النطاق ودقيقة للوثائق التاملية، ما يساعد في حماية التراث الثقافي ويجعل المعرفة المكتوبة أكثر سهولة للوصول للأجيال القادمة.
الاستشهاد: Periyasamy, H., Natarajan, S. & Amirtharajan, R. Deep inception neural network with residual connections for Tamil handwritten character recognition. Sci Rep 16, 6053 (2026). https://doi.org/10.1038/s41598-026-36330-7
الكلمات المفتاحية: التعرّف على الحروف التاميلية المكتوبة باليد, التعرّف البصري على الحروف, التعلّم العميق, Inception-ResNet, الحفظ الرقمي