Clear Sky Science · ar

التحليل الموضوعي باستخدام الذكاء الاصطناعي التوليدي مفتوح المصدر وتعلّم الآلة: طريقة جديدة لتطوير دفتر رموز نوعي استنتاجي

· العودة إلى الفهرس

لماذا يهم هذا لأسئلة الحياة اليومية

عندما يملأ الناس استبيانات أو يجيبون على أسئلة مقابلات، يتركون وراءهم قصصًا غنية عن العمل أو المدرسة أو الصحة أو حياة المجتمع. قراءة بضعة عشرات من هذه الإجابات سهلة؛ أما فهم آلافها فليس كذلك. تصف هذه المقالة طريقة جديدة للباحثين لاستخدام الذكاء الاصطناعي مفتوح المصدر لمساعدة فرز أكوام كبيرة من التعليقات المكتوبة واستخراج الأفكار الرئيسية، مع الإبقاء على البشر مسؤولين عن التفسير. الهدف هو جعل البحث النوعي الدقيق والمتأنٍ ممكنًا على مقاييس عادة ما تُخصّص للإحصاءات الضخمة.

طريقة أذكى لقراءة آلاف التعليقات

يركز المؤلفون على نهج شائع في العلوم الاجتماعية يُسمى التحليل الموضوعي، حيث يقرأ الباحثون النصوص ويبحثون عن أنماط متكررة أو «موضوعات» تجيب على أسئلتهم البحثية. تقليديًا، يعني ذلك ترميز كل تعليق يدويًا وبناء دفتر رموز—قائمة منظمة بالموضوعات والموضوعات الفرعية. يمكن أن ينجح هذا الأسلوب مع بضعة عشرات من المقابلات، لكنه يصبح مرهقًا عندما يكون هناك عشرات الآلاف من الإجابات المفتوحة. تسأل المقالة: هل يمكن لنماذج النص التوليدية المتاحة مجانًا وأدوات مفتوحة المصدر الأخرى المساعدة في الأجزاء الأولية والمتكررة من هذا العمل دون أن تحل محل حكم الإنسان؟

Figure 1
الشكل 1.

تقديم سير عمل GATOS

للإجابة على هذا السؤال، يقدم المؤلفون سير العمل المُمكَّن بالذكاء الاصطناعي التوليدي لتنظيم وبنية الموضوعات، أو GATOS. يربط هذا السير عدداً من الخطوات. أولاً، يقرأ نموذج لغة مفتوح المصدر الردود الفردية ويكتب نقاط ملخصة قصيرة ومركزة عما يقوله كل شخص. بعد ذلك، يحول أداة أخرى هذه الملخصات إلى تمثيلات رقمية حتى يتمكن الحاسوب من مقارنة وتجميع الأفكار المتماثلة. تُجمّع هذه الملخصات في مجموعات من المحتمل أن تعكس موضوعات مشتركة، مثل المخاوف بشأن التوازن بين العمل والحياة أو الإحباط من ضعف التواصل.

ترك الفرصة للذكاء الاصطناعي لاقتراح أفكار جديدة ولكن ليس بغزارة

تأتي الخطوة الأكثر حداثة عندما يبدأ النظام في بناء مسودة دفتر الرموز. لكل مجموعة من الملخصات المرتبطة، ينظر نموذج توليدي آخر في الأفكار الموجودة في تلك المجموعة وفي الرموز الموجودة بالفعل في دفتر الرموز. ثم يستدل فيما إذا كانت هناك حاجة فعلية لرمز جديد، أم أن الرموز الحالية كافية. إذا ظهر منظور جديد—مثل «أدوات مؤتمرات فيديو موثوقة» كقضية محددة—يقترح تسمية قصيرة وتعريفًا ويُضاف ذلك. وإذا لم يحدث ذلك، فيختار إعادة استخدام ما هو موجود. تجمع خطوة نهائية الرموز ذات الصلة في موضوعات أوسع، فتخلق خريطة منظمة من التعليقات الخام إلى رؤى مرتبة. طوال العملية، يكون التركيز على تجنب فيض من الرموز المتشابهة مع الاستمرار في التقاط الفروق الدقيقة في تجارب الناس.

Figure 2
الشكل 2.

اختبار الطريقة ببيانات مصطنعة واقعية المظهر

لأن الدراسات الحقيقية نادرًا ما تأتي «مصحوبة بمفتاح إجابة»، اختبرت الفريق GATOS باستخدام بيانات تركيبية (مولّدة حاسوبيًا) حيث كانت الموضوعات المخفية معروفة مسبقًا. أنشأوا ثلاث مجموعات بيانات كبيرة وواقعية المظهر: ملاحظات الأقران حول العمل الجماعي، وجهات نظر حول ثقافة الأخلاقيات في مكان العمل، وآراء حول العودة إلى المكتب بعد جائحة كوفيد-19. لكل مجموعة بيانات عرّفوا أولًا ثمانية موضوعات وعددًا من الموضوعات الفرعية، ثم استخدموا نموذج لغة لكتابة مئات الردود الواقعية من شخصيات مختلفة، مثل أعضاء النقابات أو المديرين أو الطلاب. بعد تشغيل GATOS على هذه المجموعات، قارن المراجعون البشريون الموضوعات المولّدة آليًا بالموضوعات الفرعية الأصلية المخفية ليروا مدى تطابقها.

كيف كانت النتائج وما هي المقايضات؟

عبر حالات الاختبار الثلاث، استعاد سير العمل معظم الموضوعات الفرعية الأصلية عن قرب: الغالبية الساحقة كان لها تطابق قوي واحد على الأقل، وفقط عدد قليل لم يكن له نظير جيد. ومن المهم أن النظام عند فحص مزيد من البيانات اقترح رموزًا جديدة أقل، ما يشير إلى أنه يتعلم إعادة استخدام الأفكار القائمة بدل اختراع تباينات لا نهائية. يجادل المؤلفون أن هذا النوع من الإعداد مفتوح المصدر والقابل للتشغيل محليًا يمكن أن يخفف مخاوف الخصوصية ويُسهّل على فرق بحثية مختلفة تكرار عمل بعضها البعض. وفي الوقت نفسه، يؤكدون أن البيانات التركيبية أبسط من كثير من الحالات الواقعية، وأن سير العمل قد يظل ينتج رموزًا متداخلة، وأن الباحثين البشر لا يزالون ضروريين لتنقية وتفسير وإصدار الحكم النهائي على دفتر الرموز.

ماذا يعني هذا لغير المتخصصين

للقراء خارج الأوساط الأكاديمية، الخلاصة هي أن الذكاء الاصطناعي مفتوح المصدر يمكن أن يساعد علماء الاجتماع والباحثين الآخرين على الاستماع إلى عدد أكبر بكثير من الناس دون اختزال أقوالهم إلى أرقام بسيطة. بدلًا من استبدال المحللين البشريين، يعمل سير عمل GATOS كمساعد سريع ومنظم للغاية يقترح أنماطًا ومسميات مسودة، ويترك للبشر قرار ما تعنيه تلك الأنماط بالفعل. إذا أكدت دراساتٌ لاحقة هذه النتائج على بيانات العالم الحقيقي، فقد تجعل أدوات مثل GATOS من الأسهل استناد سياسات مكان العمل والبرامج التعليمية والقرارات العامة إلى الثراء الكامل لما يقوله الناس بالفعل، لا فقط إلى صناديق الإجابات متعددة الخيارات.

الاستشهاد: Katz, A., Fleming, G.C. & Main, J.B. Thematic analysis with open-source generative AI and machine learning: a new method for inductive qualitative codebook development. Humanit Soc Sci Commun 13, 209 (2026). https://doi.org/10.1057/s41599-026-06508-5

الكلمات المفتاحية: تحليل البيانات النوعية, التحليل الموضوعي, الذكاء الاصطناعي التوليدي, نماذج اللغة مفتوحة المصدر, طرق بحث العلوم الاجتماعية