Clear Sky Science · ar
برامج أكاديمية في علم البيانات في حقبة ما قبل ChatGPT في الولايات المتحدة الوسطى: مجموعة بيانات منظمة
لماذا هذا مهم للطلاب والمجتمعات
في أنحاء الولايات المتحدة، يبدو أن درجات جديدة تركّز على البيانات تظهر كل فصل دراسي، لكن من الصعب أحيانًا معرفة ما الذي يعنيه مصطلح «علم البيانات» أو «تحليل البيانات» أو برنامج «متعدد التخصصات». يصف هذا المقال مجموعة بيانات بُنيت بعناية تُرسم وتُنظّم كل برنامج أكاديمي متعلق بالبيانات في منطقة الغرب الأوسط بالولايات المتحدة قبل انتشار أدوات مثل ChatGPT، مقدّمًا لقطة واضحة لكيفية إعداد الجامعات للجيل القادم من محترفي البيانات.
لقطة التُقطت قبل موجة الذكاء الاصطناعي
سعى المؤلفون إلى توثيق حالة تعليم علم البيانات في عام 2023، قبل أن تبدّل نماذج الذكاء الاصطناعي التوليدية طريقة التدريس والعمل التقني. ركّزوا على مؤسسات التعليم العالي في 12 ولاية بالغرب الأوسط، من كليات المجتمع إلى الجامعات الكبرى. كلما تضمن اسم البرنامج كلمة «بيانات»، فحصوه تفصيليًا: أين يُدرّس؟ هل هو اختصاص رئيسي، ثانوي، أم شهادة؟ هل موجّه لطلاب البكالوريوس أم الدراسات العليا؟ أي الأقسام مسؤولة عنه، وما المواضيع التي تغطيها المقررات؟ من خلال تجميد هذه اللحظة الزمنية، تتيح مجموعة البيانات للباحثين المستقبليين رؤية كيف تتغير العروض التعليمية مع انتشار أدوات الذكاء الاصطناعي.

تمييز أنواع برامج البيانات المختلفة
أحد أكبر التحديات التي واجهها المؤلفون هو أن مصطلح «علم البيانات» يُستخدم بطرق متعددة. قد تؤهّل شهادتان لهما أسماء متقاربة الطلاب لمسارات مهنية مختلفة تمامًا. لتنظيم هذا الفوضى، أنشأوا نظام تصنيف قابلاً للتكرار يضم أربع مجموعات رئيسية. برنامج علم البيانات الكلاسيكي يجمع بين قدر كبير من الرياضيات والإحصاء وعلوم الحاسوب وعادة ما تقوده تلك الأقسام. برامج علم البيانات متعددة التخصصات تشترك في هذا الأساس التقني لكنها تُدار جزئيًا من قبل أقسام غير تقنية أو تتطلب من الطلاب إضافة تخصص ثانٍ أو تخصص ثانوي. «علم البيانات كتركيز» يصف حالات يكون فيها «البيانات» مسارًا داخل شهادة أخرى. برامج تحليل البيانات تشمل العروض التي تذكر كلمة «بيانات» لكنها تفتقر إلى المزيج الكامل من الرياضيات والحوسبة، أو تُدار من قبل أقسام خارج المجالات الكمية الأساسية.
كيف جُمعت المعلومات وفُحِصت
لبناء مجموعة البيانات، استخدم الفريق أولًا أداة البحث عن الكليات التابعة لـ College Board لتجميع قائمة بالمؤسسات في الغرب الأوسط. ثم زاروا مواقع كل كلية يدويًا، وبحثوا عن برامج تتضمن كلمة «بيانات» في العنوان، وسجلوا التفاصيل في جدول بيانات منظم. لكل برنامج وثقوا الولاية، والمؤسسة، والمدينة، واسم البرنامج، وما إذا كان يُقدّم في الحرم الجامعي أم عبر الإنترنت، ومستواه ونوعه، وما إذا كان تخصصًا رئيسيًا أو ثانويًا أو شهادة. اعتبروا التخصصات الرئيسية والثانوية عروضًا متميزة محتملة وأعطوا اهتمامًا خاصًا للأقسام المسؤولة رسميًا. عندما كان قيادة القسم غير واضحة، اعتمدوا على قوائم المقررات ووسوم المواد لاستنتاج ما إذا كانت المناهج تجمع فعليًا بين الرياضيات والحوسبة. بعد العمل اليدوي، استخدموا رمز Python لتنظيف البيانات، وإزالة التكرارات، وفرض فئات متسقة، وعلموا أي تناقضات أو معلومات مفقودة.

ما تكشفه مجموعة البيانات عن الغرب الأوسط
تتضمن المجموعة النهائية 404 برامج فريدة من 225 نظامًا تعليميًا. أكثر من نصف هذه البرامج مُصنّفة كعلم بيانات، مما يشير إلى أن العديد من مؤسسات الغرب الأوسط اعتمدت نموذجًا أكثر تقنية يركّز على الرياضيات والحوسبة. نحو ثلثها يصنّف كتحليل بيانات، وغالبًا ما يرتبط ذلك بوحدات الأعمال أو المعلومات أو التكنولوجيا، وعادة ما يضع تركيزًا أقل على الرياضيات وعلوم الحاسوب معًا. البرامج متعددة التخصصات وعلم البيانات كتركيز تشكل أجزاءً أصغر لكنها مهمة، مما يعكس جهودًا لدمج مهارات البيانات مع مجالات مثل الأعمال والهندسة أو العلوم الاجتماعية. يصنّف المؤلفون أيضًا المدارس إلى أنواع—كليات المجتمع، والمدارس التقنية والهندسية، والجامعات، وكليات أخرى—ويُظهرون أن الجامعات تتفوق في عدد العروض، بينما تميل كليات المجتمع والمدارس التقنية إلى برامج تحليل البيانات أكثر.
كيف يمكن للآخرين استخدام هذا المورد
مجموعة البيانات متاحة علنًا عبر Harvard Dataverse إلى جانب الشيفرة المستخدمة لمعالجتها والتحقق منها، ومقصود إعادة استخدامها. يمكن لصانعي السياسات فحص كيفية توزيع البرامج المتعلقة بالبيانات عبر الولايات وأنواع المدارس عند التخطيط للاستثمارات في تطوير القوى العاملة. يمكن لرؤساء الأقسام ومصممي المناهج مقارنة برامجهم ببرامج أخرى قريبة أو مماثلة في النوع. يمكن لباحثي التعليم تتبع كيف تتغير أسماء البرامج وهياكلها وقيادتها مع مرور الوقت، لا سيما مع تعمق أدوات الذكاء الاصطناعي في الصفوف ومواقع العمل. ويمكن للمدرسين استخدام البيانات في مشاريع صفية، مما يتيح للطلاب استكشاف المشهد التعليمي الحقيقي الذي هم على وشك دخوله.
ما الذي يخبرنا به هذا العمل، ببساطة
في جوهره، يقدم هذا المقال خريطة منظمة جيدًا لكيفية تدريس كليات الغرب الأوسط لمهارات البيانات قبل طفرة الذكاء الاصطناعي التوليدي. من خلال فصل أنواع برامج «البيانات» بوضوح وتوثيق من يديرها وما تتطلبه، يوفر المؤلفون أساسًا لفهم كيف يواكب التعليم التغير التكنولوجي السريع. بعد سنوات، ستساعد هذه اللقطة في إظهار ما إذا أصبحت البرامج أكثر تقنية أو أكثر تعددية التخصصات، أو أكثر تشكّلًا بالذكاء الاصطناعي—وستوجه المدارس والمجتمعات عند تقرير أفضل السبل لإعداد الطلاب لعالم يعتمد على البيانات.
الاستشهاد: Blackford, D., Maria Selvitella, A. Data science academic programs in the pre-ChatGPT erain the Midwestern United States: a curated dataset. Sci Data 13, 236 (2026). https://doi.org/10.1038/s41597-026-06553-4
الكلمات المفتاحية: تعليم علم البيانات, البرامج الأكاديمية, جامعات منطقة الغرب الأوسط, درجات تحليل البيانات, مجموعة بيانات التعليم العالي