Clear Sky Science · he
תוכניות אקדמיות במדעי הנתונים בטרום-תקופת ChatGPT במרכז המערב של ארצות הברית: מאגר נתונים ערוך
מדוע זה חשוב לסטודנטים ולקהילות
בארצות הברית מופיעות כל סמסטר תארים ממוקדי נתונים חדשים, אך קשה לפעמים להבחין מה בדיוק משמעות “מדעי הנתונים”, “אנליטיקת נתונים” או תוכנית “בין-תחומית”. מאמר זה מתאר מאגר נתונים שנבנה בקפידה וממפה ומארגן כל תוכנית אקדמית הקשורה לנתונים במרכז המערב של ארצות הברית מיד לפני שמכשירים כמו ChatGPT הפכו לנפוצים, ומציע תמונת מצב ברורה של האופן שבו המכללות הכשירו את הדור הבא של אנשי המקצוע בתחום הנתונים.
צילום מצב שנלקח לפני גל ה-AI
המחברים שמו להם למטרה ללכוד את מצב החינוך במדעי הנתונים בשנת 2023, מיד לפני שהבינה המלאכותית הגנרטיבית החלה לעצב מחדש הוראה ועבודה טכנית. הם התמקדותו במוסדות להשכלה גבוהה במשך 12 מדינות במרכז המערב, מקולג'ים קהילתיים ועד אוניברסיטאות גדולות. בכל פעם ששמו של תוכנית כלל את המילה “נתונים”, הם בחנו אותה בפירוט: היכן נלמדה? האם הייתה תואר עיקרי, תואר שניוני, או תעודה? האם היא נועדה לסטודנטים לתואר ראשון או לתארים מתקדמים? אילו מחלקות היו אחראיות ומה הנושאים שהקורסים כיסו? על ידי הקפאת הרגע הזה בזמן, המאגר מאפשר לחוקרים עתידיים לראות כיצד ההיצע החינוכי משתנה ככל שהכלים של ה-AI מתפשטים.

מיון סוגים שונים של תוכניות נתונים
אחת האתגרים הגדולים ביותר שעומדים בפני המחברים היא שהמונח “מדעי הנתונים” משמש בדרכים רבות ושונות. שני תארים בעלי שמות כמעט זהים יכולים להכין את הסטודנטים לקריירות שונות מאוד. כדי להביא סדר לכאוס הזה הם יצרו מערכת סיווג ניתן לשחזור עם ארבע קבוצות עיקריות. תוכנית מדעי נתונים קלאסית משלבת מתמטיקה משמעותית, סטטיסטיקה ומדעי המחשב ובדרך כלל מנוהלת על ידי אותן מחלקות. תוכניות מדעי הנתונים הבין-תחומיות חולקות את הליבה הטכנית הזו אך מונחות במידה מסוימת על ידי מחלקות שאינן טכניות או דורשות מהסטודנטים להוסיף תואר שני/מינור. מדעי הנתונים כריכוז מתארות מקרים שבהם “נתונים” הוא מסלול בתוך תואר אחר. תוכניות אנליטיקת נתונים כוללות הצעות שמשתמשות במילה “נתונים” אך חסר להן את השילוב המלא של מתמטיקה ומחשוב, או שמנוהלות על ידי מחלקות מחוץ לשדות הכמותיים הליבה.
כיצד נאספה ונבדקה המידע
כדי לבנות את המאגר, הצוות השתמש תחילה בכלי החיפוש של College Board כדי להרכיב רשימת מוסדות במרכז המערב. לאחר מכן הם ביקרו באתרי כל בית ספר ידנית, חיפשו תוכניות עם המילה “נתונים” בכותרת ורשמו פרטים בגליון נתונים מובנה. עבור כל תוכנית תיעדו את המדינה, המוסד, העיר, שם התוכנית, האם הוצעה בקמפוס או באופן מקוון, רמתה וסוגה, והאם הייתה תואר עיקרי, מינור או תעודה. הם טיפלו בתארים ראשיים ומשניים כהצעות שעשויות להיות נפרדות ושמו דגש על איזו מחלקה אחראית רשמית. כאשר הנהגת המחלקה לא הייתה ברורה, הם נעזרו ברשימות קורסים ובתגי נושאים כדי להסיק האם תוכנית הלימודים משתלבת באמת בין מתמטיקה ומחשוב. לאחר העבודה הידנית השתמשו בקוד פייתון לניקוי הנתונים, הסרת כפילויות, אכיפת קטגוריות עקביות וסימון סתירות או מידע חסר.

מה המאגר חושף על המישור המערבי
האוסף הסופי כולל 404 תוכניות ייחודיות מ-225 מערכות בתי ספר. יותר ממחצית מהן מסווגות כמדעי נתונים, מה שמרמז שרבות מהמוסדות במרכז המערב אימצו את המודל הטכני יותר המתמקד במתמטיקה ומחשוב. כשליש שייכות לאנליטיקת נתונים, לעתים קרובות קשורות לעסקים, מידע או יחידות טכנולוגיות, ובדרך כלל מדגישות פחות גם יחד מתמטיקה ומדעי המחשב. מדעי הנתונים הבין-תחומיים ומדעי הנתונים כריכוז מהווים חלקים קטנים יותר אך משמעותיים, המשקפים מאמצים לשלב מיומנויות נתונים עם תחומים כמו עסקים, הנדסה או מדעי החברה. המחברים גם מקבצים מוסדות לפי סוגים—קולג'ים קהילתיים, בתי ספר טכנולוגיים והנדסיים, אוניברסיטאות ומכללות אחרות—ומראים שאוניברסיטאות דומיננטיות במספר ההיצע, בעוד שקולג'ים קהילתיים ובתי ספר טכניים נוטים יותר לכיוון תוכניות אנליטיקת נתונים.
כיצד אחרים יכולים להשתמש במשאב זה
המאגר, זמין לציבור דרך Harvard Dataverse יחד עם הקוד ששימש לעיבוד ולאימותו, נועד לשימוש חוזר. מקבלי החלטות יכולים לבדוק כיצד תוכניות הקשורות לנתונים מופצות בין המדינות וסוגי המוסדות בעת תכנון השקעות בפיתוח כוח אדם. יושבי ראש מחלקות ומעצביי תכניות יכולים להשוות את התוכניות שלהם לאלו בקרבת מקום או מסוג דומה. חוקרי חינוך יכולים לעקוב אחר שינוי שמות התוכניות, מבנים ואחריות ניהולית עם הזמן, במיוחד ככל שכלי ה-AI משתלבים יותר בכיתות ובמקומות עבודה. מרצים אפילו יכולים להשתמש בנתונים בפרויקטים כיתתיים, ולהאפשר לסטודנטים לחקור את הנוף החינוכי האמיתי שאליו הם עומדים להיכנס.
מה עבודה זו אומרת לנו, במילים פשוטות
בבסיסו, מאמר זה מציע מפת מצב מסודרת של האופן שבו המכללות במרכז המערב לימדו מיומנויות נתונים מיד לפני פרץ הבינה המלאכותית הגנרטיבית. על ידי הפרדה ברורה של סוגים שונים של תוכניות “נתונים” ותיעוד מי מנהל אותן ומה הן דורשות, המחברים מספקים קו בסיס להבנת אופן התאמת ההשכלה לשינוי טכנולוגי מהיר. שנים מהיום, צילום מצב זה יעזור להראות האם התוכניות הפכו לטכניות יותר, בין-תחומיות יותר, או מעוצבות יותר על ידי AI — וידריך מוסדות וקהילות כשהן יחליטו כיצד להכין טוב יותר את הסטודנטים לעולם המונע-נתונים.
ציטוט: Blackford, D., Maria Selvitella, A. Data science academic programs in the pre-ChatGPT erain the Midwestern United States: a curated dataset. Sci Data 13, 236 (2026). https://doi.org/10.1038/s41597-026-06553-4
מילות מפתח: חינוך במדעי הנתונים, תוכניות אקדמיות, אוניברסיטאות במרכז המערב, תארים באנליטיקה של נתונים, מאגר נתונים להשכלה גבוהה