Clear Sky Science · pl
Programy akademickie z zakresu nauki o danych w erze przed ChatGPT na Środkowym Zachodzie USA: skatalogowany zestaw danych
Dlaczego to ma znaczenie dla studentów i społeczności
W całych Stanach Zjednoczonych co semestr pojawiają się nowe kierunki związane z danymi, ale bywa trudno rozpoznać, co w praktyce oznaczają nazwy takie jak „Nauka o danych”, „Analityka danych” czy program „Interdyscyplinarny”. Ten artykuł opisuje starannie zbudowany zestaw danych, który mapuje i porządkuje wszystkie programy akademickie związane z danymi na Środkowym Zachodzie USA tuż przed rozpowszechnieniem narzędzi takich jak ChatGPT, dając wyraźne spojrzenie na to, jak uczelnie kształciły kolejne pokolenie specjalistów od danych.
Migawka zrobiona przed falą AI
Autorzy postawili sobie za cel uchwycenie stanu edukacji w zakresie nauki o danych w 2023 roku, tuż przed tym, jak generatywna sztuczna inteligencja zaczęła przekształcać nauczanie i pracę techniczną. Skupili się na instytucjach szkolnictwa wyższego w 12 stanach Środkowego Zachodu, od szkół zawodowych po duże uniwersytety. Gdy nazwa programu zawierała słowo „data” (dane), przyjrzeli się mu szczegółowo: gdzie jest prowadzony? Czy to kierunek główny, specjalizacja, czy certyfikat? Czy skierowany do studentów I stopnia czy studiów magisterskich? Jakie wydziały go prowadzą i jakich tematów dotyczą kursy? Zamrożenie tego momentu w czasie pozwala przyszłym badaczom zobaczyć, jak oferty edukacyjne zmieniają się wraz z rozprzestrzenianiem się narzędzi AI.

Rozróżnianie różnych typów programów związanych z danymi
Jednym z największych wyzwań, przed którymi stanęli autorzy, jest to, że „nauka o danych” jest używana w bardzo różnych znaczeniach. Dwa kierunki o niemal identycznych nazwach mogą przygotowywać studentów do zupełnie innych zawodów. Aby wprowadzić porządek w tym chaosie, stworzyli odtwarzalny system klasyfikacji składający się z czterech głównych grup. Klasyczny program Data Science łączy znaczący zakres matematyki, statystyki i informatyki i zwykle jest prowadzony przez te wydziały. Interdyscyplinarna Nauka o Danych zachowuje to techniczne jądro, ale jest częściowo kierowana przez wydziały nietechniczne lub wymaga od studentów dodania drugiego kierunku lub specjalizacji. Nauka o Danych jako Specjalizacja opisuje przypadki, w których „dane” są ścieżką w ramach innego stopnia. Programy Analityki Danych obejmują oferty, które używają słowa „data”, ale nie mają pełnego połączenia matematyki i informatyki albo są prowadzone przez wydziały spoza głównych dziedzin ilościowych.
Jak zbierano i weryfikowano informacje
Aby zbudować zestaw danych, zespół najpierw skorzystał z narzędzia wyszukiwania uczelni College Board, by stworzyć listę instytucji na Środkowym Zachodzie. Następnie odwiedzili ręcznie strony każdego uniwersytetu, wyszukali programy z „data” w tytule i zapisali szczegóły w uporządkowanym arkuszu kalkulacyjnym. Dla każdego programu dokumentowali stan, szkołę, miasto, nazwę programu, czy był oferowany stacjonarnie czy online, jego poziom i typ oraz czy był to kierunek główny, specjalizacja czy certyfikat. Traktowali kierunki główne i specjalizacje jako potencjalnie odrębne oferty i zwracali szczególną uwagę na to, które wydziały były formalnie odpowiedzialne. Gdy liderstwo wydziału było niejasne, odwoływali się do list kursów i tagów przedmiotowych, by wywnioskować, czy program rzeczywiście łączył matematykę i informatykę. Po pracy ręcznej użyli kodu w Pythonie do oczyszczenia danych, usunięcia duplikatów, utrzymania spójnych kategorii i oznaczenia sprzeczności lub brakujących informacji.

Co zestaw danych ujawnia o Środkowym Zachodzie
Ostateczna kolekcja zawiera 404 unikalne programy z 225 systemów szkół. Ponad połowa z nich została sklasyfikowana jako Data Science, co sugeruje, że wiele instytucji na Środkowym Zachodzie przyjęło bardziej techniczny model z naciskiem na matematykę i informatykę. Około jedna trzecia przypada na Analitykę Danych, często związaną z jednostkami biznesowymi, informacyjnymi lub technologicznymi i zwykle mniej akcentującą jednoczesne wykorzystanie matematyki i informatyki. Interdyscyplinarna Nauka o Danych i Nauka o Danych jako Specjalizacja stanowią mniejsze, lecz istotne części, odzwierciedlając wysiłki łączenia umiejętności związanych z danymi z obszarami takimi jak biznes, inżynieria czy nauki społeczne. Autorzy również grupują szkoły według typów — szkoły community college, szkoły techniczne i inżynieryjne, uniwersytety oraz inne uczelnie — i pokazują, że to uniwersytety dominują pod względem liczby ofert, podczas gdy community colleges i szkoły techniczne częściej skłaniają się ku programom Analityki Danych.
Jak inni mogą wykorzystać to źródło
Zestaw danych, publicznie dostępny przez Harvard Dataverse wraz z kodem użytym do jego przetworzenia i weryfikacji, jest przeznaczony do ponownego użycia. Decydenci mogą badać, jak programy związane z danymi są rozmieszczone w poszczególnych stanach i typach szkół przy planowaniu inwestycji w rozwój siły roboczej. Kierownicy wydziałów i projektanci programów mogą porównywać własne oferty z innymi w regionie lub o podobnym profilu. Badacze edukacji mogą śledzić, jak nazwy programów, ich struktury i kierownictwo zmieniają się w czasie, szczególnie gdy narzędzia AI coraz głębiej wchodzą do klas i miejsc pracy. Instruktorzy mogą także wykorzystać dane w projektach kursowych, pozwalając studentom badać rzeczywisty krajobraz edukacyjny, do którego wkrótce wejdą.
Co ta praca mówi nam wprost
W istocie ten artykuł oferuje dobrze uporządkowaną mapę tego, jak uczelnie na Środkowym Zachodzie uczyły umiejętności związanych z danymi tuż przed boomem generatywnej AI. Poprzez wyraźne rozdzielenie różnych rodzajów programów „danych” oraz udokumentowanie, kto je prowadzi i czego wymagają, autorzy dostarczają punktu odniesienia pozwalającego zrozumieć, jak edukacja nadąża za szybkim postępem technologicznym. Za kilka lat ta migawka pomoże pokazać, czy programy stały się bardziej techniczne, bardziej interdyscyplinarne, czy bardziej ukształtowane przez AI — i pomoże szkołom oraz społecznościom zdecydować, jak najlepiej przygotować studentów na świat napędzany danymi.
Cytowanie: Blackford, D., Maria Selvitella, A. Data science academic programs in the pre-ChatGPT erain the Midwestern United States: a curated dataset. Sci Data 13, 236 (2026). https://doi.org/10.1038/s41597-026-06553-4
Słowa kluczowe: edukacja w zakresie nauki o danych, programy akademickie, uniwersytety Środkowego Zachodu, stopnie analityki danych, zestaw danych szkolnictwa wyższego