Clear Sky Science · de

Akademische Data-Science-Programme in der Zeit vor ChatGPT im Mittleren Westen der Vereinigten Staaten: ein kuratiertes Datensatz

2026-01-17 · Zurück zur Übersicht

Warum das für Studierende und Gemeinschaften wichtig ist

In den gesamten Vereinigten Staaten scheinen jedes Semester neue, datenorientierte Studiengänge aufzutauchen, doch es ist oft schwer zu erkennen, was genau „Data Science“, „Data Analytics“ oder ein „interdisziplinäres“ Programm bedeuten. Dieser Artikel beschreibt einen sorgfältig aufgebauten Datensatz, der jedes datenbezogene akademische Programm im Mittleren Westen der USA kurz bevor Tools wie ChatGPT weit verbreitet waren, abbildet und organisiert und damit einen klaren Schnappschuss davon bietet, wie Hochschulen die nächste Generation von Datenfachkräften ausbildeten.

Ein Schnappschuss vor der KI-Welle

Die Autorinnen und Autoren hatten sich zum Ziel gesetzt, den Stand der Data-Science-Ausbildung im Jahr 2023 festzuhalten, unmittelbar bevor generative künstliche Intelligenz Lehre und technische Arbeit umzudeuten begann. Sie konzentrierten sich auf Hochschulen in zwölf Staaten des Mittleren Westens, von Community Colleges bis hin zu großen Universitäten. Wann immer der Programmname das Wort „data“ enthielt, untersuchten sie es im Detail: Wo wurde es angeboten? War es ein Major, ein Minor oder ein Zertifikat? Richtete es sich an Bachelor- oder Masterstudierende? Welche Abteilungen waren verantwortlich und welche Fächer deckte das Curriculum ab? Indem sie diesen Moment einfrieren, erlaubt der Datensatz künftigen Forschern zu sehen, wie sich Bildungsangebote verändern, während sich KI-Tools verbreiten.

Verschiedene Arten von Datenprogrammen unterscheiden

Eines der größten Probleme für die Autorinnen und Autoren ist, dass „Data Science“ sehr unterschiedlich verwendet wird. Zwei Abschlüsse mit fast identischen Namen können Studierende auf sehr verschiedene Karrieren vorbereiten. Um Ordnung in dieses Chaos zu bringen, entwickelten sie ein reproduzierbares Klassifikationssystem mit vier Hauptgruppen. Ein klassisches Data-Science-Programm vereint umfangreiche Mathematik, Statistik und Informatik und wird typischerweise von diesen Fachbereichen geleitet. Interdisziplinäre Data-Science-Programme teilen diesen technischen Kern, werden aber teilweise von nicht-technischen Abteilungen gelenkt oder verlangen von Studierenden ein zweites Hauptfach oder einen Minor. Data Science als Schwerpunkt beschreibt Fälle, in denen „Data“ eine Spezialisierung innerhalb eines anderen Studiengangs ist. Data-Analytics-Programme umfassen Angebote, die das Wort „data“ verwenden, denen jedoch die vollständige Mischung aus Mathematik und Informatik fehlt oder die von Abteilungen außerhalb der zentralen quantitativen Bereiche geleitet werden.

Wie die Informationen gesammelt und geprüft wurden

Um den Datensatz zu erstellen, nutzte das Team zunächst das College-Board-Tool zur Hochschulsuche, um eine Liste von Institutionen im Mittleren Westen zusammenzustellen. Anschließend besuchten sie manuell die Websites jeder Hochschule, suchten nach Programmen mit „data“ im Titel und zeichneten die Details in einer strukturierten Tabellenkalkulation auf. Für jedes Programm dokumentierten sie den Staat, die Hochschule, die Stadt, den Programmnamen, ob es vor Ort oder online angeboten wurde, das Niveau und den Typ sowie ob es sich um Major, Minor oder Zertifikat handelte. Majors und Minors behandelten sie als potenziell eigenständige Angebote und achteten genau darauf, welche Abteilungen offiziell verantwortlich waren. Wenn die fachliche Zuständigkeit unklar war, zogen sie Kurslisten und Fachkennzeichnungen heran, um abzuleiten, ob das Curriculum wirklich Mathematik und Informatik kombinierte. Nach der manuellen Arbeit nutzten sie Python-Code, um die Daten zu bereinigen, Duplikate zu entfernen, konsistente Kategorien durchzusetzen und Widersprüche oder fehlende Informationen zu markieren.

Was der Datensatz über den Mittleren Westen offenbart

Die abschließende Sammlung umfasst 404 einzigartige Programme aus 225 Hochschulsystemen. Mehr als die Hälfte davon sind als Data Science eingestuft, was darauf hindeutet, dass viele Institutionen im Mittleren Westen das technischere, auf Mathematik und Informatik fokussierte Modell angenommen haben. Etwa ein Drittel fällt unter Data Analytics, oft angesiedelt bei Wirtschafts-, Informations- oder Technikeinheiten und typischerweise mit geringerer Betonung sowohl von Mathematik als auch Informatik zusammen. Interdisziplinäre Data-Science-Programme und Data Science als Schwerpunkt machen kleinere, aber wichtige Anteile aus und spiegeln Bestrebungen wider, Datenkompetenzen mit Bereichen wie Wirtschaft, Ingenieurwesen oder Sozialwissenschaften zu verbinden. Die Autorinnen und Autoren gruppieren die Hochschulen außerdem nach Typen—Community Colleges, Fach- und Ingenieurschulen, Universitäten und andere Colleges—und zeigen, dass Universitäten die Anzahl der Angebote dominieren, während Community Colleges und Fachschulen stärker zu Data-Analytics-Programmen tendieren.

Wie andere diese Ressource nutzen können

Der Datensatz, öffentlich zugänglich über Harvard Dataverse zusammen mit dem Code zur Verarbeitung und Validierung, ist zur Weiterverwendung gedacht. Entscheidungsträgerinnen und -träger können untersuchen, wie datenbezogene Programme über Staaten und Hochschultypen verteilt sind, wenn sie Investitionen in die Arbeitskräfteentwicklung planen. Institutsleiterinnen und -leiter sowie Curriculum-Designer können ihre eigenen Programme mit anderen in der Nähe oder ähnlichen Typs vergleichen. Bildungsforschende können verfolgen, wie sich Programmnamen, Strukturen und Leitung im Laufe der Zeit ändern, insbesondere wenn KI-Tools tiefere Einzug in Lehrveranstaltungen und Arbeitsplätze halten. Lehrende können die Daten sogar in Kursprojekten nutzen und Studierende die reale Bildungslandschaft erkunden lassen, in die sie eintreten wollen.

Was diese Arbeit vereinfacht gesagt aussagt

Im Kern bietet dieser Artikel eine gut organisierte Landkarte darüber, wie Hochschulen im Mittleren Westen Datenkompetenzen lehrten, kurz bevor die generative KI-Boom einsetzte. Indem die Autorinnen und Autoren verschiedene Arten von „Daten“-Programmen klar trennen und dokumentieren, wer sie leitet und was sie verlangen, liefern sie eine Basislinie, um zu verstehen, wie Bildung mit raschen technologischen Veränderungen Schritt hält. In einigen Jahren wird dieser Schnappschuss zeigen, ob Programme technischer, interdisziplinärer oder stärker von KI geprägt wurden—und Schulen und Gemeinden bei der Entscheidung leiten, wie sie Studierende am besten auf eine datengetriebene Welt vorbereiten.

Zitation: Blackford, D., Maria Selvitella, A. Data science academic programs in the pre-ChatGPT erain the Midwestern United States: a curated dataset. Sci Data 13, 236 (2026). https://doi.org/10.1038/s41597-026-06553-4

Schlüsselwörter: Datenwissenschaftsausbildung, akademische Programme, Universitäten im Mittleren Westen, Studiengänge Datenanalyse, Hochschuldatenbank