Clear Sky Science · tr
ChatGPT öncesi dönemde Ortabatı Birleşik Devletleri'nde veri bilimi akademik programları: küratörlü bir veri seti
Öğrenciler ve toplumlar için bunun önemi
Birleşik Devletler genelinde her dönem veri odaklı yeni dereceler ortaya çıkıyor gibi görünüyor, ancak “Veri Bilimi”, “Veri Analitiği” veya “Disiplinlerarası” bir programın gerçekte ne anlama geldiğini anlamak zor olabilir. Bu makale, ChatGPT gibi araçlar yaygınlaşmadan hemen önce Ortabatı Birleşik Devletleri'ndeki her veriyle ilgili akademik programı haritalayan ve düzenleyen özenle oluşturulmuş bir veri setini tanımlıyor; bu da kolejlerin bir sonraki nesil veri profesyonellerini nasıl eğittiklerine dair net bir anlık görüntü sunuyor.
Yapay zeka dalgası öncesinde çekilmiş bir anlık görüntü
Yazarlar, üretken yapay zekanın öğretim ve teknik çalışmayı yeniden şekillendirmeye başlamasından hemen önce, 2023'te veri bilimi eğitiminin durumunu yakalamayı amaçladılar. Topluluk kolejlerinden büyük üniversitelere kadar 12 Ortabatı eyaletindeki yükseköğretim kurumlarına odaklandılar. Bir programın adında “data” (veri) kelimesi geçiyorsa, onu ayrıntılı şekilde incelediler: Nerede öğretiliyordu? Bir ana dal mı, yan dal mı, sertifika mıydı? Lisans öğrencilerine mi yoksa lisansüstü öğrencilere mi yönelikti? Hangi bölümler sorumluydu ve ders programı hangi konuları kapsıyordu? Bu anı dondurarak, veri seti gelecekteki araştırmacıların eğitim tekliflerinin AI araçları yaygınlaştıkça nasıl değiştiğini görmesine olanak sağlıyor.

Farklı veri programı türlerini ayırmak
Yazarların karşılaştığı en büyük zorluklardan biri, “veri bilimi”nin birçok farklı şekilde kullanılması oldu. Neredeyse aynı ada sahip iki derece, öğrencileri çok farklı kariyerlere hazırlayabilir. Bu karmaşaya düzen getirmek için, dört ana gruptan oluşan tekrarlanabilir bir sınıflandırma sistemi oluşturdular. Klasik Veri Bilimi programı, önemli ölçüde matematik, istatistik ve bilgisayar bilimi birleştirir ve tipik olarak bu bölümler tarafından yönetilir. Disiplinlerarası Veri Bilimi programları teknik çekirdeği paylaşır ancak kısmen teknik olmayan bölümler tarafından yönlendirilir veya öğrencilerden ikinci bir ana dal ya da yan dal eklemelerini ister. Bir derece içinde bir “veri” yolu olan durumları tanımlayan Veri Bilimi Konsantrasyonu, bu kategoriyi oluşturur. Veri Analitiği programları ise “veri” kelimesini kullanan fakat tam matematik ve hesaplama karışımını içermeyen veya çekirdek nicel alanların dışındaki bölümler tarafından yürütülen teklifleri kapsar.
Bilgilerin nasıl toplandığı ve doğrulandığı
Veri setini oluşturmak için ekip önce College Board'un üniversite arama aracını kullanarak Ortabatı'daki kurumların bir listesini derledi. Ardından her okulun web sitesini elle ziyaret ettiler, başlıkta “data” geçen programları aradılar ve bilgileri yapılandırılmış bir elektronik tabloya kaydettier. Her program için eyalet, okul, şehir, program adı, kampüste mi çevrimiçi mi sunulduğu, düzey ve türü, ana dal, yan dal veya sertifika olup olmadığı gibi ayrıntıları belgelediler. Ana dalları ve yan dalları potansiyel olarak ayrı teklifler olarak ele alıp hangi bölümlerin resmi olarak sorumlu olduğuna yakından baktılar. Bölüm liderliği belirsiz olduğunda, müfredatın gerçekten matematik ve hesaplamayı birleştirip birleştirmediğini çıkarsamak için ders listelerine ve konu etiketlerine başvurdular. Elle yapılan çalışmanın ardından veriyi temizlemek, çoğaltmaları kaldırmak, tutarlı kategoriler uygulamak ve çelişkileri veya eksik bilgileri işaretlemek için Python kodu kullandılar.

Veri setinin Ortabatı hakkında ortaya koydukları
Nihai koleksiyon 225 okul sisteminden 404 benzersiz programı içeriyor. Bunların yarısından fazlası Veri Bilimi olarak sınıflandırılmış; bu da birçok Ortabatı kurumunun daha teknik, matematik ve hesaplama odaklı modeli benimsediğini gösteriyor. Yaklaşık üçte biri Veri Analitiği kategorisine giriyor; bunlar genellikle işletme, bilgi veya teknoloji birimleriyle bağlantılı ve genellikle hem matematik hem de bilgisayar bilimine birlikte daha az vurgu yapıyor. Disiplinlerarası Veri Bilimi ve Veri Bilimi Konsantrasyonu daha küçük ama önemli paylar oluşturuyor; bu da veri becerilerini işletme, mühendislik veya sosyal bilimler gibi alanlarla harmanlama çabalarını yansıtıyor. Yazarlar ayrıca okulları türlere ayırıyor—topluluk kolejleri, teknoloji ve mühendislik okulları, üniversiteler ve diğer kolejler—ve üniversitelerin teklif sayısında baskın olduğunu, topluluk kolejleri ve teknik okulların ise Veri Analitiği programlarına daha eğilimli olduğunu gösteriyorlar.
Bu kaynağı başkaları nasıl kullanabilir
Veri seti ve onu işlemek ve doğrulamak için kullanılan kod Harvard Dataverse aracılığıyla kamuya açıktır ve yeniden kullanılmak üzere tasarlanmıştır. Politika yapıcılar, iş gücü geliştirme yatırımlarını planlarken veriyle ilgili programların eyaletlere ve okul türlerine nasıl dağıldığını inceleyebilir. Bölüm başkanları ve müfredat tasarımcıları, kendi programlarını yakınlardaki veya benzer türdeki diğer programlarla karşılaştırabilir. Eğitim araştırmacıları, özellikle AI araçları sınıflara ve işyerlerine daha derinlemesine entegre oldukça, program adlarının, yapıların ve liderliğin zaman içinde nasıl değiştiğini izleyebilir. Öğretim üyeleri bile veriyi ders projelerinde kullanarak öğrencilerin girmeye hazırlandıkları gerçek eğitim manzarasını keşfetmelerine izin verebilir.
Bu çalışma bize basitçe ne anlatıyor
Özünde bu makale, Ortabatı kolejlerinin üretken yapay zekâ patlamasından hemen önce veri becerilerini nasıl öğrettiklerine dair iyi düzenlenmiş bir harita sunuyor. Farklı “veri” programı türlerini net şekilde ayırıp kimlerin yönettiğini ve neler gerektirdiğini belgeleyerek yazarlar, eğitimin hızlı teknolojik değişime ne ölçüde uyum sağladığını anlamak için bir temel sağlıyor. Yıllar sonra bu anlık görüntü, programların daha teknik mi, daha disiplinlerarası mı yoksa yapay zekâ tarafından daha mı şekillendirildiğini gösterecek ve okullara ile topluluklara öğrencileri veri odaklı bir dünyaya en iyi şekilde hazırlama konusunda rehberlik edecektir.
Atıf: Blackford, D., Maria Selvitella, A. Data science academic programs in the pre-ChatGPT erain the Midwestern United States: a curated dataset. Sci Data 13, 236 (2026). https://doi.org/10.1038/s41597-026-06553-4
Anahtar kelimeler: veri bilimi eğitimi, akademik programlar, Ortabatı üniversiteleri, veri analitiği dereceleri, yükseköğretim veri seti