Clear Sky Science · tr

Dinamik astronomi için ticari ve açık kaynaklı çok modlu büyük dil modellerini değerlendirme: rezonans davranışı sınıflandırmasının kıyaslama çalışması

· Dizine geri dön

Gökyüzü meraklıları ve veri tutkunları için neden önemli

Astronomlar, şaşırtıcı derecede çok zamanı yere yakın bir şeyi andıran işlerle geçirir: grafikleri uzun uzun incelemek ve hangilerinin “salındığını”, hangilerinin “sürüklendiğini” ve hangilerinin kaotik davrandığını belirlemek. Bu desenler, asteroitlerin gezegenlerle ince yörünge danslarına kilitlenip kilitlenmediğini, dolayısıyla Güneş Sistemi’nin milyarlarca yıllık evrimini nasıl şekillendirdiğini ortaya koyar. Bu makale güncel bir soruyu gündeme getiriyor: hem metni hem resmi anlayabilen modern yapay zeka sistemleri, özel eğitim olmadan insan uzmanlar kadar güvenilir şekilde bu yargıları verebilir mi?

Figure 1
Figure 1.

Güneş Sistemi’nin gizli trafik kuralları

Birçok asteroit yalnız başına Güneş’in etrafında dönmez. Yörüngeleri, gezegenlerin düzenli kütleçekimsel çekimleriyle itilerek değiştirilir; buna yörünge rezonansı denir. Bir asteroitin hareketi basit bir ritimde bir gezegenin hareketiyle eşleştiğinde, yörüngesi yakalanabilir, uyarılabilir veya kararsızlaşabilir. Astronomlar bunu zaman içinde “rezonans açısı” olarak adlandırılan bir niceliği çizen grafiklerle teşhis eder. Eğer grafikteki noktalar bir bant içinde salınıyorsa cisim rezonans içindedir; eğer noktalar dikey aralıktaki tüm değeri çaprazlayarak sarma yapıyorsa rezonans dışındadır; arada gidip geliyorlarsa davranış daha belirsiz veya geçicidir. Açık vakalarda basit bilgisayar kuralları iyi çalışır—ancak ana asteroit kuşağı gibi kalabalık bölgelerde, çakışan etkiler düzensiz, gürültülü grafikler üretir; bunlar otomatik sınıflandırılması zor olup geleneksel olarak uzman gözleri gerektirmiştir.

Özel algoritmalardan genel amaçlı yapay zekâya

Yakın zamana kadar araştırmacılar iki geniş stratejiye dayanıyordu. Karar ağaçları ve sinir ağları gibi klasik makine öğrenimi modelleri belirli rezonans türlerini tanımak üzere eğitilebilir, fakat her yeni problem kendi etiketlenmiş veri setine, ayara ve koda ihtiyaç duyar. Dikkatle tasarlanmış kurallar ve frekans analizi üzerine kurulu deterministik yöntemler, sinyal temiz olduğunda iyi performans gösterir; ancak rezonanslar çakıştığında veya yalnızca geçici olarak ortaya çıktığında zorlanırlar. Her iki yaklaşım da bilimsel açıdan en ilginç olan yerde başarısız olur: geçici yakalanmalar, rezonans “yapışmaları” ve kaotik hareket içeren sınır vakalarında. Buna karşılık, görselleri inceleyebilen modern büyük dil modelleri (LLM’ler) farklı bir vaat sunar: sıfır-örnek (zero-shot) akıl yürütme. Binlerce özel örneğe eğitmek yerine, onlara doğal dil talimatı ve bir grafik verilir; hangi kategorinin davranışı en iyi tanımladığı sorulur.

Yapay zekâ gözleri için adil bir test oluşturmak

Modellerin gerçekte ne kadar iyi olduğunu sınamak için yazarlar, hem ortalama-hareket (mean-motion) hem de seküler rezonanslar olmak üzere iki önemli yörünge etkileşimi sınıfını gösteren kıyaslama görsel setleri hazırladılar. Her görüntü, uzun sayısal simülasyonlardan derlenen açı karşısında zaman serisi dağılım grafiğidir ve her biri uzmanlar tarafından rezonant, rezonant olmayan, geçici veya en uç ve tartışmalı vakalarda “tartışmalı” olarak dikkatle etiketlenmiştir. Dört veri kümesi derlendi: küçük bir “akıl sağlığı kontrolü” seti (RB-TEST), önceki çalışmalara denk 50 görsellik pilot set (RB-PILOT), çok sayıda belirsiz vaka içeren 50 görsellik set (RB-SMALL) ve tüm davranışları örnekleyen geniş 450 görsellik koleksiyonu (RB-FULL). Yazarlar ardından bu görüntüleri geniş bir model kadrosuna sundular: üst düzey ticari sistemler, büyük açık kaynak modelleri ve kişisel bilgisayarda çalıştırılabilecek küçük açık kaynak modelleri. Daha büyük modellere ayrıntılı adım adım istemler verildi; daha küçükler basit, hafif bir kurallar dizisi kullandılar.

Bilgisayarlar astronomların işini ne kadar iyi yaptı

En kolay testlerde birçok model—hem ticari hem açık kaynaklı—her görüntüyü doğru sınıflandırdı. Orta zorluktaki RB-PILOT setinde önde gelen ticari sistemler neredeyse mükemmel puanlar korurken, en iyi açık kaynak modeller oldukça yakın sonuçlar elde etti. Asıl zorluk RB-SMALL’dı; burada birçok grafik uzmanların bile tartıştığı karışık davranışlar gösterir. Bu sette en iyi ticari model hassasiyet ve geri çağırma birleşik skorunda yaklaşık yüzde 94’e ulaşırken, en iyi açık kaynak model yaklaşık yüzde 76 civarındaydı. Daha büyük RB-FULL seti bu deseni doğruladı: görev basitçe rezonansa dair evet-hayır kararına indirildiğinde ticari modeller ve en iyi açık kaynak sistemleri yüksek doğruluk gösterdi; hataların çoğu geçici ve yapışkan (sticking) rejimlerde yoğunlaştı. Dikkate değer olarak, yerelde çalıştırılabilen bazı küçük modeller de, özellikle basit iki sınıflı etiketleme görevlerinde, pratik olarak kullanışlı performans sunmayı başardı.

Figure 2
Figure 2.

Gelecek gökyüzü taramaları için bunun anlamı

Uzman olmayanlar için çıkarım şudur: genel amaçlı yapay zeka sistemleri artık bir zamanlar uzman insan yargısı gerektiren aynı gürültülü yörünge grafiklerine bakıp çoğu durumda geleneksel araçlarla boy ölçüşen veya onlara yaklaşan sonuçlara ulaşabiliyor—doğrudan o görevde eğitilmemiş olsalar bile. Tam değiller; özellikle bir asteroit rezonansa sadece yaklaşır da tam olarak kilitlenmezse zorluk yaşarlar, ancak büyük taramalar için gereken sıkıcı görsel denetimin büyük kısmını şimdiden üstlenebilirler. Bu çalışmada yayımlanan kıyaslama, astronomlara yeni modelleri test etmek ve maliyet, açıklık ve doğruluk arasında doğru dengeyi seçmek için standart, yeniden kullanılabilir bir yol sunuyor. Çok modlu yapay zekâ gelişmeye devam ettikçe, Güneş Sistemi’nin karmaşık kütleçekimsel koreografisini haritalamada rutin bir ortak haline gelmesi muhtemeldir.

Atıf: Smirnov, E., Carruba, V. Evaluating multimodal commercial and open-source large language models for dynamical astronomy: a benchmark study of resonant behavior classification. Sci Rep 16, 10785 (2026). https://doi.org/10.1038/s41598-026-45926-y

Anahtar kelimeler: yörünge rezonansları, çok modlu yapay zeka, asteroit dinamiği, zaman serisi sınıflandırması, açık kaynaklı dil modelleri