Clear Sky Science · tr
Akıllı ameliyathaneler için uzmanlaşmış temel modeller
Ameliyathanede Daha Akıllı Destek
Modern cerrahi, insanlar, robotlar, kameralar ve monitörlerin hatasız birlikte çalışması gereken kalabalık, yüksek teknolojili bir ortamda gerçekleşir. Bu makale, ameliyathaneye özgü olarak tasarlanmış yeni bir yapay zekâ türü olan ORQA’yı sunuyor. Çoğu popüler sohbet botunun büyük ölçüde kelimeler ve basit resimlerle sınırlı kalmasının aksine, ORQA cerrahi sırasında olan biteni izlemek, dinlemek ve yorumlamak üzere inşa edildi; böylece ekipleri destekleyebilir, tehlikeleri saptayabilir ve nihayetinde operasyonları daha güvenli hâle getirebilir.

Bugünün Yapay Zekâsının Cerrahide Neden Zorlandığı
Dünyayı etkileyen birçok yapay zekâ aracı internet görüntüleri, videoları ve metinleri üzerinde eğitildi. Tıbbi terimleri açıklayabilir veya yaygın bir operasyonu tarif edebilirler, ancak ameliyathanenin görsel dünyası çok farklıdır. Birden çok kamera örtüşen açılar sunar, robot kollar insanlar yakınında hareket eder, aletler küçük ve parlaktır ve birçok olay aynı anda gelişir. Genel amaçlı yapay zekâ modelleri sıklıkla kritik ayrıntıları kaçırır: bir cerrahın orada olduğunu görebilirler ama belirli bir aleti bulamayabilir, bir robotun bir sonraki adımını tahmin edemeyebilir veya steril alanların ihlal edildiğini fark etmeyebilirler. Yazarlar önde gelen görsel‑dil sistemlerini, ticari modelleri ve güçlü bir açık kaynak modeli dahil olmak üzere test ettiklerinde, cerrahi görevlerdeki performanslarının en yaygın cevapla tahmin etmeden yalnızca biraz daha iyi olduğunu gördüler.
Cerrahi İş Akışlarını Soru‑Cevaplara Dönüştürmek
Makinanın cerrahiyi anlama yeteneğini sistematik olarak ölçmek ve geliştirmek için araştırmacılar ORQA kıyaslamasını oluşturdu. Dış kamera görünümleri, cerrah tarafından taşınan video, 3B sahne yeniden yapılandırmaları, ses, robot günlükleri ve daha fazlasını içeren gerçek ve simüle edilmiş ameliyathanelere ait dört zengin veri kümesini birleştirdiler. Bu kaynaklardan, odada neler olduğunu anlatan 100 milyondan fazla soru‑cevap çifti ürettiler. Bu sorular, kaç kişi bulunduğu, hangi aletlerin kullanıldığı, hangi eylemin gerçekleştiği, bir aletin 3B uzaydaki konumu, sterilite ihlali olup olmadığı ve robotun bir sonraki adımının ne olacağı gibi 23 görev türünü kapsıyor. Bu devasa havuzu eğitim için bir milyon çeşitli örneğe ve test için ayrı setlere indirerek, cerrahiyi anladığını iddia eden herhangi bir yapay zekâ modeli için ortak bir ölçüt yarattılar.
Ameliyathaneye Özel Bir Temel Model
Bu kıyaslamayı kullanarak ekip, birçok cerrahi veri akışını birleştiren uzmanlaşmış bir temel model olan ORQA’yı eğitti. Ayrı kodlayıcılar video karelerini, 3B nokta bulutlarını, sesi, konuşma transkriptlerini, robot telemetrisini ve takip verilerini işleyerek bunları ortak bir sayısal temsile dönüştürüyor. Ardından büyük bir dil modeli bu birleşik sinyal üzerinde akıl yürüterek sahneye dair soruları yanıtlıyor. ORQA kıyaslamasında bu alana uyarlanmış sistem, genel modellerin performansını iki kattan fazla artırdı ve eylemleri tanıma, aletleri konumlandırma, mesafeler ve roller hakkında akıl yürütme ile güvenlikle ilgili koşulları kontrol etme gibi çok çeşitli görevlerde üstünlük gösterdi. Model, operasyonun zaman içinde nasıl geliştiğini izleyen bellek yapılarıyla da genişletilebiliyor; bu da daha zengin zamansal modellemeden gelecekte elde edilebilecek kazançlara işaret ediyor.

Cerrahi Yapay Zekâyı Hızlı ve Pratik Hale Getirmek
Güçlü modeller genellikle hastanelerde gerçek zamanlı kullanım için çok büyük olur; bilgisayarlar küçük olabilir ve gizlilik nedenleriyle uzak sunuculara bağlantılar sınırlı olabilir. Bunu ele almak için yazarlar distilasyon adı verilen bir süreç kullandılar; bu süreçte büyük bir “öğretmen” model daha küçük “öğrenci” sürümlerini eğitiyor. Orijinal doğruluğun çoğunu korurken birkaç kat daha hızlı çalışan üç kompakt ORQA varyantı ürettiler. Bu daha hafif modeller tek bir grafik kartı veya uç cihaz üzerinde yerel olarak çalışabilir, ameliyathanede aynı anda birden çok istasyonun izlenmesine izin verir ve hassas hasta verilerinin buluta akmasını gerektirmez. İnsanlar, aletler ve bunların etkileşimleri gibi yapılandırılmış, izlenebilir çıktılar da klinisyenlerin sistem davranışını incelemesini, denetlemesini ve güvenmesini kolaylaştırır.
Geleceğin Cerrahisi İçin Anlamı
Basitçe söylemek gerekirse çalışma, cerrahinin kendi türde bir yapay zekâya ihtiyaç duyduğunu; genel web içeriği yerine gerçek operasyonların görüntü ve sesleri üzerinde doğrudan eğitilmiş bir modele ihtiyaç olduğunu gösteriyor. ORQA, modele doğru çokmodlu cerrahi veriler gösterildiğinde kimin ne yaptığını, aletlerin nerede olduğunu, prosedürün nasıl ilerlediğini ve güvensiz bir durumun olup olmayacağını güvenilir biçimde izleyebileceğini kanıtlıyor. Bu tür sistemlerin cerrahiyi doğrudan yönlendirebilecek hâle gelmesine daha çok iş olsa da, ORQA ve onun kıyaslaması daha akıllı asistanlar, daha iyi belgelendirme ve nihayetinde daha otonom ve koordineli ameliyathaneler için bir temel sağlıyor.
Atıf: Özsoy, E., Pellegrini, C., Bani-Harouni, D. et al. Specialized foundation models for intelligent operating rooms. npj Digit. Med. 9, 362 (2026). https://doi.org/10.1038/s41746-026-02631-4
Anahtar kelimeler: cerrahi yapay zekâ, ameliyathane, çokmodlu modeller, medikal robotik, hasta güvenliği