Clear Sky Science · tr
Ortodontik tedavi sorularını yanıtlamada gömülü sohbet botu modellerinin ve ChatGPT-4’ün karşılaştırmalı analizi
Braketler için daha akıllı sohbet botlarının önemi
Braket takmış herkes bilir ki sorular klinik saatlerini beklemez: Bu ağrı geçecek mi? Bunu yiyebilir miyim? Çenem için endişelenmeli miyim? Bu çalışma, günlük bu tür soruları yanıtlamak üzere özel olarak tasarlanmış bir ortodontik sohbet botunun—genel bir yapay zekâ sistemi olan ChatGPT‑4’e kıyasla—daha net ve daha güvenilir cevaplar verip veremeyeceğini inceliyor. Çalışma, özenle uyarlanmış yapay zekâ araçlarının modern diş bakımında hem hastalara hem de klinisyenlere nasıl destek olabileceğine dair bir öngörü sunuyor.
Sadece braket soruları için tasarlanmış bir sohbet botu
Araştırmacılar yalnızca ortodontik tedaviye odaklanan bir gömülü sohbet botu geliştirdiler. Sıfırdan yeni bir yapay zekâ eğitmek yerine gelişmiş bir dil modelini, hasta materyalleri ve temel ders kitabı alıntılarından oluşan küratörlü bir kütüphaneye bağladılar. Bu kütüphane, ağız hijyeni, beslenme, aparey bakımı, elastikler ve pekiştiriciler gibi konularda British Orthodontic Society’nin broşürlerini ve standart ortodonti ders kitaplarından kısa açıklamaları içeriyordu. Retrieval‑augmented generation (geri getirme destekli üretim) adı verilen bir teknik kullanılarak, sistem bir soru sorulduğunda ilgili pasajları bu kütüphanede aradı ve yanıtını şekillendirirken bunları kullandı; amaç, hastanın tipik bir muayene sırasında duyacağı yanıtı yansıtmaktı.

Çalışma iki sistemi nasıl test etti
Bu uzmanlaşmış sohbet botunun ne kadar iyi performans gösterdiğini görmek için ekip, onu ChatGPT‑4 ile karşılaştırdı; ChatGPT‑4 standart bir şekilde, ChatGPT Plus arayüzü üzerinden kullanıldı. Hastaların braket tedavisi öncesinde, sırasında ve sonrasında sıkça sordukları 30 gerçek dünya soru derlediler—örneğin, braketler ağrıya neden olur mu, konuşma veya şarkı söylemeyi etkiler mi, kontroller ne sıklıkla gerekir ve braketler çene eklem sorunlarına yardım eder mi gibi. Her iki sisteme de aynı istemler verildi; onlardan ortodonti uzmanı gibi, açık ve hasta dostu bir dille yanıt vermeleri istendi. Altı deneyimli ortodonti danışmanı daha sonra her anonim yanıtı dört açıdan değerlendirdi: doğruluk, açıklık, soruya uygunluk ve bilgilerin güncelliği; değerlendirme beşli bir ölçekle yapıldı.
Sadece görüşler değil, kaliteyi ölçmek
Araştırmacılar genel izlenimlere dayanmak yerine İçerik Geçerlilik İndeksi (Content Validity Index) adı verilen yapılandırılmış bir puanlama yöntemi kullandılar. Her soru ve her kalite unsuru için kaç uzmanın yanıtı “katılıyorum” veya “kesinlikle katılıyorum” olarak işaretlediğini saydılar ve bunu sıfır ile bir arasında bir skora dönüştürdüler. Yüksek skorlar, uzmanların çoğunun yanıtı doğru, açık, ilgili veya güncel bulduğunu gösteriyordu. Ayrıca her iki sistemin genel performansını görmek için tüm sorular üzerinden ortalamalar hesapladılar. Farkların tesadüfe dayalı olup olmadığını görmek amacıyla istatistiksel testler uyguladılar.

Ortodontistlerin yanıtlar hakkındaki görüşleri
Gömülü sohbet botu genel olarak önde çıktı. Yanıtlarının yaklaşık dörtte üçü kabul edilebilir kalite eşiğine ulaştı; oysa ChatGPT‑4’ün yanıtlarında bu oran biraz üzerindeydi. Ortalama olarak, uzmanlaşmış sohbet botu doğruluk, açıklık ve alaka düzeyinde daha iyi puan aldı ve ayrıca mevcut kılavuzlara biraz daha uygun görünüyordu. Örneğin, braket tedavisi sırasında ağrı açıklanırken veya braketlerin konuşmayı etkileyip etkilemediği konusunda verdiği yanıtlar doğrudan, somut ve standart hasta tavsiyeleriyle yakındı. Buna karşılık, ChatGPT‑4’ün yanıtları çoğu zaman makuldü fakat daha genel ve bazen daha teknik olma eğilimindeydi; bu da uzmanların gözünde açıklığı azaltmış olabilir. Bununla birlikte, araştırmacılar resmi istatistiksel testleri yaptıklarında iki sistem arasındaki farkların istatistiksel olarak anlamlı sayılacak kadar büyük olmadığını buldular.
Kısıtlar ve klinikteki gelecekteki yapay zekâ için çıkarımlar
Çalışma ayrıca uzmanların bile her zaman “en iyi” yanıt konusunda hemfikir olmadıklarını ortaya koydu. Ortodontistler arasındaki genel uyum beklenenden daha zayıftı; özellikle açıklık ve alaka gibi öznel alanlarda görüş birliği düşüktü. Araştırmacılar birkaç başka sınırlamaya da dikkat çekti: yalnızca iki yapay zekâ düzenlemesi incelendi, hastalar doğrudan dahil edilmedi ve uzmanlaşmış sohbet botu belirli yazılı materyal setine dayandırıldı. Yine de bu çalışma, yapay zekâ sistemlerinin birçok yaygın diş sorusunu makul bir doğrulukla yanıtlayabildiğine ve odaklanmış, güncel referans materyali eklemenin performansı artırabileceğine dair büyüyen kanıtlara katkıda bulunuyor.
Bu, braket takan kişiler için ne anlama geliyor
Hastalar için çıkarım, cesaret verici ama temkinli: İyi tasarlanmış, ortodontiye odaklı bir sohbet botu birçok günlük soruya net ve güvenilir yanıtlar sağlayabilir ve randevular arasındaki kaygıyı azaltabilir. Aynı zamanda, bu çalışma böyle bir aracın hâlâ profesyonel yargının veya yüz yüze tavsiyenin yerini almadığını gösteriyor. Gerçek vaadi, bu kişiselleştirilmiş yapay zekâ yardımcılarını uzman bakım ile birleştirmekte yatıyor; böylece braket takan kişiler zamanında, kolay anlaşılır bilgi alırken nihai kararlar için ortodontistlerine güvenmeye devam edebilirler.
Atıf: Khalil, R., Amin, L., Sukhia, R.H. et al. A comparative analysis of embedded chatbot models and ChatGPT-4 for answering orthodontic treatment queries. Sci Rep 16, 7776 (2026). https://doi.org/10.1038/s41598-026-39263-3
Anahtar kelimeler: ortodontik sohbet botu, diş hekimliği yapay zekâsı, braket soruları, hasta eğitimi, ChatGPT karşılaştırması