ABD’de Harvard Tıp Fakültesi ve Beth Israel Deaconess Tıp Merkezi araştırmacılarının yürüttüğü çalışmada, büyük dil modellerinin (LLM) acil servis senaryolarında klinik karar verme süreçlerinde doktorlardan daha başarılı sonuçlar verdiği belirlendi. Modellerin özellikle tanı koyma ve tedavi planı oluşturma aşamalarında öne çıktığı aktarıldı.
ACİL SERVİS SENAYOLARINDA TEST EDİLDİ
Araştırmada, OpenAI’nin o1-preview modeli başta olmak üzere farklı yapay zekâ sistemleri gerçek acil servis vakalarıyla test edildi. Modellerden hastaları değerlendirmesi, olası tanıları sıralaması ve sonraki adımları önermesi istendi. Yapay zekânın özellikle bilgi kısıtlılığı olan triyaj aşamasında insan hekimlere göre daha yüksek performans gösterdiği görüldü.
PERFORMANS ARTTIKÇA FARK AÇILDI
Çalışmada, yapay zekâ modellerinin ellerindeki veri arttıkça tanı doğruluğunun da yükseldiği belirtildi. Araştırmacılar, bazı modellerin çoktan seçmeli testlerde neredeyse tam puana ulaştığını ve bu nedenle performans ölçümünün giderek zorlaştığını ifade etti.
UZMANLARDAN TEMKİNLİ YAKLAŞIM UYARISI
Araştırmacılar, yapay zekânın sağlık sistemine entegrasyonunun dikkatli yapılması gerektiğini vurguladı. Teknolojinin yanlış kullanımı halinde gereksiz tetkikler veya riskli kararlar doğurabileceği, bu nedenle insan kontrolünün her zaman gerekli olduğu belirtildi.
KLİNİK KULLANIM İÇİN DAHA FAZLA ÇALIŞMA ÇAĞRISI
Uzmanlar, yapay zekâ modellerinin gerçek klinik ortamlarda nasıl kullanılacağına dair daha fazla ileriye dönük çalışmaya ihtiyaç olduğunu söyledi. Ayrıca sağlık sistemlerinin bu teknolojiyi güvenli şekilde entegre edebilmesi için altyapı yatırımlarının önemine dikkat çekildi.