Nature | İnsan Hastalıklarının Doğal Tarihinin Üretken Dönüştürücü Odaklı Öğrenimi

  • 22 Eyl 2025 19:14
  • Güncelleme: 22 Eyl 2025
    5 dk. Okuma Süresi
Yazı Özetini Göster
Tıbbi karar verme, hastanın geçmiş ve mevcut sağlık durumunu anlamaya dayanarak gelecekteki hastalık seyrini tahmin etmek ve değiştirmek için kullanılır. Araştırmacılar, bir kişinin geçmiş tıbbi geçmişi göz önüne alınarak 1.000’den fazla hastalığın görülme sıklığını tahmin edebilen ve gelecekteki sağlık seyrinin sentetik örneklerini oluşturabilen, değiştirilmiş Generative Pre-trained Transformer (GPT) tabanlı bir model olan Delphi-2M’yi geliştirdiler. İngiltere Biobank kohortu (400.000 kişi) üzerinde eğitilen model, parametre ayarlaması yapılmadan Danimarka Ulusal Kohortu (1,9 milyon kişi) üzerinde harici doğrulama elde etti ve tek hastalık modellerine benzer tahmin doğruluğu gösterdi. Delphi-2M ayrıca komorbidite kümelerini ve zamansal bağımlılıkları ortaya çıkararak, kişiselleştirilmiş sağlık riski değerlendirmesi ve hassas tıp için potansiyel uygulamalar sunar.

İnsan hastalıklarının ilerlemesi, yaşam tarzı, genetik yatkınlık ve sosyoekonomik faktörlerin etkisiyle akut dönemler, kronik bozukluklar ve birden fazla hastalığın bir arada görülmesini içerir. Geleneksel risk tahmin modelleri genellikle tek bir hastalığı hedef alır ve ICD-10’un birincil düzeyinde sınıflandırılan 1.000’den fazla hastalığı kapsayamaz. Küresel nüfusun yaşlanması ve kronik hastalıkların yükünün artmasıyla birlikte, birden fazla hastalığın seyrini aynı anda modelleyebilen araçlara acil ihtiyaç duyulmaktadır.

Transformer mimarisi, doğal dil işlemede, hastalık ilerlemesine paralel olarak, olağanüstü sekans modelleme yetenekleri sergilemiştir: her ikisi de gelecekteki sonuçları tahmin etmek için geçmiş olaylardan yararlanmayı gerektirir. BERT veya Transformer tabanlı modeller kullanarak elektronik sağlık kayıtlarını tahmin etmeye yönelik girişimler mevcut olsa da, kapsamlı çoklu hastalık üretken modelleme henüz sistematik bir değerlendirmeden geçmemiştir. Delphi-2M bu boşluğu doldurmaktadır.

Çoklu hastalık tahmin performansı

Delphi-2M, iç geçerlilik testinde tanı tahminlerinin %97’sinde 0,5’i aşan AUC değerleri göstermiş ve ortalama AUC değeri yaklaşık 0,76 olmuştur. Ölüm oranına ilişkin tahminler en doğru sonuçları vermiştir (AUC=0,97). Model performansı, uzun vadeli tahminlerde (10 yıl) yaklaşık 0,70 AUC değeri ile sabit kalmıştır. Bazı hastalıklar için, modelin tahmin yeteneği yaygın olarak kullanılan klinik risk skorlarının tahmin yeteneğine eşit veya ondan daha üstün olmuştur.

Gelecekteki Sağlık Gidişatı Oluşturma

Delphi-2M, bir kişinin tıbbi geçmişine dayanarak gelecekteki hastalık seyirlerini oluşturabilir ve 20 yıllık bir zaman diliminde bile hastalık eğilimlerinin makul bir dağılımını korur. Simülasyon sonuçları, sigara içenler, alkol tüketenler ve farklı Vücut Kitle İndeksi (VKİ) değerlerine sahip kişiler gibi nüfus alt grupları arasında hastalık riskindeki farklılıkları tutarlı bir şekilde yeniden üretir.

Ayrıca, tamamen sentetik verilerle eğitilmiş modeller, gerçek doğrulama setinde orijinal modelden sadece yüzde 3 daha düşük performans gösterdi. Bu da, sentetik verilerin istatistiksel özellikleri korurken gizliliği korumak için kullanılabileceğini gösteriyor.

 Açıklanabilirlik analizi

Araştırmacılar, SHAP yöntemini kullanarak çeşitli önceden var olan durumların gelecekteki risk üzerindeki etkisini nicel olarak belirlediler. Örneğin, gastrointestinal hastalıklar pankreas kanseri riskini önemli ölçüde artırırken, pankreas kanseri kendisi de ölüm riskini önemli ölçüde yükseltmektedir. UMAP boyut azaltma yöntemi, hastalık kodlarının gömme uzayında ICD-10 bölümüne göre kümelendiğini ortaya koyarken, aynı zamanda diyabet ile retinopati ve nöropati arasındaki ilişki gibi bölümler arası komorbidite modellerini de ortaya çıkardı.

 

Dış Doğrulama ve Önyargı

Danimarka kohortunda, Delphi-2M modeli ortalama 0,67 AUC değerine ulaştı; bu değer, Birleşik Krallık verilerinden sadece biraz daha düşük olup, modelin ülkeler arası uygulanabilirliğini göstermektedir. Ancak model, Birleşik Krallık biyobank popülasyonuna özgü önyargıları da öğrenmiştir:

  • Katılımcıların seçilmesinde önyargı: Katılımcılar çoğunlukla 40-70 yaşları arasında sağlıklı gönüllülerden oluşuyordu, bu da ölüm oranlarının düşük tahmin edilmesine yol açtı.
  • Veri kaynağı önyargısı: Hastane verileri ağırlıklı olarak ağır hastalıkları kapsar ve eksik veriler tahmin önyargısına yol açar.

  Bu bulgular, heterojen popülasyonlara uygulanan modelleri yorumlarken dikkatli olunması gerektiğini göstermektedir.

Tartışma

Delphi-2M, hastalıkların doğal seyrini modellemede Transformers’ın potansiyelini göstermektedir:

  • Avantajlar: Çoklu hastalık ortak tahmini, uzun vadeli hastalık seyri oluşturma, gizlilik koruyucu sentetik veri oluşturma.
  • İçgörü: Komorbidite modellerini ve zamana bağlı ilişkileri ortaya çıkarmak, çoklu hastalık ilişki çalışmaları ve sağlık riski sınıflandırması için yeni araçlar sağlar.
  • Sınırlamalar: Sağlıklı gönüllülerde önyargılar, eksik veriler ve yetersiz nüfus temsil gücü mevcuttur; öngörü sonuçları nedensel ilişkiler olarak dikkatli bir şekilde yorumlanmalıdır.

Araştırmacılar, gelecekte çok modlu girdilere (genomik, metabolomik, görüntüleme, giyilebilir cihaz verileri vb.) genişletmeyi ve klinik karar desteği ve halk sağlığı planlaması için Delphi’nin genel amaçlı büyük dil modelleriyle entegrasyonunu araştırmayı önermektedir.

Referanslar

Shmatko, A., Jung, A.W., Gaurav, K. et al. Learning the natural history of human disease with generative transformers. Nature (2025). 
Shmatko, A., Jung, A.W., Gaurav, K. ve diğerleri. Üretken dönüştürücülerle insan hastalıklarının doğal tarihini öğrenmek. Nature (2025).

https://doi.org/10.1038/s41586-025-09529-3

Bir Yorum Yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Benzer Yazılar