
Google DeepMind, TIPS v2 modelini açıkladı. Metin ve görüntüleri aynı anda çok daha güçlü kavrayan temel bir kodlayıcı model.
TIPS v2 Nedir?
Açık Kaynak – Apache 2.0 lisansı ile herkes kullanabilir ve geliştirebilir.
Çok Modlu – Metin ve görüntüleri birlikte işleyebiliyor.
Özellikleri
- Uzamsal Özelliklerin Hizalanması – Görüntüdeki nesnelerin konumunu, ilişkilerini ve detaylarını metinle çok daha iyi eşleştiriyor.
- Yeni Ön Eğitim Yöntemleri – Model daha etkili hale getirilmiş.
Performans
Sıfırdan öğrenme testlerinde önceki modellere göre belirgin fark yaratıyor.
Erişim
- Hugging Face üzerinden ağırlıkları indirebilirsiniz
- Proje sayfasından detayları okuyabilirsiniz
- Demo alanında deneyebilirsiniz
Sonuç
TIPS v2, çok modlu AI modellerinde önemli bir adım. Açık kaynak olması da büyük bir avantaj.
Henüz yorum yok. İlk yorumu siz yapın!