Google, Genie 3 Modelini Piyasaya Sürdü

Google, Genie 3 Modelini Piyasaya Sürdü
Yazı Özetini Göster

 Google DeepMind, metin komutlarıyla oluşturulan dünyayı değiştirebilen Genie 3 dünya modelini piyasaya sürdü.

Google DeepMind, benzeri görülmemiş çeşitlilikte etkileşimli ortamlar oluşturabilen üçüncü nesil genel amaçlı dünya modeli Genie 3’ün piyasaya sürüldüğünü duyurdu. Metin komutlarıyla Genie 3, dinamik dünyalar oluşturabilir, saniyede 24 kare hızında gerçek zamanlı olarak gezinebilir ve 720p çözünürlükte birkaç dakika boyunca tutarlılığı koruyabilir.

Genie 3, gerçek zamanlı etkileşime izin veren ilk dünya modelidir ve Genie 2’ye kıyasla tutarlılığı ve gerçekçiliği de artırılmıştır.

  • Dünyanın fiziğini simüle edin: Genie 3, fizik yasalarına dair derin bir anlayışa sahiptir ve bu sayede su akışını, ışık ve gölge değişimlerini ve bir helikopterin uçurum ve şelale etrafında dikkatlice manevra yapması gibi karmaşık çevresel etkileşimleri gerçekçi bir şekilde simüle edebilir;
  • Doğal dünyayı simüle edin: Buzul gölünün kenarındaki canlı bir ekosistemden, fantastik bir dünyada gökkuşağı köprüsünden atlayan sevimli tüylü yaratıklara kadar, Genie 3 hayal gücünü keşfedilebilir bir gerçekliğe dönüştürüyor.
  • Animasyon ve kurgu modelleme: Hayal gücünüzü kullanarak fantastik sahneler ve etkileyici animasyon karakterleri yaratabilirsiniz;
  • Farklı bölgeleri ve tarihi sahneleri keşfedin: Modeller coğrafi ve zaman kısıtlamalarını aşabilir ve kullanıcıları ister wingsuit ile karlı dağların üzerinden uçarak, ister uzun bir geçmişe sahip antik bir şehirde bulunarak farklı yerleri ve tarihi dönemleri keşfetmeye yönlendirebilir;
  • Gerçek zamanlı performansın sınırlarını zorlamak: Yüksek düzeyde kontrol edilebilirlik ve gerçek zamanlı etkileşim elde etmek için, modelin her karenin otoregresif üretimi sırasında zamanla büyüyen, daha önce oluşturulmuş yörüngeleri dikkate alması gerekir. Örneğin, bir kullanıcı bir konumu bir dakika sonra tekrar ziyaret ederse, modelin bir dakika önceki ilgili bilgilere başvurması gerekir. Gerçek zamanlı etkileşim elde etmek için, bu hesaplamanın yeni kullanıcı girdisine yanıt olarak saniyede birden çok kez gerçekleştirilmesi gerekir.
  • Uzun vadeli çevresel tutarlılık: yapay zeka tarafından oluşturulan dünyaların sürükleyici olması için, uzun süreler boyunca fiziksel olarak tutarlı kalmaları gerekir. Ancak, ortamları otomatik olarak gerileyen bir şekilde oluşturmak, genellikle tüm videoları oluşturmaktan daha zorlu bir teknik sorundur çünkü hatalar zamanla birikme eğilimindedir. Genie 3 ortamları birkaç dakika boyunca büyük ölçüde tutarlı kalırken, görsel bellek bir dakikaya kadar geriye gidebilir. Genie 3 tarafından oluşturulan dünyalar, kullanıcının dünya tanımlarına ve eylemlerine göre kare kare oluşturuldukları için daha dinamik ve zengindir.
  • İstemli Dünya Olayları: Genie 3, navigasyon girdisine ek olarak, istemli dünya olayları adı verilen daha etkileyici bir metin tabanlı etkileşim biçimini de destekler. İstemli dünya olayları, hava koşullarını değiştirerek veya yeni nesneler ve karakterler ekleyerek oluşturulan dünyayı değiştirebilir ve böylece navigasyon deneyimini geliştirebilir. Bu özellik aynı zamanda, ajanların deneyimlerden ders çıkarmak ve beklenmedik durumlarla başa çıkmak için kullanabilecekleri karşıt olgusal veya “ya şöyle olsaydı” senaryolarının kapsamını da artırır.

İlgili bağlantı: deepmind.google/discover/bl…

Bir Yorum Yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Benzer Yazılar