Kunlun Wanwei, Sesle Çalışan Dijital İnsan Modeli SkyReels-A3’ü Tanıttı

Kunlun Wanwei Grubu, yeni nesil dijital insan üretim teknolojisi SkyReels-A3’ü resmi olarak duyurdu. DiT (Diffusion Transformer) video difüzyon modeline dayanan bu araç, sesle tamamen senkronize, yüksek kaliteli dijital insan videoları oluşturma imkânı sunuyor.
Fotoğraftan Konuşan veya Şarkı Söyleyen Dijital İnsanlar
SkyReels-A3 ile kullanıcılar yalnızca bir portre fotoğrafı ve ses dosyası yükleyerek, fotoğraftaki kişinin doğal dudak hareketleriyle konuşmasını veya şarkı söylemesini sağlayabiliyor.
Sıfırdan Video Üretimi
Model, sadece mevcut görselleri canlandırmakla kalmıyor; aynı zamanda yeni video içerikleri de oluşturabiliyor. Kullanıcılar, portre fotoğrafı, ses ve metin talimatları ile belirli bir sahneyi veya performansı sergileyen videolar üretebiliyor.
“Replik Değiştirme” Özelliği
SkyReels-A3, mevcut videoların diyaloglarını değiştirebiliyor. Yeni dudak senkronu, mimikler ve jestlerle video bütünlüğü korunurken, görsel kalite de optimize ediliyor.
Yüksek Performans ve Uzun Video Desteği
Tek sahnede: 60 saniyeye kadar video üretimi
Çok sahnede: Sınırsız süre desteği
Doğal hareket etkileşimi, optimize edilmiş kamera kontrolü ve gelişmiş video kalitesi
Canlı Yayın ve Ticari Kullanım için Optimizasyon
SkyReels-A3, özellikle reklamcılık, e-ticaret canlı yayınları, müzik klipleri, film sahneleri ve konuşma videoları gibi alanlarda güçlü bir teknik altyapı sağlıyor. Canlı yayın senaryolarına özel optimizasyonlar sayesinde tutarlılık, netlik ve etkileşim hareketlerinin doğallığı artırıldı.
Gelişmiş Kamera Kontrolü
ControlNet tabanlı kamera modülü sayesinde kare seviyesinde hassas kamera hareketi kontrolü mümkün.
8 farklı kamera hareketi parametresi önceden tanımlı
Hareket şiddeti %0–100 arasında ayarlanabiliyor
Profesyonel sinema etkisine yakın çekimler üretilebiliyor
SkyReels-A3, hem ticari hem de sanatsal projeler için yapay zekâ destekli video üretiminde önemli bir adım olarak öne çıkıyor.