Dikkatten Önce Katılın: Otoregresif Gözetleme ile Verimli ve Ölçeklenebilir Video Anlama Baifeng Shi, Stephanie Fu, Long Lian et al. Çok modlu büyük dil modelleri (MLLM'ler) gelişmiş genel amaçlı video anlayışına sahiptir, ancak uzun...