Alibaba, Qwen3.6-35B-A3B modelini açık kaynak olarak yayınladı. Bu sparse MoE modeli toplam 35B parametreye ve 3B aktif parametreye sahip.
Model Özellikleri
Sparse MoE Mimarisi – Toplam 35B parametre, 3B aktif. Verimli hesaplama ile büyük model performansı sunuyor.
Gated DeltaNet Hibrit Dikkat – 3:1 oranında linear-to-full dikkat. Hem verimlilik hem kalite bir arada.
Native Multimedya – Metin, görüntü ve video aynı mimaride işleniyor. Ayrı modeller gerekmiyor.
262K Context – 262K token native context, YaRN ile 1M’a kadar uzatılabilir.
Apache 2.0 Lisans – Tamamen açık kaynak, ticari kullanım serbest.
201 Dil Desteği – Çok dilli destek kapsamlı.
Tüketici GPU’da Çalışır – Quantization ile normal GPU’larda çalışabilir.
Performans
TAU2-Bench: 81.2 – En iyi ajan puanı
AndroidWorld: 71.1 – Güçlü mobil agent performansı
MMMU (Vision): 81.4 – Görüntü anlama
MathVision: 83.9 – Matematiksel görme
SWE-bench Verified: 73.4 – Kodlama
GPQA Diamond: 84.2 – Bilimsel sorular
MMLU-Pro: 85.3 – Genel bilgi
Ne Ise Yarar?
Bu model, 3B aktif parametre ile büyük modellerin seviyesinde performans sunuyor. Apache 2.0 lisansı ile ticari projelerde serbestçe kullanılabilir. Geliştiriciler için yerel olarak çalıştırmak artık çok daha uygun.
Sonuc
Qwen3.6, açık kaynak yapay zeka modellerinde önemli bir rakip. Özellikle ajan görevlerinde ve çok dilli destekte güçlü.
Siz bu modeli hangi projelerde kullanmayı düşünürsünüz?
#Qwen #Alibaba #OpenSource #AI #YapayZeka #MoE #LLM #MachineLearning #Apache2 #TechNews #AIGen #Innovation #AIRevolution #OpenWeights #Developer #Coding
Henüz yorum yok. İlk yorumu siz yapın!