Alibaba Qwen3.6-35B-A3B: Artık Açık Kaynak!

Alibaba, Qwen3.6-35B-A3B modelini açık kaynak olarak yayınladı. Bu sparse MoE modeli toplam 35B parametreye ve 3B aktif parametreye sahip. Model Özellikleri Sparse MoE Mimarisi – Toplam 35B parametre, 3B aktif. Verimli hesaplama ile büyük model performansı…

Alibaba, Qwen3.6-35B-A3B modelini açık kaynak olarak yayınladı. Bu sparse MoE modeli toplam 35B parametreye ve 3B aktif parametreye sahip.

Model Özellikleri

Sparse MoE Mimarisi – Toplam 35B parametre, 3B aktif. Verimli hesaplama ile büyük model performansı sunuyor.

Gated DeltaNet Hibrit Dikkat – 3:1 oranında linear-to-full dikkat. Hem verimlilik hem kalite bir arada.

Native Multimedya – Metin, görüntü ve video aynı mimaride işleniyor. Ayrı modeller gerekmiyor.

262K Context – 262K token native context, YaRN ile 1M’a kadar uzatılabilir.

Apache 2.0 Lisans – Tamamen açık kaynak, ticari kullanım serbest.

201 Dil Desteği – Çok dilli destek kapsamlı.

Tüketici GPU’da Çalışır – Quantization ile normal GPU’larda çalışabilir.

Performans

TAU2-Bench: 81.2 – En iyi ajan puanı

AndroidWorld: 71.1 – Güçlü mobil agent performansı

MMMU (Vision): 81.4 – Görüntü anlama

MathVision: 83.9 – Matematiksel görme

SWE-bench Verified: 73.4 – Kodlama

GPQA Diamond: 84.2 – Bilimsel sorular

MMLU-Pro: 85.3 – Genel bilgi

Ne Ise Yarar?

Bu model, 3B aktif parametre ile büyük modellerin seviyesinde performans sunuyor. Apache 2.0 lisansı ile ticari projelerde serbestçe kullanılabilir. Geliştiriciler için yerel olarak çalıştırmak artık çok daha uygun.

Sonuc

Qwen3.6, açık kaynak yapay zeka modellerinde önemli bir rakip. Özellikle ajan görevlerinde ve çok dilli destekte güçlü.

Siz bu modeli hangi projelerde kullanmayı düşünürsünüz?

#Qwen #Alibaba #OpenSource #AI #YapayZeka #MoE #LLM #MachineLearning #Apache2 #TechNews #AIGen #Innovation #AIRevolution #OpenWeights #Developer #Coding

Tartışma

Bu habere emoji ile tepki ver

İptal

Hizli:

Henüz yorum yok. İlk yorumu siz yapın!

Yapıcı ve saygılı yorumlar bekliyoruz. Topluluk kuralları