CANLI
Claude Zayıflatıldı mı? AMD Yöneticisi Verileri Açıkladı·Gemini for Business, NotebookLM entegrasyonunu hazırlıyor·Gurman: Apple, mühendislerinin OpenAI’a taşınmasını bonus vererek durdurmaya çalıştı
28 Jun 2026 · 00:17 GMT+3
Ai Haber – Türkiyenin Yapay Zeka Haber Portalı
HABER SAYI #713 9 Mar 2026 · Pazartesi

MMLU Ölüyor mu? AI Modelleri İnsanların Son Sınavında Başarısız

Yeni bir tartışma AI topluluğunda alevlendi: MMLU (Massive Multitask Language Understanding) ölçümü artık geçerli mi? Nature’da Yayınlanan Sonuçlar Nature dergisinde yayınlanan bir makaleye göre, dünyanın önde gelen AI modelleri bile “insanların son sınavı” olarak adlandırılan MMLU…

AiHaber Editör
Editör
1DK 8OKUMA
Picsum ID: 26

Yeni bir tartışma AI topluluğunda alevlendi: MMLU (Massive Multitask Language Understanding) ölçümü artık geçerli mi?

Nature’da Yayınlanan Sonuçlar

Nature dergisinde yayınlanan bir makaleye göre, dünyanın önde gelen AI modelleri bile “insanların son sınavı” olarak adlandırılan MMLU testlerinde en fazla %50 skor alabildi.

  • Claude, GPT-5.2 ve diğer modeller düşük performans gösterdi
  • İnsan uzmanlar hala büyük güvenli alanda
  • MMLU’nun ölçüm validitesi sorgulanıyor

Bu durum, AI değerlendirmesinde yeni ölçütlere ihtiyaç olduğunu gösteriyor.

Kaynak: IT

— Paylaş

Beğendiysen yay.

Yapay Zeka Sohbetlerinde
Sosyal Medyada

Tartışma

Bu habere emoji ile tepki ver

Hizli:

Henüz yorum yok. İlk yorumu siz yapın!

Yapıcı ve saygılı yorumlar bekliyoruz. Topluluk kuralları