Anthropic, Claude Opus 4.5’i Tanıttı: Yapay Zekâ İnsanları Geçti

  • 25 Kas 2025 15:17
  • Güncelleme: 25 Kas 2025
    4 dk. Okuma Süresi
Yazı Özetini Göster
Anthropic, Claude Opus 4.5’i duyurdu: geliştirilmiş kodlama ve uzun görev işleme yetenekleriyle, yazılım mühendisliği testlerinde insan performansını geçti


Genel Bakış

Anthropic, yeni yapay zekâ modeli Claude Opus 4.5’i tanıttı. Bu sürüm, kodlama, akıllı ajanlar (agents) ve bilgisayar işlemleri alanlarında öne çıkan bir genel amaçlı model olarak konumlandırıldı. Ayrıca araştırma, sunum hazırlama ve elektronik tablo (Excel) görevlerinde de belirgin ilerleme kaydetti.

Model, Anthropic uygulaması, API’si ve üç büyük bulut platformu üzerinden kullanılabiliyor.

  • API sürümü: claude-opus-4-5-20251101

  • Fiyatlandırma:

    • Girdi (input): 5 ABD doları / milyon token

    • Çıktı (output): 25 ABD doları / milyon token


Performans ve Test Sonuçları

  • Anthropic, yazılım mühendisliği adayları için yaptığı zorlu bir ev testini modele uyguladı.

  • İki saatlik sınır içinde Claude Opus 4.5, tüm insan katılımcılardan daha yüksek puan aldı.

  • Test, teknik beceriler ve baskı altındaki karar verme yeteneğini ölçüyordu.

Bu sonuç, yapay zekânın mühendislik mesleklerinde nasıl bir dönüşüm yaratabileceğine dair tartışmaları yeniden gündeme getirdi. Anthropic’in “Toplumsal Etki ve Ekonomik Gelecek” ekibi bu konuda daha fazla araştırma yayımlamayı planlıyor.


Gerçek Görev Performansı

“τ2-bench” adlı akıllı ajan değerlendirme testinde, Claude Opus 4.5 havayolu müşteri hizmetleri senaryosunda yaratıcı bir çözüm sundu:
Kurallara göre “ekonomi sınıfı” bileti değiştirilemezdi, fakat model önce sınıf yükseltme, sonra uçuş değiştirme önerisi getirdi.
Bu çözüm resmi olarak “başarısız” sayıldı, çünkü standart cevaptan sapıyordu; ancak Anthropic, bu tür “yaratıcı sezgisel çözümleri” modelin zekâ artışının bir göstergesi olarak değerlendiriyor.


Güvenlik ve Uyum

Claude Opus 4.5, Anthropic’in bugüne kadarki en uyumlu ve güvenli modeli olarak tanımlanıyor.

  • Prompt injection (hileli yönlendirme) saldırılarına karşı daha dayanıklı.

  • Kritik görevlerde güvenilirlik artırıldı.

  • “Ödül manipülasyonu (reward hacking)” davranışlarını azaltmak için yeni güvenlik testleri eklendi.


⚙️ Geliştirici Platformu Yenilikleri

Yeni model, görevleri daha az adımda ve daha verimli şekilde tamamlıyor.

  • Token kullanımı azaldı.

  • Yeni “effort(çaba)” parametresi ile geliştiriciler, hız, maliyet ve performans arasında seçim yapabiliyor.

  • “SWE-bench Verified” testinde, orta effort ayarında Sonnet 4.5 ile benzer skor alırken %76 daha az çıktı token’ı kullandı.

  • En yüksek effort ayarında ise Sonnet 4.5’i 4,3 puan farkla geçti ve %48 daha az token harcadı.


Claude Code ve Uygulama Güncellemeleri

  • Claude Code:

    • “Plan Mode” artık önce kullanıcıya sorular yönelterek gereksinimleri netleştiriyor, ardından plan.md dosyası oluşturuyor.

    • Masaüstü sürümü geldi; birden fazla yerel ve uzak oturum aynı anda çalışabiliyor.

  • Claude Uygulaması:

    • Uzun konuşmalarda eski içerikleri otomatik özetliyor, böylece sohbet kesintisiz devam ediyor.

    • Claude for Chrome tüm Max kullanıcılarına açıldı.

    • Claude for Excel Max, Team ve Enterprise kullanıcıları için test aşamasına girdi.

Ayrıca Opus 4.5 erişimi olan kullanıcılar için kullanım limitleri kaldırıldı, genel kullanım kotaları ise yükseltildi.

Claude Opus 4.5 Api Fiyatı Nedir?


Özetle

Claude Opus 4.5,

  • İnsan düzeyinde (ve ötesinde) kodlama ve akıl yürütme performansı,

  • Gelişmiş güvenlik,

  • Uzun görev desteği,

  • Çoklu platform entegrasyonu
    ile Anthropic’in bugüne kadarki en güçlü ve güvenli modeli olarak öne çıkıyor.

Bir Yorum Yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Benzer Yazılar