SiMa.ai ve Cerence, CES 2026 etkinliği kapsamında otomotiv sektöründe çığır açacak nitelikte bir teknolojiyi tanıttı. Ortak geliştirdikleri...
Anthropic, Claude Opus 4.5’i Tanıttı: Yapay Zekâ İnsanları Geçti
- 25 Kas 2025 15:17
-
Güncelleme: 25 Kas 20254 dk. Okuma Süresi
-
-
- 0
-
38
Anthropic, Claude Opus 4.5’i duyurdu: geliştirilmiş kodlama ve uzun görev işleme yetenekleriyle, yazılım mühendisliği testlerinde insan performansını geçti
Genel Bakış
Anthropic, yeni yapay zekâ modeli Claude Opus 4.5’i tanıttı. Bu sürüm, kodlama, akıllı ajanlar (agents) ve bilgisayar işlemleri alanlarında öne çıkan bir genel amaçlı model olarak konumlandırıldı. Ayrıca araştırma, sunum hazırlama ve elektronik tablo (Excel) görevlerinde de belirgin ilerleme kaydetti.
Model, Anthropic uygulaması, API’si ve üç büyük bulut platformu üzerinden kullanılabiliyor.
-
API sürümü:
claude-opus-4-5-20251101 -
Fiyatlandırma:
-
Girdi (input): 5 ABD doları / milyon token
-
Çıktı (output): 25 ABD doları / milyon token
-
Performans ve Test Sonuçları
-
Anthropic, yazılım mühendisliği adayları için yaptığı zorlu bir ev testini modele uyguladı.
-
İki saatlik sınır içinde Claude Opus 4.5, tüm insan katılımcılardan daha yüksek puan aldı.
-
Test, teknik beceriler ve baskı altındaki karar verme yeteneğini ölçüyordu.
Bu sonuç, yapay zekânın mühendislik mesleklerinde nasıl bir dönüşüm yaratabileceğine dair tartışmaları yeniden gündeme getirdi. Anthropic’in “Toplumsal Etki ve Ekonomik Gelecek” ekibi bu konuda daha fazla araştırma yayımlamayı planlıyor.
Gerçek Görev Performansı
“τ2-bench” adlı akıllı ajan değerlendirme testinde, Claude Opus 4.5 havayolu müşteri hizmetleri senaryosunda yaratıcı bir çözüm sundu:
Kurallara göre “ekonomi sınıfı” bileti değiştirilemezdi, fakat model önce sınıf yükseltme, sonra uçuş değiştirme önerisi getirdi.
Bu çözüm resmi olarak “başarısız” sayıldı, çünkü standart cevaptan sapıyordu; ancak Anthropic, bu tür “yaratıcı sezgisel çözümleri” modelin zekâ artışının bir göstergesi olarak değerlendiriyor.
Güvenlik ve Uyum
Claude Opus 4.5, Anthropic’in bugüne kadarki en uyumlu ve güvenli modeli olarak tanımlanıyor.
-
Prompt injection (hileli yönlendirme) saldırılarına karşı daha dayanıklı.
-
Kritik görevlerde güvenilirlik artırıldı.
-
“Ödül manipülasyonu (reward hacking)” davranışlarını azaltmak için yeni güvenlik testleri eklendi.
⚙️ Geliştirici Platformu Yenilikleri
Yeni model, görevleri daha az adımda ve daha verimli şekilde tamamlıyor.
-
Token kullanımı azaldı.
-
Yeni “effort(çaba)” parametresi ile geliştiriciler, hız, maliyet ve performans arasında seçim yapabiliyor.
-
“SWE-bench Verified” testinde, orta effort ayarında Sonnet 4.5 ile benzer skor alırken %76 daha az çıktı token’ı kullandı.
-
En yüksek effort ayarında ise Sonnet 4.5’i 4,3 puan farkla geçti ve %48 daha az token harcadı.
Claude Code ve Uygulama Güncellemeleri
-
Claude Code:
-
“Plan Mode” artık önce kullanıcıya sorular yönelterek gereksinimleri netleştiriyor, ardından
plan.mddosyası oluşturuyor. -
Masaüstü sürümü geldi; birden fazla yerel ve uzak oturum aynı anda çalışabiliyor.
-
-
Claude Uygulaması:
-
Uzun konuşmalarda eski içerikleri otomatik özetliyor, böylece sohbet kesintisiz devam ediyor.
-
Claude for Chrome tüm Max kullanıcılarına açıldı.
-
Claude for Excel Max, Team ve Enterprise kullanıcıları için test aşamasına girdi.
-
Ayrıca Opus 4.5 erişimi olan kullanıcılar için kullanım limitleri kaldırıldı, genel kullanım kotaları ise yükseltildi.
Claude Opus 4.5 Api Fiyatı Nedir?

Özetle
Claude Opus 4.5,
-
İnsan düzeyinde (ve ötesinde) kodlama ve akıl yürütme performansı,
-
Gelişmiş güvenlik,
-
Uzun görev desteği,
-
Çoklu platform entegrasyonu
ile Anthropic’in bugüne kadarki en güçlü ve güvenli modeli olarak öne çıkıyor.
Etiketler :
Benzer Yazılar
Önemli Noktalar: Meta, AB'nin gönüllü GPAI Uygulama Kuralları'nı imzalamayı reddetti ve bunun Yapay Zeka Yasası'nın...
Anthropic , Çarşamba günü, birkaç ay önce son teknoloji olarak kabul edilen sistemlerin kodlama yetenekleriyle...