Apple’ın Yeni Yapay Zeka Araştırması: Kayıtları Dinlemeden 12 Aktiviteyi Tanıyabiliyor

iowen
22 Kas 2025 11:09
Güncelleme: 22 Kas 2025

3 dk. Okuma Süresi

Yazı Özetini Göster

Teknoloji medya kuruluşu 9to5Mac, 21 Kasım tarihli blog yazısında Apple’ın yayımladığı yeni araştırma raporuna dikkat çekti. Rapora göre, Apple araştırmacıları, Büyük Dil Modellerinin (LLM) yalnızca metin açıklamalarına dayanarak kullanıcıların fiziksel aktivitelerini doğru biçimde tespit edebildiğini ortaya koydu. Bu sistemin gelecekte Apple Watch gibi cihazlarda uygulanabileceği belirtiliyor.

“Geç Çok Modlu Sensör Füzyonu (Late Multimodal Sensor Fusion)” adı verilen bu yöntem, yapay zekanın çıkarım gücünü geleneksel sensör verileriyle birleştiriyor. Böylece sensör bilgisinin eksik olduğu durumlarda bile kullanıcının yaptığı aktiviteyi yüksek doğrulukla belirleyebiliyor.

Araştırmanın en dikkat çekici yönü, yapay zekanın ham ses veya hareket verilerini doğrudan işlememesi. Bunun yerine, özel olarak eğitilmiş küçük modeller bu verileri metin açıklamalarına dönüştürüyor ve büyük dil modeli bu metinleri analiz ediyor. Örneğin, ses modeli “akan su sesi” gibi bir betimleme üretirken, hareket modeli “bulaşık yıkama hareketi” gibi bir tahminde bulunabiliyor. Bu yaklaşım hem gizliliği koruyor hem de LLM’nin farklı kaynaklardan gelen bilgileri birleştirme yeteneğini güçlendiriyor.

Araştırma ekibi, yöntemi doğrulamak için binlerce saatlik Ego4D veri setini kullandı. Deneylerde elektrik süpürgesi çekmek, yemek pişirmek, bulaşık yıkamak, basketbol oynamak ve halter kaldırmak gibi 12 günlük aktivite seçildi. Küçük modeller tarafından üretilen metin açıklamaları daha sonra Google Gemini 2.5 Pro ve Alibaba Qwen-32B gibi büyük dil modellerine girilerek hem “sıfır örneklem” (hiç örnek verilmeden) hem de “tek örneklem” senaryolarında test edildi.

Sonuçlar, hedefli bir eğitim olmadan bile modellerin etkinlik tanımada rastgele tahminlerin çok ötesinde başarı gösterdiğini, ayrıca yüksek F1 skorları elde ettiğini ortaya koydu. Tek bir örnek verildiğinde doğruluk oranı daha da yükseldi.

Apple araştırmacılarına göre bu yöntem, gelecekte belirli senaryolar için ayrı ayrı model geliştirme ihtiyacını ortadan kaldırabilir. Böylece daha az bellek ve işlem gücü kullanarak güçlü çok modlu yapay zeka uygulamaları geliştirilebilecek. Apple, çalışmanın deneysel verilerini ve kodlarını da diğer araştırmacıların erişimine açtı.

Etiketler :

Bu yazıya ait etiket bulunamadı.