xAI, sesli metin dönüştürme ve metin seslendirme API’lerini piyasaya sürdü. Grok Speech to Text ve Text to Speech API’leri, piyasadaki en düşük fiyatlarla geliyor.
Grok Speech API Fiyatlandırması
Grok Speech to Text
- Toplu İşleme (Batch): Saatte sh.10
- Gerçek Zamanlı Akış: Saatte sh.20
Grok Text to Speech
- Milyon Karakter Başına: .20
Bu fiyatlar, piyasadaki en ucuz seçenek. Rakiplerinden yüzde 60 daha ucuz.
Benchmark Sonuçları
xAI’nin yayınladığı kelime hata oranları oldukça iddialı:
- Telefon Görüşmesi Varlık Tanıma – Grok STT: %5.0 hata, ElevenLabs: %12.0, Deepgram: %13.5, AssemblyAI: %21.3
Bu önemli bir fark. Gerçek hayattaki isimler, hesap numaraları ve tarihler gibi kritik bilgilerin doğru tanınması çok önemli.
Özellikler
Grok Speech to Text:
- 25+ Dil Desteği – Kesintisiz dil değiştirme
- Gerçek Zamanlı Akış – WebSocket API
- Konuşmacı Ayrıştırma (Speaker Diarization) – Kimin konuştuğunu tanıma
- Akıllı Metin Normalizasyonu – “on dört yüz doksan dokuz” = “4.99” gibi dönüşümler
- Gerçek Zamanlı Para Birimi ve Tarih Dönüşümü
- Kelime Bazlı Zaman Damgaları
Grok Text to Speech:
- Doğal ses sentezi
- Çoklu dil desteği
Hangi Teknoloji?
Aynı altyapı Tesla araçlarındaki ses özelliklerini destekliyor. Bu, xAI’ın altyapı yatırımlarını paraya dönüştürme stratejisinin bir parçası.
Columbus süperbilgisayarı Aralık 2024’ten bu yana çalışıyor ve arka uç güç sağlıyor.
Ne Ise Yarar?
Geliştiriciler İçin
- Ucuz transkripsiyon maliyeti
- Gerçek zamanlı alt yazı
- Konuşmacı tanıma
- Çok dilli uygulamalar
Voice Agent İnşası
- Ses tabanlı asistanların maliyeti düşüyor
- Gerçek zamanlı konuşma AI mümkün
Podcast ve İçerik Üretimi
- Ucuz alt yazı oluşturma
- Çok dilli içerik üretimi
Karşılaştırma
xAI’ın bu hamlesi, ElevenLabs, Deepgram ve AssemblyAI gibi ünlü sağlayıcılara doğrudan meydan okuma. Fiyat avantajı ve Tesla entegrasyonu farklı kılıyor.
Sonuc
xAI ses API’leri piyasaya sürerek yelpazesini genişletiyor. Grok artık sadece bir sohbet botu değil, tam kapsamlı bir AI platformu.
API’ler xAI konsolundan hemen kullanılabilir durumda.
Siz bu API’leri hangi projelerde kullanmayı düşünürsünüz?
#Grok #xAI #API #SpeechToText #TextToSpeech #VoiceAPI #ElevenLabs #Deepgram #AssemblyAI #Tesla #TechNews #AIGen #Innovation #AIRevolution #Developer #VoiceAssistant #pricing
Henüz yorum yok. İlk yorumu siz yapın!