Xiaomi, yapay zekâ alanındaki yenilikçi hamlelerine bir yenisini ekleyerek MiMo-V2-Flash adını verdiği açık kaynaklı MoE (Mixture of...
ChatGPT, Tüm Yapay Zekâyı Kapsayan Bir Platforma Dönüşüyor
Her ne kadar bazı şikayetlerimiz olsa da, OpenAI’nin teknolojik öngörüsünün yadsınamaz olduğunu kabul etmek gerekir. Bu OpenAI Geliştirici Konferansı bilgi dolu bir konferans oldu, ancak benim en önemli izlenimim şudur: OpenAI, ChatGPT’yi Çin’deki WeChat’e benzer bir süper uygulama olarak konumlandırıyor (mini programlar, video kanalları, resmi hesaplar, sosyal özellikler vb. ile). Esasen, AI’nın yapabileceği her şey sonunda ChatGPT’ye entegre edilecek (API sağlama hizmetinden kullanıcı deneyimine kadar hem B2B hem de B2C’yi kapsayacak şekilde).
Konferansın en dikkat çekici iki yönü: Uygulamalar ve AgentKit. Apps SDK kullanılarak geliştirilen uygulamalar, ChatGPT kanallarını kullanarak ürünleri küresel olarak dağıtabilir (AI Uygulama Dağıtım Merkezi aracılığıyla). ChatGPT’ye aşırı bağımlılıktan kaçınmak isteyen işletmeler için OpenAI, ajan geliştirmeyi basitleştirmek amacıyla AgentKit’i özenle hazırlamıştır.
Apps SDK Uygulama SDK’sı
OpenAI, ChatGPT içinde doğrudan etkileşim kurabilen yeni nesil uygulamaları ve geliştiricilerin bu uygulamaları oluşturmaları için bir Apps SDK’yı resmi olarak piyasaya sürdü. Kullanıcılar, modelin kendisiyle konuşur gibi bu uygulamalarla doğal bir şekilde etkileşim kurabilirken, geliştiriciler SDK aracılığıyla hizmetlerini ChatGPT’ye kolayca entegre ederek 800 milyondan fazla kullanıcıya ulaşabilirler.
Kullanıcılar, doğal dil komutları (örneğin, “Spotify, parti çalma listesi oluşturmama yardım et”) aracılığıyla uygulamaları çağırabilir veya ChatGPT’nin konuşmalar sırasında ilgili uygulamaları akıllıca önermesini sağlayabilir (örneğin, ev satın alımını tartışırken Zillow’un emlak arama arayüzünü görüntülemek). Bu uygulamalar haritalar, çalma listeleri ve sunumlar gibi etkileşimli öğeleri entegre ederek, Canva’nın taslağınızı doğrudan slaytlara dönüştürmesi veya Coursera kurslarını izlerken gerçek zamanlı sorular sorma gibi yeni bir “eylem olarak sohbet” deneyimi sunar. Figma ile UI diyagramları oluşturma girişimim başarısız oldu; şu anda sadece akış şemaları oluşturabiliyor gibi görünüyor (ki bu oldukça yetersiz geliyor).

İlk ortaklar arasında Booking.com, Canva, Coursera, Figma, Expedia, Spotify ve Zillow yer alıyor. Uber, OpenTable, Target ve Peloton gibi diğer uygulamalar da yakında eklenecek.
Uygulama SDK’sı, açık standart Model Context Protocol (MCP) üzerine kuruludur ve geliştiricilerin uygulama mantığını ve arayüzlerini tanımlamasına, arka uç hizmetlerine bağlanmasına ve açık kaynak desteği sayesinde MCP standardını benimseyen herhangi bir ortamda çalıştırmasına olanak tanır. OpenAI, geliştiricilerin konuşma ve etkileşimli öğeleri entegre eden deneyimleri hızlı bir şekilde tasarlamasına yardımcı olmak için belgeler ve örnek depolar yayınlamıştır.
Tüm uygulamalar OpenAI’nin kullanım politikalarına uymalı, her yaştan kullanıcı için güvenli bir şekilde erişilebilir olmalı ve gizlilik ve veri izinlerini açıkça belirtmelidir. İlk kullanımda ChatGPT, kullanıcılardan paylaşılan verilerin kapsamını onaylamalarını isteyecektir; gelecekte daha ayrıntılı gizlilik kontrolleri eklenecektir.
Bu yılın ilerleyen aylarında OpenAI, uygulama gönderme ve listeleme sürecini başlatacak, bir Uygulama Dizini açacak ve geliştiricilerin tek tıklamayla ödemeyi uygulamaya koymalarını ve Agentic Commerce Protocol aracılığıyla uygulamalardan para kazanmalarını sağlayacak. Bu, ChatGPT’nin bir “sohbet modeli”nden ekosistem yeteneklerine sahip bir “konuşma uygulaması platformu”na resmi olarak evrimleştiğini gösteriyor.
Yapay Zeka ile E-ticaret

Anında Ödeme özelliği sayesinde, kullanıcılar satın alma işlemlerini doğrudan sohbet içinde tamamlayabilirler. Bu işlevsellik, OpenAI ve Stripe tarafından ortaklaşa geliştirilen açık bir standart olan Agentic Commerce Protocol (ACP) üzerine kuruludur ve satıcılara ve geliştiricilere, sohbet trafiğini gerçek satışlara dönüştürmek için basit ve verimli bir yöntem sunar.
Agentik Ticaret Protokolü, yapay zeka ajanları ve işletmeler arasındaki işlemleri kolaylaştırmak için tasarlanmış, ileriye dönük bir açık standarttır. Mevcut sistemlerle uyumluluğu korumanın yanı sıra, akıllı ticaretteki gelecekteki gelişmelere uyum sağlamak için sağlam bir ölçeklenebilirlik de sunar. Giriş engelleri düşük olan ACP, çeşitli ödeme platformları ve teknoloji yığınlarıyla uyumludur ve aynı zamanda yeni nesil yapay zeka odaklı e-ticaret deneyimlerine hazırlık sağlar.
ACP, Etsy gibi ticari ekosistemlerde öncü bir rol oynamıştır ve Shopify de kısa süre içinde entegrasyonunu tamamlayacaktır. ACP, alışveriş senaryolarını yönetmek için yapay zeka arayüzlerine temel bir çerçeve sağlar. Stripe kullanan satıcılar, tek bir satır kod ekleyerek ödeme işlevini etkinleştirebilir; diğer ödeme sistemlerini kullananlar da mevcut ödeme mimarilerini değiştirmeden Stripe’ın Paylaşımlı Ödeme Jetonu API’sı veya ACP’nin Delege Ödemeler spesifikasyonu aracılığıyla entegrasyon gerçekleştirebilir.
Aşağıdaki akış şeması, Ajans İş Anlaşması için uçtan uca veri akışını göstermektedir. İlgili taraflar, Agentic Commerce hakkında daha fazla bilgi edinmek için belgelere başvurabilirler.

Teknik farklılıklar
Uygulamalar, GPT Mağazası, mini programlar – aralarında fark göremiyorum…
GPT Mağazası ile
GPT Store, “yapılandırma tabanlı Ajanlar”a (sistem komutları + bilgi + araçlar/eylemler) hizmet verir ve öncelikle diyalog + araç çağırma üzerine odaklanır. Arayüzü hafiftir ve daha çok “paylaşılabilir özel GPT” gibi çalışır.
Uygulama SDK’sı, arayüz + mantık + doğrudan arka uç bağlantısını kapsayan “programlanabilir uygulamaları” hedefler ve etkileşimli kullanıcı arayüzü ile iş akışı düzenlemesini ön plana çıkarır. Konuşmalar içindeki bağlamsal öneriler “kullanım anında” karşımıza çıkar ve yerel olarak oluşturulan etkileşimli bileşenler (haritalar/listeler/widget’lar) daha çok “konuşmalar içindeki mini uygulamalar” gibi işlev görür.
GPT Store, OpenAI tarafından artık hizmet dışı bırakılmıştır ve muhtemelen Apps onun yerini alacaktır.
AgentKit

AgentKit[6] , Agent Builder (görsel düzenleme), Connector Registry (birleşik veri/araç yönetimi), ChatKit (gömülü konuşma arayüzü) ve Evals (değerlendirme/optimizasyon) özelliklerini uçtan uca bir platformda bir araya getirerek, doğrudan “mühendislik uygulamasının son aşamasını” hedeflemektedir. Bu, en yaygın düzenleme, arayüz entegrasyonu, değerlendirme ve yönetim özelliklerinin artık ilk kez kapalı döngü, resmi tek bir yığın içinde sunulduğu anlamına gelmektedir.
Ajan Oluşturucu

Agent Builder[7] , sürükle ve bırak düğümleri, araç bağlantıları, koşullu/dalgalı mantık, koruma rayları ve “önizleme yürütme + gömülü değerlendirme yapılandırması + tam sürümleme” özellikleri sunar. Çoklu ajan iş akışları için görsel modelleme, araç düzenleme ve durum yönetimini kolaylaştırarak, denemeden dağıtıma kadar geçen süreyi kısaltır. Platformun Guardrails, MCP ve değerlendirme sistemleriyle yerleşik entegrasyon noktaları içerir.
Kuruluş Kayıt Defteri

Registry, ChatGPT’yi API tarafında önceden yapılandırılmış bağlayıcılarla (Google Drive, SharePoint, Dropbox, Microsoft Teams vb.) tek bir arka uçta (Global Admin Console’a dayalı) entegre ederek, işletmelerin etki alanı ötesi izinleri ve veri boru hatlarını merkezi olarak yönetmelerini ve yeniden kullanmalarını sağlar. Bu, “bağlayıcı parçalanması” ve “çoklu ortam yapılandırma sapması” risklerini azaltır.
https://admin.openai.comGlobal Admin Console, OpenAI’nin kurumsal müşteriler için geliştirdiği birleşik kimlik ve erişim yönetimi platformudur. “Kiracılar” kavramını tanıtan bu platform, birden fazla ChatGPT çalışma alanını ve API organizasyonunu tek bir çerçeve altında birleştirir. Bu sayede, etki alanı doğrulama, SSO tek oturum açma, kullanıcı izinleri ve hesap birleştirme işlemleri merkezi olarak yönetilebilir. Yöneticilerin kimlik politikalarını yapılandırmasına, etki alanları arası erişim kontrollerini yönetmesine ve tüm kullanıcıları tek bir arayüzden görüntülemesine olanak tanıyarak, daha önce farklı çalışma alanlarına dağılmış olan işlemleri kolaylaştırır. Bu, OpenAI’nin kurumsal düzeydeki hesap sistemini birleştirme ve yönetme yolunda önemli bir adımdır.
Koruyucu korkuluklar

Resmi Koruma Önlemleri Açık kaynaklı, modüler bir güvenlik katmanı olarak, PII maskeleme/açıklama, jailbreak algılama ve politika tabanlı kısıtlamaları destekler. Builder içinde etkinleştirilebilir veya devre dışı bırakılabilir ya da Python/JS kütüphaneleri aracılığıyla bağımsız olarak entegre edilebilir, böylece geliştirme, test ve üretim ortamlarında birleşik bir güvenlik temelini oluşturur.
Chatkit

ChatKit, “akış yanıtları, iş parçacığı yönetimi, düşünce süreci görselleştirme ve dahili sohbet etkileşim bileşenleri” gibi yaygın ancak tekrarlayan mühendislik görevlerini çözer. Marka özelleştirmesini ve uygulamalar veya web siteleri içindeki sorunsuz entegrasyonu destekleyen ChatKit, ön uç geliştirme süresini önemli ölçüde azaltarak ekiplerin çabalarını “Temsilci yetenekleri ve senaryo stratejileri”ni kendileri iyileştirmeye odaklamalarını sağlar.
ChatKit’i ön uca yerleştirmek için, OpenAI sunucularında barındırılan bir proxy iş akışı oluşturulmalı, ardından ChatKit yapılandırılmalı ve işlevler eklenmelidir. Temel mimari şeması aşağıdaki gibidir:
GitHub’da dört proje açık kaynak olarak yayınlanmıştır:
- chatkit-python[10]: ChatKit Python SDK
- chatkit-js[11]: ChatKit JS SDK: Geliştiricilerin ön uç oluşturmadan veya karmaşık durumları yönetmeden uygulamalara özelleştirilebilir, yüksek kaliteli akıllı diyalog arayüzlerini hızla yerleştirmelerini sağlayan, kullanıma hazır bir AI sohbet çerçevesi. Akış yanıtlarını, görselleştirilmiş araç çağırmayı, zengin etkileşimli bileşenleri, dosya yüklemelerini, mesaj dizilimini ve kaynak açıklamalarını destekleyerek, tak ve çalıştır türünde üretim sınıfı bir sohbet deneyimi sunar.
- ChatKit Starter Template[12]: ChatKit Başlangıç Şablonu: ChatKit uygulamalarını başlatmak için en minimal şablon, modern Next.js arayüzü, ChatKit Web bileşenleri ve kullanıma hazır oturum arayüzleri içerir. Bu, geliştiricilerin Agent Builder üzerine inşa edilmiş OpenAI tarafından barındırılan iş akışlarını hızlı bir şekilde deneyimlemelerine ve test etmelerine olanak tanır.
- OpenAI ChatKit Advanced Samples[13]: OpenAI ChatKit Gelişmiş Örnekleri: FastAPI Python arka ucunu Vite + React ön ucuyla entegre eden, ChatKit UI, etkileşimli bileşenler ve istemci tarafı araçlarının pratik kullanımını gösteren kapsamlı bir ChatKit gelişmiş örneği ve deneysel proje. Proje, ChatKit Python SDK ve OpenAI Agents SDK’yı kullanarak özel bir sunucu oluşturur. Ön ucun Vite sunucusu, tüm istekleri otomatik olarak yerel FastAPI hizmetine yönlendirir ve ek yapılandırma gerektirmeden eşzamanlı ön uç-arka uç geliştirme sağlar.
ChatKit Stüdyosu
OpenAI ayrıca herkesin keşfedip öğrenebilmesi için bir ChatKit Studio hazırladı.
Playground
Yapılandırma dışa aktarımını destekleyen özelleştirilebilir oyun alanı.
Yapılandırma parametreleriyle ilgili sorularınız varsa, alanın yanındaki ℹ️ simgesine tıklayarak bir diyalog başlatabilirsiniz. AI’nın ortaya çıkışı, teknik öğrenme eğrisini daha da azaltmıştır (bu, belgeleri parmaklarınızın ucuna getirerek deneyimli programcıları gözyaşlarına boğmuştur).
Widget oluşturucu
Bu bölüm de bileşen geliştirme maliyetini daha da düşürdüğü için oldukça ilginçtir. Bileşenler doğrudan AI diyalogu aracılığıyla oluşturulabilir ve ayrıca .widget dosyalarının yüklenmesini de destekler (bu dosyalar kenar çubuğundaki Widget’lar bölümüne eklenecektir).
Galeri, çeşitli widget’lar, bileşenler ve simgeler gibi standart kütüphane bileşenlerini sergiliyor. Ek olarak, OpenAI’nin shadcn [16] ‘ı başka bir katmanla sardığı da söylenebilir.
Chatkit.world
Chatkit.world, 3D küre ile etkileşimli diyalog kurmayı sağlayan bir demodur. OpenAI, bu örneği ChatKit’in müşteri hizmetleri konuşma yeteneklerini sergilemek için kullanmış olabilir.
Değerlendirmeler
Evals’ın yeni sürümü dört temel özelliği sunuyor: Veri kümeleri, İzleme Notlandırma, Otomatik Komut Optimizasyonu ve üçüncü taraf model desteği. İnsan tarafından yapılan açıklamaları, otomatik notlandırmayı ve otomatik yeniden yazmayı kapalı döngü bir sisteme entegre ederek, uçtan uca yürütme sürecindeki darboğazların tespit edilmesini sağlıyor. Bu, üretim düzeyinde doğrulanabilirliği ve regresyon verimliliğini önemli ölçüde artırıyor.
RFT (Güçlendirme İnce Ayarı)
RFT, o4-mini’de tamamen kullanıma sunulurken, GPT-5 özel beta sürümünde kalmaya devam ediyor. En son eklenen özellikler arasında “Özel araç çağrıları” ve “Özel derecelendirme araçları” bulunuyor. Bu özellikler, ekiplerin “harici araçları ne zaman ve nasıl kullanacakları” ve “iş standartlarına göre yüksek kaliteli cevaplar sunma” konusundaki tercihlerini doğrudan model davranışına yerleştirmelerini sağlıyor.
Mevcudiyet
ChatKit ve yeni Evals artık genel kullanıma sunulmuştur; Agent Builder Beta sürümündedir; Connector Registry, Global Admin Console erişimine sahip API/Enterprise/Edu müşterilerine aşamalı olarak sunulmaktadır. Fiyatlandırma, standart API modeliyle birlikte sunulmaktadır; ayrıca, ChatKit dosya/görüntü depolama faturalandırması 1 Kasım 2025 tarihinden itibaren başlayacak ve bu tarihten önce herhangi bir ücret uygulanmayacaktır (ücretsiz katman ve günlük faturalandırma ayrıntıları geçerlidir).
Sora 2
Sora 2, OpenAI’nin yeni nesil üretken video modelidir ve metin veya görüntülerden sesli, son derece ayrıntılı ve dinamik videolar üretebilir. Üç boyutlu uzay, hareket ve sahne sürekliliği için sağlam modelleme yetenekleri sergiler. Geliştiricilere ilk kez sunulan Video API, programlı oluşturma, genişletme ve türev çalışmalarını mümkün kılar. Görev oluşturma, durum sorguları, bitmiş video indirmeleri, sayfalanmış listeler ve silme dahil olmak üzere kapsamlı bir yönetim arayüzü setini içerir.
Model seçimi
sora-2 Öncelikle hız ve esnekliğe odaklanır, keşif aşamaları, konsept taslakları ve sosyal medya içeriği sırasında hızlı yinelemeler için idealdir; sora-2-pro Kararlılık ve görsel doğruluğu vurgular, yüksek çözünürlüklü, pazarlama düzeyinde ve sinematik çıktı için uygundur, ancak daha uzun render süreleri ve daha yüksek maliyetler söz konusudur. Teslim süresi ve görsel kalite arasındaki dengelemeyi göz önünde bulundurarak seçim yapın.
Görev İş Akışı
Video oluşturma asenkron bir işlemdir: bir görev gönderildiğinde, bir kimlik ve başlangıç durumu elde edilir. İlerleme ve tamamlanma/başarısızlık olayları daha sonra durum sorguları veya webhook’lar aracılığıyla alınır. MP4 içeriği, görev tamamlanmış duruma ulaştığında indirilebilir. İşleme gecikmesi, modele, sistem yüküne ve çözünürlüğe bağlı olarak değişir. Ön uç uygulaması, uygun yeniden deneme/geri çekilme stratejilerinin yanı sıra ilerleme geri bildirimi sağlamalıdır.
{
"id":"video_68d7512d07848190b3e45da0ecbebcde004da08e1e0678d5",
"object":"video",
"created_at":1758941485,
"status":"queued",
"model":"sora-2-pro",
"progress":0,
"seconds":"8",
"size":"1280x720"
}
Uyum ve Kısıtlamalar
Şu anda, yalnızca 18 yaşın altındaki izleyiciler için uygun içeriklere izin verilmektedir; telif hakkı bulunan karakterler ve müzikler reddedilecektir; gerçek kişiler (kamuoyunda tanınan kişiler dahil) oluşturulamaz; insan yüzleri içeren giriş görüntüleri reddedilecektir. Komut istemleri, referans görüntüler, başlıklar ve diğer materyallerin tümü kurallara uygun olmalıdır.
Hızlı Strateji
Tutarlılığı ve kontrol edilebilirliği artırmak için kamera pozisyonunu, konuyu, eylemi, sahneyi ve aydınlatma koşullarını (ör. “geniş çekim/yakın çekim”, “kamera hareketi”, “altın saat/sabah ışığı/sığ alan derinliği”) açıkça belirtin. Daha kesin sinematografik dil, beklenmedik model çıktılarını azaltır. Gelişmiş teknikler için özel komut kılavuzlarına başvurun.
Sonuçların Elde Edilmesi ve Varlıklar
Görev tamamlandığında, MP4 dosyaları indirilebilir; indirme bağlantıları genellikle 24 saat boyunca aktif kalır. Uzun süreli saklama için, dosyaları derhal kendi depolama alanınıza aktarın. Her video ayrıca önizleme, zaman çizelgesi sürükleme veya medya kitaplığı görüntüleme amacıyla küçük resimler ve sprite sayfalarının indirilmesine izin verir.
Görsel referansı
Giriş görüntüleri, marka varlıkları, karakterler veya ortamlarda görsel tutarlılığı korumak için ilk kareye güçlü bir kılavuz görevi görebilir. Referans görüntü çözünürlüğü, JPEG/PNG/WebP formatlarını destekleyen hedef videoyla eşleşmelidir. Bu yaklaşım, güçlü tutarlılık gerektiren reklamlar ve dizi materyalleri için özellikle uygundur.
Remix İkincil Yaratım
Remixler, tamamlanmış videolar üzerinde başlatılabilir ve orijinal yapı, süreklilik ve kompozisyon korunurken hedeflenen değişiklikler yapılabilir. En iyi uygulama, her oturumda yalnızca bir tane belirli küçük ayarlama yapılmasıdır (örneğin renk derecelendirme, tek tek öğelerin değiştirilmesi veya ikinci bir nesnenin eklenmesi). Bu, doğruluğu en üst düzeye çıkarır, artefakt riskini en aza indirir ve kademeli iyileştirmeler yoluyla yüksek kaliteli sekansların rafine edilmesini kolaylaştırır.
Varlık Kütüphanesi Yönetimi
API, geçmiş denetim, gösterge tablosu izleme ve temizleme amaçları için videoların sayfalandırılmış listelenmesini destekler. Artık kullanılmayan bitmiş çekimlerin gerektiğinde silinmesini sağlar. Nesne depolama ve yaşam döngüsü politikalarıyla birleştirildiğinde, bu, denetlenebilir, izlenebilir bir medya yönetimi iş akışının oluşturulmasını kolaylaştırır.
Mühendislik Teklifi
Üretim entegrasyonu sırasında, arka uç kuyruklarını ve durum makinelerini yönlendirmek için webhook’ları kullanmanız önerilir; ön uç ise yalnızca kullanıcıların algılayabileceği ilerleme göstergelerini ve yer tutucuları görüntüler. “Hızlı şablonlar + referans görseller + inceleme kriterleri”ni yapılandırılabilir öğeler olarak standartlaştırın. İş kademelerine göre keşif çalışmaları için sora-2 ‘u, nihai taslaklar için sora-2-pro ‘i seçerek maliyet ve teslimat kalitesi arasında denge sağlayın.
Hızlı Kılavuz
Komutları sinematograflar için brifingler olarak değerlendirin: ayrıntıları atlayın ve serbestçe doğaçlama yapın; talimatlarınız ne kadar ayrıntılı olursa, kontrol ve tutarlılık o kadar fazla olur; yorumlamaya geniş bir alan bırakın ve daha fazla sürpriz ve çeşitlilik elde edin. Komutları sözleşmelerden ziyade istek listeleri olarak değerlendirin — aynı komutu tekrar tekrar üretmek farklı sonuçlar verecektir. Önemli nokta: tekrar tekrar yineleyin. Kamera açıları, aydınlatma veya hareketlerdeki küçük ayarlamalar genellikle tamamen farklı görsellerle sonuçlanır. Sora 2 Komut Kılavuzu [19] ve Sora ile video oluşturma [20] bölümlerine bakın.
API parametreleri
Bu özellikler yalnızca API parametreleri aracılığıyla kontrol edilebilir ve metin açıklamalarıyla değiştirilemez:
- model:sora-2 veya sora-2-pro
- size:çözünürlük {genişlik}x{yükseklik}
- sora-2:1280×720,720×1280
- sora-2-pro:1280×720,720×1280,1024×1792,1792×1024
- seconds:süre “4”, “8”, “12” (varsayılan “4”)
Komutlar “içerik ve stil”i belirlerken, parametreler “kap (çözünürlük/süre/kalite)”i belirler.
- Çözünürlük: Yüksek çözünürlükler daha iyi ayrıntı ve hareket tutarlılığı sağlarken, düşük çözünürlükler bulanıklığa veya artefaktların ortaya çıkmasına neden olabilir.
- Süre: Daha kısa bölümler, talimatlara sıkı sıkıya uyulmasını daha kolaylaştırır. Mümkün olduğunda, iki adet 4 saniyelik bölüm, tek bir 8 saniyelik uzun çekimden daha tercih edilebilir.
Hızlı iskelet
Bir çekimi “storyboard kartına” çevirin: Kamera konumu/çekim boyutu → Alan derinliği → Aksiyon ritmi → Işıklandırma/renk tonu.
Birden fazla kamera açısı gerektiğinde, her çekim ayrı segmentlere (bir kamera konumu, bir eylem, bir ışıklandırma düzeni) ayrılmalıdır. Böylece bağımsız kısa filmler veya sıralı klipler kolayca oluşturulabilir.
- Kısa ipucu: Modele daha fazla yaratıcı özgürlük tanınması, daha beklenmedik sonuçlar doğurur.
- Daha uzun komut: Daha kontrol edilebilir, ancak her seferinde tam olarak uyulması gerekmez.
Örnek (kısa komut, işlevi gösteren):
- “1990’ların belgesel tarzı” → Genel estetik ve sinematografik tonun belirlenmesi
- Yaşlı bir İsveçli çalışma odasında oturuyor → Konu ve ortam hakkında hafif bir dokunuş
- “O şöyle dedi: ‘Gençliğimi hala hatırlıyorum…'” → Net diyalog, takip etmesi kolay
Ancak, “günün saati, hava koşulları, kıyafet, kamera açıları veya set tasarımı” ile ilgili belirli ayrıntılar sağlanmazsa, model bu unsurları otomatik olarak doldurur.
Son derece ayrıntılı talimatlar
Sinema kalitesinde kontrol elde etmek için profesyonel terminolojiyi kullanın: Lens formatı/lens seti, Filtreler/renk derecelendirme, Renk paleti/ışık yönü, Doku/atmosfer/kamera konumu, Kompozisyon/kostümler/sahne donanımı/ses tasarımı/zaman kodu, Amaç açıklaması.
Uygulanabilir: Otantik sinematografik stilleri (IMAX hava çekimleri/35 mm el kamerası/16 mm belgesel vb.) çekimler arasında süreklilik sağlayarak eşleştirmek.
Örnek:
- Format ve Görünüm: 4s; 180° obtüratör; 65 mm film kontrastının dijital simülasyonu; ince gren; hafif vurgu vinyetleme …
- Lensler ve Filtreler: 32/50 mm sabit odaklı lens; Siyah Pro-Mist 1/4; Yansımalar için açı kontrollü polarize filtre …
- Aydınlatma: Sol taraftan gelen doğal sabah ışığı; Yansıtılmış/negatif dolgu/destek ışığı; Işın ışığı ile ince sis…
- Çekim Listesi: 0.00–2.40 Giriş çekimi; 2.40–4.00 Hafif kavisli yakın çekim; görüntü yönetmeninin “neden işe yaradığını” açıklayan niyetiyle birlikte.
Stil Etiketleri
Görsel ipuçlarını kullanarak stili belirleyin: önce stilistik etiketleri belirleyin (örneğin ‘1970’lerin sineması’, ‘IMAX destanı’, ’16 mm siyah-beyaz’), ardından çekim kompozisyonu, hareket ve aydınlatma ayrıntılarını katmanlayın.
Kamera Konumu/Kompozisyon Örnekleri:
- Geniş kurulum çekimi, göz hizası
- Havadan geniş çekim, hafif aşağı doğru açı
- Orta yakın çekim, hafif arka açı
Kamera hareketlerine örnekler:
- yavaş eğim
- El tipi ENG kamera
Karakterleri tanıtırken, ifadelerde küçük değişiklikler onların kimliklerini, tavırlarını veya odak noktalarını değiştirebilir. Çekimler arasında tutarlı bir üslup kullanmak, sürekliliği artırır.
Hareket ve ritim kontrolü
Her çekim tek bir amaca hizmet eder: tek bir belirgin kamera hareketi + tek bir net konu eylemi. Hareketi vuruşlar (adımlar/duraklamalar/dönüşler) olarak yazarak zamanı somut hale getirin.
- **Zayıf**: Aktör odanın karşısına geçer.
- **Güçlü**: Aktör pencereye doğru dört adım attı, kısa bir süre durakladı ve son anda perdeleri çekti.
Işık ve rengin tutarlılığı
Işık ruh halini belirler. Kesintisiz düzenleme için tutarlı aydınlatma mantığı çok önemlidir. Işık kalitesi ile ışık kaynağı/renk sıcaklığı arasındaki etkileşimi, renk paleti referansları (3–5 renk) ile birlikte açıkça belgelendirin.
- **Zayıf**: Parlak ışıklı oda.
- **Güçlü**: Aydınlatma + Renk şeması: Pencere pervazından gelen yumuşak ana ışık + sıcak tonlu dolgu ışığı, koridor kenarları boyunca soğuk tonlar; Renk şeması: Amber/Krem/Ceviz kahvesi.
Görüntü girişi ile daha fazla kontrol edilebilirlik elde edin
Görüntüyü ilk kare olarak sabitleyin: karakter tasarımı, kostümler, set tasarımı veya genel estetiği belirleyin; metin komutları “sonra ne olacağını” belirler.
- input_reference olarak geçti
- Çözünürlük, hedef videonun çözünürlüğüyle aynı olmalıdır.
- Desteklenen formatlar: JPEG/PNG/WebP
Deneysel öneri: Hazır referans görüntüleriniz yok mu? OpenAI’nin görüntü oluşturma modelini kullanarak önce stil/sahne eskizleri oluşturun, ardından bunları Sora için girdi olarak kullanın. Bu yaklaşım, estetik yönelim ve ilk çıktı kalitesinin hızlı bir şekilde keşfedilmesini sağlar.
Diyalog ve Ses
Diyaloglar komut satırına yazılmalı ve görsel açıklamalardan ayrılmalıdır (örneğin, “Diyalog:” bölümü kullanılarak). Satırlar kısa ve doğal olmalıdır. Birden fazla karakter varsa, konuşanı açıkça belirtin ve diyalogları sırayla yazın, böylece model dudak hareketlerini ve yüz ifadelerini senkronize edebilir.
Hız: 4 saniye içinde 1-2 kısa cümle sığdırın; 8 saniye içinde biraz daha fazla cümle sığdırabilirsiniz. Diyalog bulunmayan yerlerde, bir veya iki akustik ipucu (örneğin “uzaktan gelen trafik gürültüsü”) ritmik dayanak görevi görebilir.
Remix ile küçük, hızlı adımlar atın
Remix, bir ‘zar’ değil, bir ‘ince ayar kolu’dur: bir seferde tek bir öğeyi değiştirin ve değişiklik noktasını belirtin (örneğin, ‘çekimi koru, 85 mm’ye geç’; ‘ışık konumunu koru, sadece renk tekerleğini ayarla: turkuaz/kum/pas’). Tekrarlanan sapmalar meydana gelirse, karmaşıklığı azaltın: kamera konumlarını sabitleyin, hareketleri basitleştirin, arka planları temizleyin; temel sabit hale geldikten sonra kademeli olarak karmaşıklığı artırın. Bu, yapısal bütünlüğü, konu odağını ve sabit kamera konumunu korurken duygusal, renk veya sahneleme varyasyonlarının keşfedilmesini sağlar.
Hızlı Şablon (Açıklayıcı)
Tutarlılığı kolaylaştırmak için bilgiler hiyerarşik olarak düzenlenebilir; ‘boşluğu doldurmaya’ gerek yoktur – alakasız unsurlar çıkarılabilir, çünkü boş alanlar bırakmak daha fazla yaratıcı çeşitlilik sağlar.
ÖRNEK PROMPT
Örnek 1|Elle çizilmiş 2D/3D hibrit animasyon
- Stil: Yumuşak fırça darbeleri, tungsten filamanlı sıcak ışık, donmuş kare dokusu, sıcak-soğuk tonlarla dengelenmiş suluboya boyamalar.
- Sahne: Dağınık bir atölye. Küçük Yuvarlak Robot, derin mavi gözleriyle tahta bir taburede oturmuş, uğultulu bir ampulü kurcalıyor. Pencerenin dışında, yağmur sesi makinelerin hafif uğultusuyla karışıyor.
- Sinematografi: Orta yakın çekim, yavaş takip çekimi; 35 mm sanal lens, sığ alan derinliği; tepeden gelen sıcak ana ışık, pencereden gelen soğuk dolgu ışığı; hafif gerilim içeren nazik, çocuksu atmosfer.
- Eylem sırası: Ampulü dokun → Kıvılcım → Şaşkınlıkla düşürme → Yavaş çekimde yakalama → Göğsü rahat bir nefesle boşaltma → “Neredeyse düşürüyordu… Yakaladığım için mutluyum” diye fısıldama.
- Arka plan sesleri: Yağmur, sarkaç, hafif mekanik uğultu ve filament gürültüsü.
Örnek 2|1970’ler Romantik Drama (35 mm)
- Stil: Doğal lens parlamaları, yumuşak odak, sıcak renk parlamaları, ince gate-weave ve elde çekim mikro titremesi; Kodak tarzı gren ve hafif vinyetleme.
- Sahne: Altın saat ışığıyla yıkanmış bir çatı; beyaz çarşaflar rüzgarda dalgalanıyor, rengarenk ışıklar yumuşak bir uğultu çıkarıyor; kırmızı ipek etekli bir kadın çıplak ayakla dans ediyor; kolları sıvamış, askıları eğri büğrü olan partneri, yükten kurtulmuş bir rahatlıkla gülümsüyor; şehrin uzaklarında, bir geminin siren sesi ve yeraltından gelen gürültü duyuluyor.
- Sinematografi: Zhongguang, göz seviyesinde sabit itme çekimi; 40 mm küresel lens; gökyüzünden nesneleri ayıran sığ alan derinliği; altın rengi doğal ana ışık + tungsten arka ışık + kenar aydınlatması için dize ışıkları; nostaljik, yumuşak, sinematik ton.
- Eylem ve diyalog: Dönen etek ışığı yakalar; “Gördün mü? Bu gece bu şehir bile bizimle dans ediyor.” —Partner elini tutar, eğilir— “Çünkü sen liderlik ediyorsun.” —Çarşaflar çerçeveyi kaplar, bir an için ufku gizler, sonra ayrılır.
- Ortam sesleri: rüzgar, kumaş hışırtısı, sokak gürültüsü ve uzaktaki müzik; fon müziği yok.
Özet
- İçeriği (komut istemi) tanımlamadan önce konteyneri (API senaryolarına uygulanabilir parametreler) tanımlayın; daha kısa çekimler daha fazla kararlılık sağlar.
- Net sinematografik dil (kamera konumlandırma/alan derinliği/aksiyon ritmi/ışıklandırma ve renk paleti sabitleri) = daha tutarlı sonuçlar.
- Marka/karakter/sahne tutarlılığını sağlamak için referans görüntüyü ilk karenin bağlantı noktası olarak kullanın.
- Küçük, hızlı adımlarla yeniden düzenleyin, her seferinde bir öğeyi değiştirin ve nihai stil elde edilene kadar istikrarlı bir şekilde tekrarlayın.
Diğer güncellemeler
GPT-5 Pro API
GPT-5 Pro artık API üzerinden kullanılabilir. İşlem süresi daha uzun olacak, böylece en zorlu görevleri yerine getirebilecek.
Fiyatlandırma da 1 milyon token başına 15/120 dolar (giriş/çıkış) ile oldukça caziptir.
Codex artık tamamen kullanılabilir durumda
Codex artık tamamen kullanıma hazır ve üç önemli özelliği piyasaya sürüyor:
- **Slack entegrasyonu**: Kanallar/konular içinde görevleri atamak ve bulut tabanlı sonuçlara geri bağlantı kurmak için doğrudan @Codex kullanın.
- **Codex SDK**: CI/CD boru hatları ve kabuk ortamlarında GitHub Actions ve CLI yürütme özelliklerine sahip TypeScript’te ilk sürüm. Codex CLI’dan türetilen ajanları kendi iş akışlarınıza yerleştirerek yapılandırılmış çıktı ve oturum sürekliliği sağlayın.
- **Yönetici Araçları**: CLI/IDE/Web arayüzleri üzerinden ortam yönetimi, yönetilen yapılandırma ve operasyonel izleme, kullanım metrikleri ve kalite inceleme panoları.
Ağustos başından bu yana günlük kullanım on kat arttı ve GPT-5-Codex, lansmanından sonraki üç hafta içinde 40 trilyon token hizmet verdi. OpenAI mühendisleri bunu neredeyse evrensel olarak kullanıyor, haftalık PR birleştirmeleri %70 arttı ve PR’ler neredeyse tamamen otomatik incelemeye tabi tutuluyor. Slack entegrasyonu ve SDK’lar artık Plus/Pro/Business/Edu/Enterprise katmanları için kullanılabilir, ayrıca Business/Edu/Enterprise için yeni yönetim özellikleri de mevcut. 20 Ekim’den itibaren Codex Cloud görevleri Codex kullanımına dahil edilecek.
Teknolojik etki
AgentKit’in genel amaçlı ajanların tüm dünyası üzerindeki etkisi, birçok kişinin fark ettiğinden çok daha büyük olabilir. ‘Ajan geliştirme’yi bir mühendislik sorunundan bir yapılandırma sorununa dönüştürerek, bizi programlama dilleri çağından akıllı ekosistemler çağına taşıyor (tıpkı ‘Linux çekirdeği yazmak’tan ‘iOS’a uygulama yüklemek’e geçiş gibi).
- **Platform Paradigması Değişimi**: AgentKit, orkestrasyon, etkileşim, değerlendirme ve güvenliği tek bir teknoloji yığını içinde birleştirerek, evrensel ajanların “yapı taşı mühendisliğini” “yapılandırma ve politika tasarımı”na yoğunlaştırır. Engellerin azalması hız avantajları sağlarken, aynı zamanda “özel çerçeve avantajlarının” (ör. LangChain, AutoGPT, CrewAI, Dify, n8n, Flowise, Dust vb.) hızla değer kaybetmesine de işaret etmektedir. .
- AgentKit’ten önce, evrensel bir ajan geliştirmek, özel bir bilgisayar monte etmeye benziyordu: modeller, komut istemleri, araçlar, değerlendirme ölçütleri ve arayüzler — hepsi bağlantıları kendiniz lehimlemenizi gerektiriyordu. Her şirket, ajan çerçeveleri için “standart arayüzleri” tanımlamaya çalışarak kendi “mini ekosistemini” oluşturdu.
- Orkestrasyon mantığı, kullanıcı arayüzü ve değerlendirme, model ekosistemine dahil edildi. AI ekibi daha önce bir boru hattını kurmak için haftalarca uğraşırken, artık birkaç bileşeni sürükleyip bırakarak bunu birkaç saat içinde halledebiliyor.
- **Anlamsal standartlar netleşiyor**: “dağıtılabilir ajan” tanımı artık araç çağırma, bağlam ve bellek, koruyucu politikalar ve regresyon testlerinden oluştuğu şeklinde kodlanmıştır. Standardizasyon, karşılaştırılabilirliği ve sürdürülebilirliği artırırken, çerçeve katmanındaki çeşitliliği azaltarak inovasyonun odağını “çerçeve yapımı”ndan “davranış ve süreç mühendisliği”ne kaydırmaktadır.
- Çerçeve katmanı kısa vadede çözümlerin çoğalmasına tanık olacak, ancak uzun vadede platform standartları tarafından kapsanacaktır. Bundan böyle rekabet, “kaç arayüz entegre ettiğim” değil, “geliştirdiğim akıllı ajanların gerçek dünya operasyonlarında nasıl kararlar aldığı, kaynakları nasıl dağıttığı ve sonuçları nasıl sunduğu” üzerine odaklanacaktır.
- **Model ve ajan arasındaki sınır bulanıklaşıyor**: RFT, özel araç çağrıları ve özel derecelendirme araçları, stratejileri ve çağırma zamanlamasını modelin içine yerleştirerek ajanları “gömülü politikalar içeren model durumları”na daha çok benzetiyor. Gelecekte aktarılabilir varlıklar artık metinler değil, veri kümeleri, derecelendirme araçları, strateji paketleri ve bağlayıcılar olacak.
- **Ekosistem Yeniden Dağılımı**: Evrensel aracı çerçevesinin avantajı daralıyor ve değer her iki uca da geri dönüyor:
- “Çoklu model/kendi kendine barındırma/veri egemenliği” için altyapı oluşturun.
- Derin dikey senaryo stratejileri ve bilgi mühendisliği peşinde olun. Platformun çekirdeği zekayı yönetirken, dış sistemler süreçleri ve yönetişimi yönetir.
- **Rekabet Odaklılık Değişimi**: UI (sohbet tarzı diyalog) ve orkestrasyon modelleri (sürükle ve bırak iş akışları) birbirine yaklaştıkça, belirleyici faktörler şunlar haline geliyor: araç haritası tasarımı, veri ve değerlendirme sistemi kalitesi, alan bilgisi birikimi ve risk-maliyet eğrisi yönetimi. Küçük ekipler, büyük oyuncularla eşit mühendislik koşullarında rekabet edebilirler; bu rekabet, stratejik yoğunluk ve veri varlıklarında yatmaktadır.
-
ChatKit, Open WebUI gibi sohbet tarzı diyaloglar üzerinde de kısmi bir etkiye sahip olacaktır.
-
- **Kilitlenme ve tersine çevrilebilirlik arasındaki denge**: Entegrasyon kolaylık sağlar, ancak platform bağımlılığını artırır — her zaman acil durum seçeneklerini elinizde bulundurun (çok cazip ancak zorlu). Arayüzlerin değiştirilebilirliğini, veri taşınabilirliğini ve harici otomasyonun kendi kontrolünüz altında kalmasını sağlayın.
- **Ajan Ekonomisine Doğru**: Bireysel ajanlar standartlaştırıldığında, ölçülebilir ve birleştirilebilir hale geldiğinde, bir sonraki adım “Ajanlar Arası İşbirliği Protokolleri” (Google’ın A2A protokolü?) ve ticarete konu edilebilir yetenek pazarlarını içerir. Kazananlar artık yalnızca model performansı ile değil, işbirliği kurallarını, paylaşılan belleği ve uzlaşma mekanizmalarını (Ajan Ticareti protokolleri) tanımlayan “işletim sistemi” ile de belirlenecektir.
- …
En çarpıcı gözlem: dünya çapında bilgi modelleri (GPT ve Gemini gibi) etkilerini hızla genişletiyor. Bir model üst düzey zekaya sahip olduğunda, gerçekten her şeyi bir kenara süpürebilir. Daha önce, platformlar oluşturmanın ve ekosistemleri beslemenin yerinden edilmeye karşı daha fazla direnç sağladığı görüşündeydi. Ancak AgentKit’in n8n gibi iş akışı araçlarını bozduğunu görmek, güvenimi sarsmaya başladı (n8n öncelikle sıkıcı, tekrarlayan görevleri yerine getirir ve entegrasyon yoluyla erişimini genişletir – onun bir hendek olarak gördüğü şey aslında bir yanılsama olabilir)…
Referanslar
[4]**Shared Payment Token API**:*https://docs.stripe.com/agentic-commerce/concepts/shared-payment-tokens*Paylaşımlı Ödeme Jetonu API:https://docs.stripe.com/agentic-commerce/concepts/shared-payment-tokens
[5]**Agentic Commerce**:*https://developers.openai.com/commerce*Ajan Ticareti:https://developers.openai.com/commerce
[6]**AgentKit**:*https://openai.com/index/introducing-agentkit*
[7]**Agent Builder**:*https://platform.openai.com/docs/guides/agent-builder*Ajan Oluşturucu: https://platform.openai.com/docs/guides/agent-builder
[8]**Global Admin Console**:*https://help.openai.com/en/articles/12289294-coming-soon-global-admin-console*Global Yönetim Konsolu:https://help.openai.com/en/articles/12289294-coming-soon-global-admin-console
[9]**Guardrails**:*https://guardrails.openai.com*
[10]**chatkit-python**:*https://github.com/openai/chatkit-python*
[11]**chatkit-js**:*https://github.com/openai/chatkit-js*
[12]**ChatKit Starter Template**:*https://github.com/openai/openai-chatkit-starter-app*ChatKit Başlangıç Şablonu:https://github.com/openai/openai-chatkit-starter-app
[13]**OpenAI ChatKit Advanced Samples**:*https://github.com/openai/openai-chatkit-advanced-samples*OpenAI ChatKit Gelişmiş Örnekleri:https://github.com/openai/openai-chatkit-advanced-samples
[14]**OpenAI Agents SDK**:*https://github.com/openai/openai-agents-python*
[15]**ChatKit Studio**:*https://chatkit.studio*
[16]**shadcn**:*https://github.com/shadcn-ui/ui*
[17]**chatkit.world**:*https://chatkit.world*
[18]**Reinforcement fine-tuning**:*https://platform.openai.com/docs/guides/reinforcement-fine-tuning*Güçlendirme ince ayarı:https://platform.openai.com/docs/guides/reinforcement-fine-tuning
[19]**Sora 2 Prompting Guide**:*https://cookbook.openai.com/examples/sora/sora2_prompting_guide*Sora 2 Uyarı Kılavuzu:https://cookbook.openai.com/examples/sora/sora2_prompting_guide
[20]**Video generation with Sora**:*https://platform.openai.com/docs/guides/video-generation*Sora ile video oluşturma:https://platform.openai.com/docs/guides/video-generation
[21]**LangChain**:*https://github.com/langchain-ai/langchain*
[22]**AutoGPT**:*https://github.com/Significant-Gravitas/AutoGPT*
[23]**CrewAI**:*https://github.com/crewAIInc/crewAI*
[24]**Dify**:*https://github.com/langgenius/dify*
[25]**n8n**:*https://github.com/n8n-io/n8n*
[26]**Flowise**:*https://github.com/FlowiseAI/Flowise*
[27]**Dust**:*https://github.com/dust-tt/dust*
[28]**Open WebUI**:*https://github.com/open-webui/open-webui*WebUI’yi açın:https://github.com/open-webui/open-webui
[29]**A2A**:*https://a2a-protocol.org*