Metinden videoya: Gündemdeki teknoloji Sora nedir? – Teknoloji

OpenAl’ın geçen hafta tanıttığı ve yazılı komutlarla gerçekçi görüntüler oluşturabilen modeli “Sora”, yapay zekayla ürün oluşturma teknolojilerinin sınırları zorlanırken ultra gerçekçi fotoğraf ve videolar üretmeyi vadediyor. İşte henüz deneme aşamasında olan teknolojiyle ilgili bilinenler:

SORA NEDİR?

Sora, OpenAl’nin metin komutlarıyla gerçekçi ve yaratıcı sahneler oluşturabilen yapay zeka modeli. OpenAI Sora’nın “metinden videoya” yapay zeka modeli olduğunu; kullanıcıların isteklerine bağlı olarak ve görsel kaliteyi koruyarak bir dakikaya kadar uzunlukta videolar oluşturabileceğini söylüyor.  “Metinden videoya”, Sora’nın metin ipuçlarını alıp bunları kısa video kliplere dönüştürmesi anlamına geliyor. Model şu an için geri bildirim almak üzere bir dizi görsel sanatçı, tasarımcı ve film yapımcısının erişimine açıldı.

  • AA’nın incelemesine göre yapay zeka araçlarından DALL-E’nin versiyonları gibi çeşitli eserler üreten yapay zeka modeli Sora, bilinen yapay zeka video üretim modellerinin çok daha ilerisinde bir kalite sunmayı hedefliyor.
  • Henüz deneme aşamasında bulunan model OpenAI’nin iddiasına göre mevcut durumda neredeyse mükemmele yakın, gerçekçi veya animasyon videoları ile bir dakikaya kadar yüksek kaliteli videolar oluşturabiliyor.
  • Hem yazılı komut hem de bir fotoğraftan geniş ekranda 1920×1080 piksel, dikey olarak 1080×1920 piksel ölçekte ve kalitede video örnekleri sunabilen Sora, hem var olan görüntülerin devamına veya gerisine ekleme yapabiliyor hem de 2048×2048 piksel çözünürlükte fotoğraflar üretebiliyor.
  • Bu özellik, Sora’ya farklı cihazlar için doğrudan kendi yerel en ve boy oranlarında içerik oluşturmasına olanak sağlıyor.

En önemli özelliklerinden biri görüntülerdeki tutarlılık

  • Sora’nın en önemli özelliklerinden biri, oluşturduğu görüntülerdeki tutarlılık. Yapay zeka modeli tarafından üretilen, video boyunca tutarlı görünüme sahip görüntülerdeki insan veya diğer cisimler, kareden çıksalar bile kamera ögeye döndüğünde bu tutarlılığını koruyabiliyor. Sora’nın diğer bir önemli özelliği, videodaki ögelerin gerçek hayattaki fiziki hareketlerini taklit ederek hem görsel hem de mantıksal olarak gerçekçi videolar oluşturabilmesi.
  • DALL-E 3’e benzer şekilde Sora da kullanıcı istemlerini doğru şekilde takip eden yüksek kaliteli videolar üretirken ChatGPT’den yararlanıyor. Girdi olarak görüntü ve komut istemi sağlandığında video oluşturabilen Sora’ya önceden var olan resim veya videolar gibi başka girdiler de sorulabiliyor.
  • Girdi olarak sağlanan videoları zamanda ileri veya geriye doğru genişletme yeteneği bulunan Sora, ayrıca tamamen farklı konu ve sahne kompozisyonlarına sahip videolar arasında kesintisiz geçişler oluşturmak için de kullanılıyor.
  • Sora, kameranın kayması ve dönmesiyle insanlar ve sahne ögelerinin de 3 boyutlu ortamda tutarlı şekilde hareket etmelerini sağlayan dinamik kamera hareketine sahip videolar oluşturabiliyor.
  • Birden fazla karakter, spesifik hareket biçimleri ve arka plana ilişkin ayrıntıların bulunduğu karmaşık sahneler oluşturma özelliğine sahip Sora, bunların yanı sıra yalnızca kullanıcının komutuna bağlı kalmıyor, aynı zamanda objelerin fiziksel dünyada nasıl hareket ettiklerini de anlıyor.
  • Dil konusundaki yetenekleri de gelişmiş olan Sora, verilen komutları doğru anlayarak çeşitli duyguları ifade eden karakterler oluşturabiliyor.

Modelin zayıf noktaları

  • Öte yandan Sora’nın bazı zayıf yönleri ve eksiklikleri de bulunuyor.
  • Yemek yeme gibi eylemlere yer verilen videolarda, kullanılan nesnenin durumunda her zaman doğru değişiklikler olmuyor. Örneğin, ısırılan kurabiyede ısırık izinin olmaması gibi hatalar verebiliyor.
  • Diğer bir örnekse cam kırılması gibi birçok temel etkileşimin fiziğini doğru şekilde modelleyemiyor.
  • Sora’nın bir başka kusurunun da yönleri karıştırabilmesi ve belirli bir kamera açısını takip etmekte zorlanması olduğu belirtiliyor.

Bazı içerikler yasaklanacak

  • Yapay zeka tarafından üretilen videoların “dolandırıcılık, propaganda ve yanlış bilgilendirme” gibi alanlarda kullanılabileceği yönündeki endişeler de sürüyor.
  • Sora’da aşırı şiddet, cinsel içerik, nefret görüntüleri ve ünlü simaların kullanıldığı içeriklerin yasak olacağını duyuran OpenAI, modeli kullanıma sunmadan önce önemli güvenlik önlemleri üzerinde çalışıldığını bildirdi.
  • Ayrıca, bu modele ilişkin oluşabilecek problemleri anlamak amacıyla dünyanın dört bir yanından politikacılar, eğitimciler ve sanatçılarla görüşüleceği ifade ediliyor.

SORA HAKKINDA BİR GÖRÜŞ

CNN’e konuşan Pazar araştırma şirketi ABI Research’ün kıdemli analistlerinden Reece Hayden’a göre  “çok modlu modeller” yeni olmasa da ve metinden videoya modeller zaten mevcut olsa da, bunu diğerlerinden ayıran şey OpenAI’nin Sora’nın sahip olduğunu iddia ettiği uzunluk ve doğruluk.

Hayden, bu tür yapay zeka modellerinin, kanallar arasında yayınlanan yeni kişiselleştirilmiş içeriklerle dijital eğlence pazarları üzerinde büyük bir etkisi olabileceğini söyledi.

Hayden, “TV’de anlatıları desteklemek için kısa sahneler oluşturmak için bariz bir kullanım alanı var. Bu model hala sınırlı olsa da pazarın yönünü gösteriyor” diyor. 

OpenAI’nin son mesajları şimdilik güvenlik üzerine odaklanmış durumda. 

Sora Ne Zaman Herkese Açık Olacak?

Bu sorunun yanıtı henüz bilinmiyor. Çünkü Sora için şu anda paylaşılmış bir çıkış tarihi yok. OpenAI genel kullanıma ne zaman sunulabileceğine dair bir ipucu paylaşmadı. Bu yıl piyasaya sürüleceğine dair de henüz bir gösterge yok.

ÖRNEK VİDEOLAR

Bu haberide en üstte yer alan videoda, OpenAİ’nin Sora tarafından hazırlandığını duyurduğu videolardan örnekler görüyorsunuz. Aşağıdaki video da yine Sora tarafından hazırlanmış. Video için girilen metin komutu ise şöyle olmuş: “Kırmızı yünlü örme motosiklet kaskı takan 30 yaşındaki uzay adamının maceralarını, mavi gökyüzünü, tuzlu çölü, sinema tarzını, 35mm filme çekilmiş, canlı renkleri içeren bir film fragmanı.”
 

 

 

Umarız işinize yarayan bir içerik olmuştur

Yorum yapın