Google’ın Yeni Yapay Zekası, Videoları Ekran Boyutlarına Göre Otomatik Kırpıyor

Google'ın Yeni Yapay Zekası, Videoları Ekran Boyutlarına Göre Otomatik Kırpıyor


Bir videoyu herhangi bir mobil cihazda ya da ekran boyutu bambaşka olan cihazlarda izlerken kaç kez hatalı kırpıldığını gördünüz? Bu oldukça sinir bozucu bir durumdur ve bu konuda hangi önlemleri alırsanız alın bu hata sürekli tekerrür edecektir.

Bu sorunu çözmek için Google’ın Yapay Zeka ekibi, hedef cihaza veya boyuta (yatay, kare, portre ve benzeri) uyan videoyu yeniden düzenleyebilen açık kaynaklı bir çözüm olan AutoFlip isimli yapay zekayı geliştirdi.

Sol: Orijinal video (16: 9). 
Orta: Standart bir merkezi mahsul kullanılarak yeniden çerçevelendirildi (9:16). 
Sağ: AutoFlip (9:16) ile yeniden çerçevelendirildi. 
İlgilendiğiniz konuları algılayarak, AutoFlip önemli görsel içeriği kırpmaktan kaçınabilir.

Otomatik kaydırma üç aşamada çalışır: Çekim (sahne) algılama, video içerik analizi ve yeniden çerçeveleme. İlk bölüm, makine öğrenme modelinin bir kesimden veya bir sahneden diğerine atlanmadan önceki noktayı tespit etmesi gereken sahne algılamadır. Böylece renk ve eleman değişimini tespit etmek için bir kareyi bir öncekiyle karşılaştırır.

Google’ AutoFlip Yapay Zekasının üç aşaması

Google’ AutoFlip Yapay Zekasının üç aşaması

Model bir çekim belirlediğinde, bir sahnedeki önemli nesneleri belirlemek için video içerik analizine geçer. Sadece insanları veya hayvanları değil, sporda hareket ve hareket eden topları ve reklamlardaki logoları belirlemek için derin bir öğrenme sinir ağı kullanır.

Son aşamada, yapay zeka modeli, tek bir alanda gerçekleşen sahneler için sabit modu kullanıp kullanmayacağını veya ilgili nesnelerin sürekli hareket ettiği zamanları izleme modunu kullanıp kullanmayacağını belirler. Buna ve  videonun görüntülenmesi gereken hedef boyutlara dayanarak,  Otomatik Kaydırma titremeyi azaltırken ve ilgilenilen içeriği korurken kareleri kırpar.

Google AutoFlip’in misyonu çok büyük

Google araştırmacıları, Autoflip’in videoları fazla çaba harcamadan birçok formata ve ekrana dönüştürmek için kullanılabileceğini söyledi. Bir sonraki aşamada ekip , röportajlarda ve animasyon filmlerinde nesne izlemeyi geliştirmek istiyor . Ön plan ve arka plan nesnelerini tek bir kareye daha iyi yerleştirmek için metin algılama ve görüntü boyama tekniklerini kullanmak istiyor.

Disk Yazma Korumalı Nedir? Nasıl Çözülür