Google, metin tabanlı komutlar aracılığıyla daha gerçekçi görüntüler ve videolar oluşturmanıza yardımcı olacak Lumiere adlı yeni bir üretken yapay zeka aracını tanıttı.
Lumiere’in öne çıkan özelliklerinden biri, gerçekçi görünen ve içinde dalgalanma olmayan hareketler yaratabilmesi. Bu, ana kareleri fiilen kullanmak ve ardından onları hareketin nasıl olması gerektiğini öğrenecek şekilde eğitmek yerine, tüm video karelerini aynı anda oluşturan yazılım sayesinde mümkün oluyor.
Lumiere ayrıca görüntü oluşturmasına yardımcı olan yayılma olasılık modellerini de kullanıyor. Bu bir Uzay-Zaman U-Net ile birleştirilmiş durumda. U-Net, görsellere eklenen dikkat blokajlarının yanı sıra zamansal yukarı ve aşağı ölçeklendirmeyi de getiren bir mimari görevi görüyor. En iyi yanı, bu yeni üretken yapay zeka aracının diğer birçok modelle birlikte kullanılabilmesi ve bu da daha önce gördüğümüz her şeyden çok daha gerçekçi görünecek görüntüler ve videolar oluşturmaya yardımcı olacak olması.
Lumiere aşağıdakileri oluşturmak için kullanılabiliyor:
- Sinemagraflar: Bir görüntünün tek bir bölümünün canlandırıldığı yer
- İç boyama: Videodaki bir nesnenin başka bir nesneyle değiştirilmesi
- Stilize nesil: Herhangi bir yaratımın sanat tarzı başka bir şeye dönüştürülebilir
- Resimden videoya: İstenilen herhangi bir resmin canlandırılmasına yardımcı olur
- Videodan videoya: Kullanıcıların farklı bir sanat tarzında videolar oluşturmasına olanak tanır
Şu an için video uzunluğu yalnızca 5 saniye uzunluğunda. Ayrıca video geçişleri ve çoklu kamera açıları oluşturma yeteneği mevcut değildi. Ayrıca Lumiere’yi denemek istiyorsanız bunu standart bir GPU ile yapamayacağınızı da belirtelim.