DragGAN: Sürükle ve bırak yoluyla yapay zeka destekli, fotoğraf gerçekliğinde görüntü işleme

Draqon

Aktif Üye
Tıklayın, sürükleyin, bırakın, tamamlayın, görüntü düzenleme bu kadar kolay olabilir. Max Planck Bilgisayar Bilimleri Enstitüsü, Saarbrücken Görsel Hesaplama, Etkileşim ve Yapay Zeka Araştırma Merkezi (VIA), MIT CSAIL ve Pennsylvania Üniversitesi’nden araştırmacılar, yüz ifadeleri, pozlar, bakış açıları ile yapay zeka destekli bir görüntü işleme yöntemi sundular. ve fotoğraflardaki diğer özellikler, sürükle ve bırak kullanılarak esnek bir şekilde kontrol edilebilir. Photoshop ve diğer programlarda fotogerçekçi içeriği düzenlemek daha önce çok fazla beceri gerektirirken, DragGAN ile bir fotoğrafta başlangıç ve bitiş noktalarını işaretlemek, örneğin gülümsemek, duruşu ayarlamak, giysiyi uzatmak veya perspektifi döndürmek için yeterlidir. GAN, işaretlenen noktaları takip eder ve görüntü içeriği insanlar, hayvanlar, manzaralar veya araçlar gibi önceden eğitilmiş kategorilere karşılık geldiği sürece istenen değişikliklere karşılık gelen görüntüler üretir.

Reklamcılık








Maskeleme, GAN’ın işleyebileceği görüntü bölgelerini tanımlamak için DragGAN’da kullanılabilir. Örnekte bu, köpeğin yalnızca başını çevirmesini ve tüm görüntü perspektifinin ayarlanmadığını garanti eder.


(Resim: Bilişim için MPI)



Photoshop & Co.’nun geleceği?


Bilim adamları, bilgisayar için yayınlarında, “Bu manipülasyonlar, bir GAN’ın öğrenilmiş üretken görüntüleri üzerinde gerçekleştirildiğinden, belirsiz içerik halüsinasyonu ve nesnenin katılığını tutarlı bir şekilde takip eden deforme şekiller gibi zor senaryolarda bile gerçekçi sonuçlara yol açıyorlar” diye yazıyor. İlgili tarafların örneğin arXiv’den indirebilecekleri grafik fuarı SIGGRAPH23 Ağustos’ta. Mayıs ayında duyurulduğunda DragGAN’ı kendiniz deneyemezdiniz, Max Planck Bilgisayar Bilimleri Enstitüsü’nün DragGAN web sitesinden yalnızca örnek videoları izleyebilirdiniz:


Önerilen Haber Amaçlı İçerik



İzninizle buraya harici bir video (Kaltura Inc.) yüklenecektir.



Her zaman video yükle

videoyu şimdi yükle



DragGAN ile hayvanların pozları gerçekçi bir şekilde ayarlanabilmektedir.



(Kaynak: Bilişim için MPI)




Önerilen Haber Amaçlı İçerik



İzninizle buraya harici bir video (Kaltura Inc.) yüklenecektir.



Her zaman video yükle

videoyu şimdi yükle



Giysinin uzunluğu da DragGAN ile fotogerçekçi olarak manipüle edilebilmelidir.



(Kaynak: Bilişim için MPI)




Reklamcılık


Önerilen Haber Amaçlı İçerik



İzninizle buraya harici bir video (Kaltura Inc.) yüklenecektir.



Her zaman video yükle

videoyu şimdi yükle



Yüz ifadeleri, saç ve dönüş de ayarlanabilirken DragGAN, GAN’ın görüntünün yalnızca belirli kısımlarını dikkate alması için maskelemeyi destekler.



(Kaynak: Bilişim için MPI)




Mayıs ayında duyurulduğu üzere baş yazar Xingang Pan, kaynak kodunu GitHub’da yayınladı ve Hugging Face, OpenXLab ve Google Colab’da deneyler için demolar sağladı. Birkaç gündür OpenGVLab’den resmi olmayan bir DragGAN uygulaması da var. Diğer birçok proje gibi, DragGAN da makine öğrenimi için optimize edilmiş Python kitaplığı PyTorch’u kullanır. Şu ana kadar donanım gereksinimleri hakkında hiçbir şey bilinmiyor. Yazarlar basitçe şunu yazıyor: “Yaklaşımımızın verimliliği sayesinde, kullanıcıların yalnızca birkaç saniye beklemesi gerekiyor ve tatmin olana kadar düzenlemeye devam edebiliyorlar.” DragGAN hala erken bir aşamadadır, bu nedenle sonuçların kalitesi, belirli bir tahmin etme yeteneğine rağmen, şu anda eğitim verilerinin çeşitliliğinden etkilenmektedir.




Ağzı açık ve bükülmüş bir araba lastiği olan bir aslan



Kural olarak, DragGAN’ın amacı gerçekçi sonuçlar vermektir, ancak diğer içerikleri de halüsinasyona uğratabilir.


(Resim: Bilişim için MPI)





güncellemeler


06/29/2023


21:24



Saat




Kaynak kodu sürümü hakkında bilgi eklendi.




(vza)



Haberin Sonu