Draqon
Aktif Üye
Tıklayın, sürükleyin, bırakın, tamamlayın, görüntü düzenleme bu kadar kolay olabilir. Max Planck Bilgisayar Bilimleri Enstitüsü, Saarbrücken Görsel Hesaplama, Etkileşim ve Yapay Zeka Araştırma Merkezi (VIA), MIT CSAIL ve Pennsylvania Üniversitesi’nden araştırmacılar, yüz ifadeleri, pozlar, bakış açıları ile yapay zeka destekli bir görüntü işleme yöntemi sundular. ve fotoğraflardaki diğer özellikler, sürükle ve bırak kullanılarak esnek bir şekilde kontrol edilebilir. Photoshop ve diğer programlarda fotogerçekçi içeriği düzenlemek daha önce çok fazla beceri gerektirirken, DragGAN ile bir fotoğrafta başlangıç ve bitiş noktalarını işaretlemek, örneğin gülümsemek, duruşu ayarlamak, giysiyi uzatmak veya perspektifi döndürmek için yeterlidir. GAN, işaretlenen noktaları takip eder ve görüntü içeriği insanlar, hayvanlar, manzaralar veya araçlar gibi önceden eğitilmiş kategorilere karşılık geldiği sürece istenen değişikliklere karşılık gelen görüntüler üretir.
Reklamcılık
Maskeleme, GAN’ın işleyebileceği görüntü bölgelerini tanımlamak için DragGAN’da kullanılabilir. Örnekte bu, köpeğin yalnızca başını çevirmesini ve tüm görüntü perspektifinin ayarlanmadığını garanti eder.
(Resim: Bilişim için MPI)
Photoshop & Co.’nun geleceği?
Bilim adamları, bilgisayar için yayınlarında, “Bu manipülasyonlar, bir GAN’ın öğrenilmiş üretken görüntüleri üzerinde gerçekleştirildiğinden, belirsiz içerik halüsinasyonu ve nesnenin katılığını tutarlı bir şekilde takip eden deforme şekiller gibi zor senaryolarda bile gerçekçi sonuçlara yol açıyorlar” diye yazıyor. İlgili tarafların örneğin arXiv’den indirebilecekleri grafik fuarı SIGGRAPH23 Ağustos’ta. Mayıs ayında duyurulduğunda DragGAN’ı kendiniz deneyemezdiniz, Max Planck Bilgisayar Bilimleri Enstitüsü’nün DragGAN web sitesinden yalnızca örnek videoları izleyebilirdiniz:
Önerilen Haber Amaçlı İçerik
İzninizle buraya harici bir video (Kaltura Inc.) yüklenecektir.
Her zaman video yükle
videoyu şimdi yükle
DragGAN ile hayvanların pozları gerçekçi bir şekilde ayarlanabilmektedir.
(Kaynak: Bilişim için MPI)
Önerilen Haber Amaçlı İçerik
İzninizle buraya harici bir video (Kaltura Inc.) yüklenecektir.
Her zaman video yükle
videoyu şimdi yükle
Giysinin uzunluğu da DragGAN ile fotogerçekçi olarak manipüle edilebilmelidir.
(Kaynak: Bilişim için MPI)
Reklamcılık
Önerilen Haber Amaçlı İçerik
İzninizle buraya harici bir video (Kaltura Inc.) yüklenecektir.
Her zaman video yükle
videoyu şimdi yükle
Yüz ifadeleri, saç ve dönüş de ayarlanabilirken DragGAN, GAN’ın görüntünün yalnızca belirli kısımlarını dikkate alması için maskelemeyi destekler.
(Kaynak: Bilişim için MPI)
Mayıs ayında duyurulduğu üzere baş yazar Xingang Pan, kaynak kodunu GitHub’da yayınladı ve Hugging Face, OpenXLab ve Google Colab’da deneyler için demolar sağladı. Birkaç gündür OpenGVLab’den resmi olmayan bir DragGAN uygulaması da var. Diğer birçok proje gibi, DragGAN da makine öğrenimi için optimize edilmiş Python kitaplığı PyTorch’u kullanır. Şu ana kadar donanım gereksinimleri hakkında hiçbir şey bilinmiyor. Yazarlar basitçe şunu yazıyor: “Yaklaşımımızın verimliliği sayesinde, kullanıcıların yalnızca birkaç saniye beklemesi gerekiyor ve tatmin olana kadar düzenlemeye devam edebiliyorlar.” DragGAN hala erken bir aşamadadır, bu nedenle sonuçların kalitesi, belirli bir tahmin etme yeteneğine rağmen, şu anda eğitim verilerinin çeşitliliğinden etkilenmektedir.
Kural olarak, DragGAN’ın amacı gerçekçi sonuçlar vermektir, ancak diğer içerikleri de halüsinasyona uğratabilir.
(Resim: Bilişim için MPI)
güncellemeler
06/29/2023
21:24
Saat
Kaynak kodu sürümü hakkında bilgi eklendi.
(vza)
Haberin Sonu
Reklamcılık
Maskeleme, GAN’ın işleyebileceği görüntü bölgelerini tanımlamak için DragGAN’da kullanılabilir. Örnekte bu, köpeğin yalnızca başını çevirmesini ve tüm görüntü perspektifinin ayarlanmadığını garanti eder.
(Resim: Bilişim için MPI)
Photoshop & Co.’nun geleceği?
Bilim adamları, bilgisayar için yayınlarında, “Bu manipülasyonlar, bir GAN’ın öğrenilmiş üretken görüntüleri üzerinde gerçekleştirildiğinden, belirsiz içerik halüsinasyonu ve nesnenin katılığını tutarlı bir şekilde takip eden deforme şekiller gibi zor senaryolarda bile gerçekçi sonuçlara yol açıyorlar” diye yazıyor. İlgili tarafların örneğin arXiv’den indirebilecekleri grafik fuarı SIGGRAPH23 Ağustos’ta. Mayıs ayında duyurulduğunda DragGAN’ı kendiniz deneyemezdiniz, Max Planck Bilgisayar Bilimleri Enstitüsü’nün DragGAN web sitesinden yalnızca örnek videoları izleyebilirdiniz:
Önerilen Haber Amaçlı İçerik
İzninizle buraya harici bir video (Kaltura Inc.) yüklenecektir.
Her zaman video yükle
videoyu şimdi yükle
DragGAN ile hayvanların pozları gerçekçi bir şekilde ayarlanabilmektedir.
(Kaynak: Bilişim için MPI)
Önerilen Haber Amaçlı İçerik
İzninizle buraya harici bir video (Kaltura Inc.) yüklenecektir.
Her zaman video yükle
videoyu şimdi yükle
Giysinin uzunluğu da DragGAN ile fotogerçekçi olarak manipüle edilebilmelidir.
(Kaynak: Bilişim için MPI)
Reklamcılık
Önerilen Haber Amaçlı İçerik
İzninizle buraya harici bir video (Kaltura Inc.) yüklenecektir.
Her zaman video yükle
videoyu şimdi yükle
Yüz ifadeleri, saç ve dönüş de ayarlanabilirken DragGAN, GAN’ın görüntünün yalnızca belirli kısımlarını dikkate alması için maskelemeyi destekler.
(Kaynak: Bilişim için MPI)
Mayıs ayında duyurulduğu üzere baş yazar Xingang Pan, kaynak kodunu GitHub’da yayınladı ve Hugging Face, OpenXLab ve Google Colab’da deneyler için demolar sağladı. Birkaç gündür OpenGVLab’den resmi olmayan bir DragGAN uygulaması da var. Diğer birçok proje gibi, DragGAN da makine öğrenimi için optimize edilmiş Python kitaplığı PyTorch’u kullanır. Şu ana kadar donanım gereksinimleri hakkında hiçbir şey bilinmiyor. Yazarlar basitçe şunu yazıyor: “Yaklaşımımızın verimliliği sayesinde, kullanıcıların yalnızca birkaç saniye beklemesi gerekiyor ve tatmin olana kadar düzenlemeye devam edebiliyorlar.” DragGAN hala erken bir aşamadadır, bu nedenle sonuçların kalitesi, belirli bir tahmin etme yeteneğine rağmen, şu anda eğitim verilerinin çeşitliliğinden etkilenmektedir.
Kural olarak, DragGAN’ın amacı gerçekçi sonuçlar vermektir, ancak diğer içerikleri de halüsinasyona uğratabilir.
(Resim: Bilişim için MPI)
güncellemeler
06/29/2023
21:24
Saat
Kaynak kodu sürümü hakkında bilgi eklendi.
(vza)
Haberin Sonu