Programcı Metinden Yüz Çizmek İçin Yapay Zekayı Eğitiyor

T2F eğitimi zaman aşımı

Programcı Animesh Karnewar, kitaplarda anlatılan karakterlerin gerçekte nasıl görüneceğini bilmek istedi ve bu kurgusal insanları doğru şekilde oluşturup oluşturamayacağını görmek için yapay zekaya yöneldi. T2F adı verilen araştırma projesi, metni kodlamak ve yüz görüntülerini sentezlemek için üretken bir rakip ağ (GAN) kullanıyor.

Basitçe söylemek gerekirse, bir GAN şunlardan oluşur: Birbirleriyle tartışan iki sinir ağı En iyi sonuçları üretmek için. Örneğin, 1 No'lu ağın görevi, 2 No'lu ağı, işlenmiş bir görüntünün gerçek bir fotoğraf olduğuna inandırarak kandırmaktır; 2 No'lu ağ ise, iddia edilen fotoğrafın yalnızca işlenmiş bir görüntü olduğunu kanıtlamak için yola çıkar. Bu ileri geri işlem, 2 numaralı ağ sonunda kandırılıncaya kadar işleme sürecine ince ayar yapar.

Önerilen Videolar

Karnewar projeye bir Kopenhag Üniversitesi'ndeki araştırmacılar tarafından sağlanan Face2Text adlı veri seti400 rastgele görüntü için doğal dil açıklamalarını içeren.

"Görüntülerdeki kişilere yönelik isteksiz ve alakasız altyazıları kaldırmak için açıklamalar temizlendi" diye yazıyor. "Bazı açıklamalar yalnızca yüz özelliklerini tanımlamakla kalmıyor, aynı zamanda resimlerden bazı ima edilen bilgileri de sağlıyor."

Karnewar'ın T2F projesinden elde edilen sonuçlar tam olarak fotogerçekçi olmasa da bu bir başlangıç. Yukarıda gömülü olan video, GAN'ın çizimleri oluşturmak için nasıl eğitildiğine dair zaman aşımlı bir görünümü gösterir metinden, düz renkli bloklarla başlayıp kaba ancak tanımlanabilir piksellerle biten renderlar.

Karnewar, "Daha yüksek çözünürlüklerde (32 x 32 ve 64 x 64) oluşturulan örneklerin, daha düşük çözünürlüklerde oluşturulan örneklerle karşılaştırıldığında daha fazla arka plan gürültüsüne sahip olduğunu buldum" diye açıklıyor. “Veri miktarının yetersiz olmasından dolayı algılıyorum (sadece 400 görsel).”

Rakip ağları eğitmek için kullanılan tekniğe “GAN'ların Aşamalı BüyümesiBu, zaman içinde kaliteyi ve istikrarı artırır. Videoda gösterildiği gibi görüntü oluşturucu son derece düşük bir çözünürlükten başlıyor. Yeni katmanlar yavaş yavaş modele dahil edilir ve eğitim zaman içinde ilerledikçe ayrıntılar artar.

"GAN'ların Aşamalı Büyümesi, GAN'ları daha hızlı ve daha istikrarlı bir şekilde eğitmek için olağanüstü bir tekniktir" diye ekliyor. "Bu, diğer makalelerden gelen çeşitli yeni katkılarla birleştirilebilir."

Sunulan bir örnekte, metin açıklamasında 20'li yaşlarının sonlarında, uzun kahverengi saçları bir tarafa doğru toplanmış, nazik yüz hatlarına sahip ve makyajsız bir kadın gösterilmektedir. O "gündelik" ve "rahat". Başka bir açıklama, 40'lı yaşlarında, uzun yüzlü, çıkık burunlu, kahverengi gözlü, geriye doğru saç çizgisi ve kısa bıyıklı bir adamı göstermektedir. Nihai sonuçlar son derece pikselli olsa da, son görüntüler, yapay zekanın nasıl kullanıldığı konusunda büyük ilerleme gösteriyor. sıfırdan yüzler oluşturabilir.

Karnewar, Flicker8K ve Coco altyazıları gibi ek veri kümelerini entegre edecek şekilde projeyi genişletmeyi planladığını söyledi. Sonunda T2F, diğer uygulamaların yanı sıra, metin açıklamalarına dayalı olarak mağdurları ve/veya suçluları tespit etmek için kolluk kuvvetleri alanında kullanılabilir. Projeye yönelik öneri ve katkılara açıktır.

Koda erişmek ve katkıda bulunmak için, Karnewar'ın Github'daki deposuna buradan gidin.

Editörlerin Önerileri

  • Bilim insanları yapay zekayı kullanıyor. yapay insan genetik kodu oluşturmak
  • Yapay zekanın yükselişini yeniden gözden geçirmek: Yapay zeka 2010'dan bu yana ne kadar ilerleme kaydetti?
  • Intel ve Facebook, Cooper Lake'e yapay zeka desteği sağlamak için iş birliği yapıyor

Yaşam tarzınızı yükseltinDigital Trends, en son haberler, eğlenceli ürün incelemeleri, anlayışlı başyazılar ve türünün tek örneği olan ön bakışlarla okuyucuların teknolojinin hızlı tempolu dünyasını takip etmelerine yardımcı olur.