DeepMind Yeni, Hızlı Öğrenen Yapay Zeka Aracısıyla Gerçekdışılaşıyor

DeepMind - Denetimsiz Yardımcı Görevlerle Takviyeli Öğrenme

Google'ın DeepMind'ı bu hafta adında bir makale yayınladı: Denetimsiz Yardımcı Görevlerle Takviyeli ÖğrenmeYapay zekanın öğrenme hızını ve aracıların veya botların nihai performansını artırmaya yönelik bir yöntemi açıklayan. Bu yöntem, yapay zeka eğitilirken gerçekleştirilecek iki ana ek görevin eklenmesini içerir ve standart derin Temel olarak yapay zekanın kendi öğrenmesinden öğrendiği bir deneme-yanılma ödül/ceza yöntemi olan takviyeli öğrenmenin temeli hatalar.

Yapay zeka öğrenimini hızlandırmak için eklenen ilk görev, ekrandaki piksellerin nasıl kontrol edileceğini anlama yeteneğidir. DeepMind'a göre bu yöntem, bir bebeğin ellerini hareket ettirerek ve bu hareketleri izleyerek kontrol etmeyi öğrenmesine benzer. Yapay zeka durumunda, bot pikselleri kontrol ederek görsel girdiyi anlayacak ve böylece daha iyi puanlar elde edilecektir.

Önerilen Videolar

“Gözlemlediği kırmızının kümülatif miktarını en üst düzeye çıkarmayı öğrenen bir bebek düşünün. Optimum değeri doğru bir şekilde tahmin etmek için bebeğin, manipülasyon (kırmızı bir nesneyi gözlere yaklaştırmak) dahil olmak üzere çeşitli yollarla 'kızarıklığı' nasıl artıracağını anlaması gerekir; hareket (kırmızı bir nesnenin önünde hareket etmek); ve iletişim (ebeveynler kırmızı bir nesne getirene kadar ağlamak)," DeepMind'ın makalesinde belirtiliyor. "Bu davranışların bebeğin daha sonra karşılaşabileceği birçok başka amaç için tekrar etmesi muhtemeldir."

İlgili

  • Bu bot seni Pictionary'de yok edecek. Bu aynı zamanda A.I. için de büyük bir dönüm noktasıdır.
  • Google'ın DeepMind'ı, Waymo'nun StarCraft II botları gibi sürücüsüz arabalarını eğitiyor
  • Google yapay zekayı kullanmanın bir yolunu buldu. Rüzgar enerjisinin kullanışlılığını artırmak için

Eklenen ikinci görev, yapay zekayı, önceki eylemlerin kısa geçmişine dayanarak acil ödüllerin ne olacağını tahmin etmesi için eğitmek için kullanılıyor. Bunu mümkün kılmak için ekip, önceki ödüllendirici ve ödüllendirici olmayan geçmişleri eşit miktarlarda sağladı. Sonuçta yapay zeka, ödüllere yol açacak görsel özellikleri eskisinden daha hızlı keşfedebiliyor.

"Ajanlarımız, daha verimli bir şekilde öğrenmek amacıyla, eleştirmenlere ek güncellemeler sağlamak amacıyla bir deneyim tekrarlama mekanizması kullanıyor. Tıpkı hayvanların olumlu ya da olumsuz ödüllendirici olaylar hakkında daha sık rüya görmesi gibi, ajanlarımız da tercihen ödüllendirici olaylar içeren dizileri tekrar oynatıyor" diye ekliyor makale.

Önceki A3C aracısına eklenen bu iki yardımcı görevle ortaya çıkan yeni aracı/bot, ekibin Gerçekdışı (Denetimsiz Güçlendirme ve Yardımcı Öğrenme) adını verdiği şeye dayanıyor. Ekip bu botu sanal olarak 57 Atari oyununun ve ayrı bir oyunun önüne oturttu. Wolfenstein13 seviyeden oluşan labirent benzeri bir oyun. Tüm senaryolarda bota, yüzde 100 doğruluk için piksellere doğrudan erişim sağlayan ham RGB çıktı görüntüsü verildi. Unreal botu, uzaylıları vurmak gibi görevler için genel olarak ödüllendirildi. Uzay İstilacıları 3 boyutlu bir labirentte elmaları kapmak için.

Unreal bot, pikselleri kontrol edebildiğinden ve eylemlerin ödül üretip üretmeyeceğini tahmin edebildiğinden, DeepMind'ın önceki en iyi aracısından (A3C) 10 kat daha hızlı öğrenme kapasitesine sahiptir. Üstelik önceki şampiyona göre daha iyi performans sağlıyor.

Şirket, "Artık, dikkate aldığımız Labirent seviyelerinde ortalama yüzde 87'lik uzman insan performansına ulaşabiliyoruz ve bazılarında süper insan performansına ulaşabiliyoruz" dedi. "Atari'de temsilci artık ortalama 9 kat insan performansı elde ediyor."

DeepMind umutlu Unreal bot'ta yapılan çalışmanın, ekibin yakın gelecekte daha da karmaşık ortamlarla başa çıkmak için tüm ajanlarının/botlarının ölçeğini büyütmesine olanak tanıyacağını düşünüyoruz. O zamana kadar, yapay zekanın labirentlerde hareket ettiğini ve herhangi bir insan müdahalesi olmadan kendi başına elmaları yakaladığını gösteren yukarıda gömülü videoyu izleyin.

Editörlerin Önerileri

  • Satranç. Tehlike. Gitmek. Oyunları neden yapay zeka için referans olarak kullanıyoruz?
  • Yapay zekanın yükselişini yeniden gözden geçirmek: Yapay zeka 2010'dan bu yana ne kadar ilerleme kaydetti?
  • Google'ın DeepMind A.I. Quake III Capture the Flag'da insan rakipleri yener

Yaşam tarzınızı yükseltinDigital Trends, en son haberler, eğlenceli ürün incelemeleri, anlayışlı başyazılar ve türünün tek örneği olan ön bakışlarla okuyucuların teknolojinin hızlı tempolu dünyasını takip etmelerine yardımcı olur.