Bot Pemutar Pictionary Ini adalah Tonggak Besar bagi A.I.

Seperti Keterampilan Alexa baru di Amazon Echo Anda, beberapa dekade terakhir ini telah terlihat A.I. secara bertahap dapatkan kemampuan untuk menjadi yang terbaik dalam kemanusiaan di lebih banyak game yang kita cintai: Catur dengan Deep Blue pada tahun 1997, Bahaya dengan IBM Watson pada tahun 2011, Game Atari dengan DeepMind pada tahun 2013, Pergi dengan AlphaGo pada tahun 2016, dan seterusnya. Setidaknya bagi masyarakat umum, setiap kejadian mengubah jalur abstrak kemajuan komputasi menjadi tontonan olahraga. Skynet semakin pintar. Bagaimana kami bisa tahu? Karena lihatlah semakin banyak hiburan yang secara meyakinkan dapat mengalahkan kita.

Isi

  • Membangun master Pictionary
  • Lebih dari yang terlihat

Dengan latar belakang tersebut, tidak terlalu mengejutkan mendengar bahwa A.I. sekarang dapat bekerja dengan sangat baik gambar, permainan tebak kata yang terinspirasi dari sandiwara yang mengharuskan satu orang menggambar dan orang lain mencoba mencari tahu apa yang telah mereka buat sketsanya secepat mungkin.

Video yang Direkomendasikan

Hal itulah yang baru-baru ini dilakukan oleh para peneliti dari Universitas Surrey di Inggris dengan penciptaan Pixelor, sebuah “sketsa A.I. agen." Diberi visual konsepnya, Pixelor mampu menggambar sketsa yang dapat dikenali (baik oleh manusia maupun mesin) sebagai subjek yang dituju dengan cepat — atau bahkan lebih cepat — daripada manusia. saingan.

Terkait

  • Bagaimana Nintendo dapat menggunakan A.I. untuk menghadirkan game 4K ke Switch Pro
  • Direktur Yakuza berpendapat evolusi PS5 akan fokus pada A.I. dan pembelajaran mesin

“A.I. agen dapat membuat sketsa dari awal,” Lagu Yi-Zhe, pembaca Computer Vision dan Machine Learning di Center for Vision Speech and Signal Processing di University of Surrey, mengatakan kepada Digital Trends. “Beri kata seperti 'wajah' dan ia akan tahu apa yang harus digambar. … Ia akan menggambar kucing yang berbeda, anjing yang berbeda, wajah yang berbeda, setiap saat. Tapi selalu dengan pengetahuan tentang cara memenangkan permainan Pictionary.”

Membangun master Pictionary

Mampu mereduksi gambar dunia nyata yang kompleks menjadi sebuah sketsa cukup mengesankan. Dibutuhkan tingkat abstraksi untuk melihat wajah manusia dan melihatnya sebagai oval dengan dua oval kecil untuk mata, garis untuk hidung, dan setengah lingkaran untuk mulut. Pada anak-anak, kemampuan untuk memahami suatu gambar dengan cara ini menunjukkan, antara lain, berkembangnya pemahaman konsep kognitif.

Namun, seperti banyak aspek AI lainnya, sering kali diringkas sebagai berikut Paradoks Moravec bahwa “masalah yang sulit itu mudah dan masalah yang mudah itu sulit”, ini merupakan tantangan yang signifikan bagi mesin kecerdasan — meskipun pada kenyataannya itu adalah keterampilan dasar yang biasa-biasa saja bagi sebagian besar anak berusia dua tahun anak-anak.

Lab SketsaX

Namun, ini bukanlah tantangan yang tidak bisa diselesaikan. Pada tahun 2016, kami menulis tentang karya Song dengan alat yang disebut Sketch, jaringan saraf pembelajaran mendalam yang mampu mengenali sketsa yang digambar tangan dan menggunakannya untuk mencari produk di kehidupan nyata. Jaringan tersebut dilatih menggunakan kumpulan data yang terdiri dari sekitar 30.000 perbandingan foto sketsa, sehingga memungkinkannya mengenali cara objek nyata ditampilkan dalam gambar tangan. Pixelor melakukan hal serupa, tetapi juga dapat menghasilkan gambarnya sendiri, bukan hanya mengenali gambar orang lain.

Tapi itu tidak cukup untuk menang gambar. gambar adalah permainan dengan tantangan waktu yang tujuannya bukan hanya menggambar, katakanlah, seekor kucing, tetapi menggambar kucing dengan gerakan sesedikit mungkin. Anda bisa saja menjadi seniman terhebat di dunia, tetapi jika Anda membutuhkan waktu 12 jam untuk menggambar kucing yang sempurna, Anda adalah seniman yang buruk. gambar pemain.

Ini berarti membangun A.I. yang dapat mempelajari manusia untuk melihat strategi mana yang mereka gunakan untuk memainkan Pictionary dengan baik. Seperti yang dikatakan Song, “Bagian terpenting apa yang harus diambil agar hakim manusia lainnya dapat menebaknya? Kami ingin gambar kami dapat ditebak sedini mungkin.”

Untuk melakukan hal ini, para peneliti menggunakan QuickDraw, kumpulan data sketsa manusia terbesar yang tersedia hingga saat ini. Mereka kemudian membangun algoritma pengurutan saraf yang memprioritaskan urutan goresan yang perlu dibuat oleh seorang seniman; memberikan representasi objek yang dapat ditebak dalam baris sesedikit mungkin. Ini berarti memecah sketsa menjadi guratan-guratan, lalu mengacak urutan guratan-guratan tersebut dan menguji hasilnya hingga menghasilkan urutan yang tepat untuk menuliskannya di atas kertas.

Misalnya, seorang seniman dapat mulai menggambar kucing dengan membuat sketsa garis melingkar untuk kepalanya. Tapi lingkaran bisa berarti apa saja, meskipun Anda tahu bahwa lingkaran itu seharusnya melambangkan kepala. Namun, gambarlah dua telinga runcing, atau dua set kumis, dan jumlah benda potensial yang dapat Anda gambar akan berkurang dengan sangat, sangat cepat. Informasi ini kemudian digunakan untuk menginstruksikan agen pembuat sketsa.

Song mengatakan bahwa timnya dapat merilis versi ini untuk publik gambar-memainkan bot sehingga pemain manusia dapat mencoba mengalahkan A.I. menguasai. (Siapa tahu? Berperan sebagai seorang ahli bahkan dapat membantu meningkatkan kemampuan Anda gambar permainan.)

Lebih dari yang terlihat

Namun, ada lebih banyak hal di Pixelor daripada sekadar bot bermain game biasa. Sama seperti sistem komputer yang memiliki antarmuka tingkat permukaan tempat kita berinteraksi dan kode backend tersembunyi, demikian pula setiap A.I. tonggak sejarah bermain game memiliki motif tersembunyi. Kecuali jika mereka secara eksplisit membuat game komputer, laboratorium penelitian tidak akan menghabiskan banyak waktu untuk membangunnya A.I. agen hanya untuk menambahkan entri lain pada daftar besar hal-hal yang tidak lagi menjadi yang terbaik bagi manusia pada. Tujuannya selalu untuk memajukan beberapa bagian mendasar dari A.I. penyelesaian masalah.

Dalam kasus Pixelor, tujuan tersembunyinya adalah membuat mesin lebih mampu mengetahui apa yang penting bagi manusia dalam suatu adegan tertentu. Saat kami melihat sebuah gambar, kami langsung dapat mengetahui detail apa yang paling menonjol.

Katakanlah Anda sedang dalam perjalanan pulang kerja. Meskipun pepohonan yang berjajar di sisi jalan mungkin indah dan papan reklame film baru mungkin menarik, tidak ada yang lebih penting daripada wajah dan bahasa tubuh orang yang mungkin akan atau tidak akan berjalan di depannya Anda. Bahkan sebelum Anda secara sadar memproses informasi, otak Anda telah memilih detail yang paling penting. Bagaimana Anda mengajarkan komputer untuk dapat melakukan hal ini? Ternyata salah satu cara terbaik untuk melakukannya adalah dengan melihat bagaimana manusia memprioritaskan detail penting yang dapat dikenali dalam sebuah gambar saat mereka membuat sketsa.

“Tidak ada pengetahuan manusia yang tertanam dalam foto [saja],” kata Song. “Yang kami inginkan adalah data manusia yang dapat memberi kita sinyal tentang bagaimana manusia memahami suatu objek.”

Seperti disebutkan, bagus gambar Pemain, seperti petinju yang baik, akan mengetahui hal minimum mutlak yang perlu mereka lakukan untuk mencapai tujuan tertentu. Secara makro, inilah yang menjadi perhatian Yi-Zhe Song dan rekan-rekannya. Ini bukanlah hal yang sepele seperti menggunakan komputer untuk bermain game; ini membuat komputer memahami apa yang penting dari adegan tertentu — dan, mudah-mudahan, dapat menggeneralisasi dengan lebih baik.

Seperti semuanya dari mobil yang bisa mengemudi sendiri agar robot di tempat kerja menjadi semakin umum, hal ini merupakan tugas penting yang harus diselesaikan.

Makalah yang menjelaskan pekerjaan ini akan dipresentasikan di SIGGRAPH Asia 2020 pada bulan November.

Rekomendasi Editor

  • Pelayaran adalah A.I. surga permainan tempat bot menulis aturannya
  • Catur. Bahaya. Pergi. Mengapa kami menggunakan game sebagai tolok ukur AI?
  • Sebuah A.I. sedang merancang video game retro — dan ternyata ternyata bagus