แมชชีนเลิร์นนิงและศิลปะ - Google I/O 2016
ลองนึกถึงคอมพิวเตอร์ราวกับว่าพวกเขายังเป็นเด็ก และเป็นเรื่องง่ายที่จะเข้าใจว่าผู้เขียนโค้ดสามารถสอนให้พวกเขาเรียนรู้ได้อย่างไร ปัญญาประดิษฐ์เป็นพื้นฐานและเรียบง่ายในตอนแรก ผู้ดำเนินรายการที่เป็นมนุษย์จะสั่งสอนคอมพิวเตอร์ แสดงวิธีคิดและสอนตนเอง เมื่อผู้เขียนโค้ดให้พื้นฐานแล้ว พวกเขาสามารถขยายความรู้นั้นได้อย่างรวดเร็ว
“คุณทำอะไรได้บ้างกับสิ่งประดิษฐ์ดิจิทัล 7 ล้านชิ้น”
ที่ สถาบันวัฒนธรรม Google ในปารีส ประเทศฝรั่งเศส บริษัทค้นหายักษ์ใหญ่กำลังสอนเครื่องจักรถึงวิธีจัดหมวดหมู่ภาพที่ประสบความสำเร็จทางศิลปะของมนุษย์จำนวน 7 ล้านภาพตลอดหลายศตวรรษที่ผ่านมา สถาบันยังมีเว็บไซต์และแอปอีกด้วย ไอโอเอส และ หุ่นยนต์ ซึ่งคุณสามารถค้นหาผลงานศิลปะจากพิพิธภัณฑ์ต่างๆ ทั่วโลกได้ ในการสร้างแคตตาล็อกงานศิลปะ ศิลปินโค้ดประจำสถาบันต้องสอนคอมพิวเตอร์ ดูภาพในแบบที่มนุษย์สร้างคลังงานศิลปะดิจิทัลที่แม่นยำตลอดประวัติศาสตร์ของมนุษย์
ประวัติการทำรายการเป็นสิ่งที่ดีและดี แต่ทักษะบางอย่างที่คอมพิวเตอร์กำลังเรียนรู้จากการเรียงลำดับและการจัดเก็บกลับทำให้พวกเขามีความคิดสร้างสรรค์มากขึ้น ศิลปินที่อาศัยอยู่ตอนนี้กำลังทดลองกับคอมพิวเตอร์เพื่อสร้างผลงานศิลปะใหม่ๆ โดยใช้ระบบอัจฉริยะของเครื่องจักรและแคตตาล็อกรูปภาพ 7 ล้านภาพที่พวกเขาได้ปะติดปะต่อกัน ในช่วง Google I/O 2016 ซีริล ดิยาญ และ มาริโอ คลิงเงมันน์ อธิบายวิธีที่พวกเขาสอนเครื่องจักรให้มองเห็นงานศิลปะเหมือนมนุษย์ และวิธีที่พวกเขาฝึกเครื่องจักรให้มีความคิดสร้างสรรค์
สอนคอมพิวเตอร์เบื้องต้น
สิ่งแรกๆ ที่คุณสอนเด็กคือภาษา ในวัฒนธรรมตะวันตก นั่นหมายถึงการเรียนรู้ ABC ของคุณ Mario Klingemann ศิลปินเขียนโค้ดจากประเทศเยอรมนี เริ่มสอนเครื่องจักรให้ ระบุตัวอักษรเก๋ๆ จากข้อความเก่าๆ เพื่อดูว่าเขาสามารถสอนคอมพิวเตอร์ให้จดจำตัวอักษร As, Bs, Cs และอื่นๆ ที่ดูแตกต่างกันนับพันได้หรือไม่ บน. เป็นหลักสูตรเร่งด่วนในการสอนเครื่องจักรถึงวิธีจัดหมวดหมู่รูปภาพในแบบที่มนุษย์ทำ
แม้ว่าคอมพิวเตอร์อาจดูตัวอักษร B ที่ตกแต่งอย่างสวยงามซึ่งปกคลุมไปด้วยเถาวัลย์และดอกไม้ และเห็นต้นไม้บางชนิด แม้แต่เด็กอายุ 5 ขวบก็สามารถระบุภาพนั้นได้ทันทีว่าเป็นตัวอักษร B ไม่ใช่ต้นไม้ เพื่อสอนคอมพิวเตอร์ให้รู้จัก ABC Klingemann ป้อนรูปภาพตัวอักษรเก๋ๆ นับพันรูปให้กับคอมพิวเตอร์ เขาสร้างอินเทอร์เฟซที่เหมือน Tinder ให้ปัดไปทางขวาหรือซ้ายเพื่อบอกเครื่องของเขาว่าเดาตัวอักษรถูกหรือผิด
ปรากฎว่าเครื่องจักรเรียนรู้ ABC ได้อย่างรวดเร็ว พวกเขาเริ่มเห็นตัวอักษรในทุกสิ่ง เช่นเดียวกับที่มนุษย์เห็นใบหน้าในก้อนเมฆและภาพในงานศิลปะแนวนามธรรม คอมพิวเตอร์ของเขาเห็นตัวอักษรในภาพที่ไม่เกี่ยวข้องกันโดยสิ้นเชิง Klingemann ให้คอมพิวเตอร์ของเขาดูภาพวาดหรือภาพแกะสลักของอาคารที่พัง และพวกเขาก็เห็นตัวอักษร B แทน
Klingemann อธิบายว่าเมื่อคุณฝึกคอมพิวเตอร์ด้วยรูปภาพเพียงชุดเดียว คอมพิวเตอร์จะเริ่มมองเห็นเพียงภาพประเภทนั้นในทุกสิ่ง นั่นเป็นสาเหตุที่เครื่องจักรของเขาเห็นจดหมายอยู่ในซากปรักหักพัง
สอนคอมพิวเตอร์จัดหมวดหมู่ภาพ 7 ล้านภาพ
เมื่อศิลปินปฏิสัมพันธ์ดิจิทัล Cyril Diagne เข้าร่วมสถาบันวัฒนธรรม Google ตั้งคำถามที่ค่อนข้างน่ากลัวแก่เขาว่า "คุณจะทำอะไรกับสิ่งประดิษฐ์ดิจิทัล 7 ล้านชิ้นได้"
Diagne รู้สึกท่วมท้นกับคำถามนี้ ดังนั้นเขาจึงจัดวางภาพทุกภาพให้ใหญ่โตมโหฬาร คลื่นไซน์, ซึ่งคุณสามารถดูด้านล่าง. ต่อมาคลื่นดังกล่าวกลายมาเป็นตัวแทนที่สวยงามของทุกสิ่งที่โปรเจ็กต์หวังว่าจะบรรลุผลสำเร็จด้วยการเรียนรู้ของเครื่อง คลื่นไซน์ของ Diagne สามารถค้นหาได้จริง ดังนั้นคุณจึงสามารถท่องรูปภาพทั้งหมดในคลังข้อมูลดิจิทัลที่สร้างโดย Google Cultural Institute ได้ รูปภาพจะถูกจัดกลุ่มตามหมวดหมู่ และจากมุมสูง คุณจะเห็นจุดต่างๆ มากมาย เมื่อคุณย้ายเข้าไป คุณจะเห็นรูปภาพเฉพาะเจาะจง ทั้งหมดที่มีธีมเหมือนกัน ไม่ว่าจะเป็นลูกสุนัข ฟาร์ม หรือคน
1 ของ 3
คุณสามารถค้นหาผ่านมันได้เช่นกันและค้นหารูปภาพที่คุณต้องการ หากคุณมองให้ดีพอ คุณอาจเจอสิ่งที่ Diagne เรียกว่า Shore of Portraits นั่นคือที่ที่ภาพใบหน้าของผู้คนทั้งหมดถูกรวมกลุ่มกัน
ในการสร้างแผนที่ที่ค้นหาได้ของทุกภาพในไฟล์เก็บถาวร Diagne และทีมของเขาต้องสร้างหมวดหมู่สำหรับทุกสิ่งเพื่อสอนให้เครื่องรู้ว่าอะไรคืออะไร
การจัดหมวดหมู่สิ่งประดิษฐ์ 7 ล้านชิ้น ซึ่งหลายชิ้นอาจมีหลายประเภท ไม่ใช่เรื่องง่าย ทีมต้องคิดบางอย่างที่อยู่นอกกรอบ การจัดหมวดหมู่สิ่งต่าง ๆ ตามสิ่งที่พวกเขาเป็นนั้นไม่เพียงพอ พวกเขายังต้องสร้างหมวดหมู่ตามอารมณ์ความรู้สึกที่ภาพปลุกเร้าด้วย
การสอนเครื่องจักรเกี่ยวกับอารมณ์ของมนุษย์ถือเป็นก้าวสำคัญในการทำให้พวกเขามีความคิดสร้างสรรค์มากขึ้น
ด้วยวิธีนี้ คุณสามารถค้นหาภาพที่ "สงบ" แล้วคอมพิวเตอร์จะแสดงภาพที่ทำให้เกิดความรู้สึกสงบ เช่น พระอาทิตย์ตก ทะเลสาบอันเงียบสงบ และอื่นๆ น่าประหลาดใจที่เครื่องจักรได้เรียนรู้วิธีการระบุอารมณ์ของมนุษย์ด้วยทักษะที่สามารถใส่ตัวเองเข้าไปพิจารณาว่าภาพหนึ่งๆ จะทำให้มนุษย์รู้สึกอย่างไร
การสอนเครื่องจักรเกี่ยวกับอารมณ์ของมนุษย์ถือเป็นก้าวสำคัญในการทำให้พวกเขามีความคิดสร้างสรรค์มากขึ้น ท้ายที่สุดแล้ว ศิลปะสมัยใหม่ส่วนใหญ่เป็นการนำเสนออารมณ์ความรู้สึกของมนุษย์ด้วยภาพ
แต่เครื่องจักรสามารถสร้างสรรค์ได้หรือไม่?
ความคิดสร้างสรรค์และศิลปะเป็นสองสิ่งที่มนุษย์เราชอบคิดว่าเป็นของเราเพียงผู้เดียว สัตว์ยังไม่ได้สร้างงานศิลปะ หรือเครื่องจักร…ยังทำไม่ได้ โครงการ Deep Dream ของ Google พยายามเปลี่ยนความคิดที่ว่าเครื่องจักรไม่สามารถสร้างงานศิลปะบนหัวได้ บริษัทยักษ์ใหญ่ด้านการค้นหาได้ฝึกฝนคอมพิวเตอร์เพื่อจัดการภาพเพื่อสร้างงานศิลปะที่แปลกประหลาดและประสาทหลอน รูปภาพที่สร้างโดย Google เครื่องยนต์ดีพดรีม อาจจะไม่สวยนัก แต่รับรองว่ามีเอกลักษณ์และสร้างสรรค์สุดๆ การสร้างเครื่องจักรประกอบด้วยสีที่ทำให้เคลิบเคลิ้ม ทาก ดวงตาแปลกๆ และสัตว์ต่างๆ ที่แยกตัวออกมาจะหมุนวนไปในพื้นที่ที่ไม่ได้กำหนดไว้
บางคนอาจแย้งว่ามันไม่ถือเป็นศิลปะจริงๆ ถ้าเครื่องจักรแค่รวมภาพที่มีอยู่ บิดมัน และจุ่มมันลงในสีสุดขั้ว Google อยากจะขอแตกต่างออกไป และ Klingemann นักเขียนโค้ดก็เช่นกัน
“มนุษย์ไม่มีความสามารถในการมีความคิดริเริ่ม” เขาอธิบาย
1 ของ 8
แม้แต่ภาพวาดที่มีชื่อเสียงก็มีองค์ประกอบของงานศิลปะก่อนหน้านี้เขาตั้งข้อสังเกต ผลงานชิ้นเอกของปิกัสโซในปี 1907 Les Demoiselles d'Avignon, เช่นได้รับอิทธิพลมาจาก ศิลปะแอฟริกัน และบรรพบุรุษของนักเขียนภาพแบบเหลี่ยมเช่น ปอล เซซาน. สำหรับเรื่องดังกล่าว ภาพต่อกันซึ่งรวมภาพที่มีอยู่ในรูปแบบศิลปะถือเป็นรูปแบบศิลปะที่มีชื่อเสียงอีกรูปแบบหนึ่ง Picasso, Andy Warhol, Man Ray และคนอื่นๆ ขึ้นชื่อในเรื่องภาพต่อกันที่แปลกประหลาด แล้วทำไมภาพต่อกันที่สร้างด้วยเครื่องจักรจึงไม่สามารถยืนหยัดเป็นงานศิลปะได้
Klingemann ต้องการขยายขอบเขตของศิลปะดิจิทัลและดูว่าเครื่องจักรเชิงสร้างสรรค์จะอยู่ได้ยาวนานเพียงใดก่อนที่เขาจะเริ่มทำงานที่ Google Cultural Institute Klingemann ใช้เครื่องจักรที่ทรงพลังน้อยกว่าของเขาเองเพื่อเริ่มเล่นกับ Internet Archives และของ Google เทนเซอร์โฟลว์ ซอฟต์แวร์การเรียนรู้ของเครื่องเพื่อสร้างภาพต่อกันแบบดิจิทัล
เขาสร้างเครื่องมือแมชชีนเลิร์นนิงชื่อ Ernst ซึ่งตั้งชื่อตามศิลปินแนวเหนือจริงและศิลปินภาพต่อกัน แม็กซ์ เอิร์นส์. คลิงเงมันน์ระบุวัตถุชุดหนึ่งจากงานของเอิร์นส์ และบอกให้คอมพิวเตอร์ของเขาสร้างภาพต่อกันที่แตกต่างกันด้วยองค์ประกอบเดียวกัน ผลลัพธ์ที่ได้มักจะเหนือจริง บางครั้งก็ตลก และบางครั้งก็แย่สุดๆ
“มนุษย์ไม่มีความสามารถในการคิดริเริ่ม”
คลิงเงมันน์ต้องการควบคุมภาพที่วุ่นวายที่เครื่องจักรของเขาผลิตมากขึ้น ดังนั้นเขาจึงเริ่มสอนสิ่งใหม่ๆ ให้กับพวกเขา เขาถามตัวเองว่า “มนุษย์มีอะไรน่าสนใจบ้าง” คลิงเงอมันน์รู้ว่าเขาต้องฝึกระบบว่าจะมองหาอะไร เพื่อสอนวิธีดูองค์ประกอบเหล่านั้นทั้งหมดเหมือนกับที่ศิลปินมนุษย์ทำ
งานศิลปะที่ได้ออกมานั้นงดงามและมีเอกลักษณ์เฉพาะตัวโดยสิ้นเชิง แม้ว่า Klingemann จะใช้รูปภาพเก่าๆ เพื่อสร้างผลงานของเขาอย่างชัดเจน แต่รูปภาพเหล่านั้นก็ถูกแสดงในบริบทใหม่และนั่นก็สร้างความแตกต่าง
ในปัจจุบัน ความคิดสร้างสรรค์ของคอมพิวเตอร์จำกัดอยู่เพียงภาพตัดปะที่น่าสนใจและการทำความเข้าใจว่าภาพใดเข้ากันได้ดี เครื่องจักรยังไม่ได้สร้างงานศิลปะของตัวเอง แต่ศิลปินโค้ดที่ขับเคลื่อนพวกมันกำลังกลายเป็นผู้ดูแลมากกว่าผู้สร้างในระหว่างกระบวนการนี้
คงต้องรอดูกันต่อไปว่ามนุษย์จะสามารถขยายความคิดสร้างสรรค์ของเครื่องจักรได้ไกลแค่ไหน แต่การรับชมก็น่าทึ่งอย่างแน่นอน
คำแนะนำของบรรณาธิการ
- Google Bard สามารถพูดได้แล้ว แต่จะทำให้ ChatGPT จมหายไปได้หรือไม่
- ตอนนี้คุณสามารถลองใช้ Bard ของ Google ซึ่งเป็นคู่แข่งของ ChatGPT ได้แล้ว
- Bard AI ใหม่ของ Google อาจทรงพลังพอที่จะทำให้ ChatGPT กังวล – และมันอยู่ที่นี่แล้ว
- Google Meet หรือ Zoom? อีกไม่นานก็คงไม่สำคัญ
- แป้นพิมพ์ใหม่ที่แปลกประหลาดของ Google Japan ยังสามารถตรวจจับข้อบกพร่อง (ตามตัวอักษร) ได้อีกด้วย