นี่คือวิธีที่ Facebook สอน Portal A.I. ให้คิดเหมือนคนทำหนังฮอลลีวู้ด

พอร์ทัล Facebook+ รีวิว
แดน เบเกอร์/เทรนด์ดิจิทัล

เมื่อ Mark Zuckerberg สร้าง Facebook เวอร์ชันแรกในหอพักวิทยาลัยของเขาที่ Harvard เขาจินตนาการว่าเป็นหน้าต่างที่เปิดโอกาสให้ผู้คนได้เข้าไปดูชีวิตของผู้ใช้รายอื่น หาก Google เป็นเครื่องมือค้นหาข้อมูล ในทางกลับกัน Facebook ก็เป็นเครื่องมือค้นหาสำหรับผู้คน สิบห้าปีต่อมา Facebook ได้ยกระดับความทะเยอทะยานนี้ขึ้นไปอีกระดับ ด้วยการสร้าง Portal และ Portal+ ซึ่งเป็นกลุ่มผลิตภัณฑ์ลำโพงอัจฉริยะที่ปรับปรุงหน้าจอ ซึ่งเปิดตัวในเดือนพฤศจิกายน 2561 โซเชียลมีเดียยักษ์ใหญ่ได้สร้างหน้าต่างที่แท้จริงมากขึ้น ทำให้ผู้ใช้ Facebook สามารถโทรผ่านวิดีโอได้ อื่น.

สารบัญ

  • ทำให้กล้องฉลาดขึ้น
  • ความท้าทายทางเทคนิค
  • ตลาดที่กำลังเติบโต
  • ความท้าทายด้านความเป็นส่วนตัวรออยู่ข้างหน้า?

ลำโพงอัจฉริยะของพอร์ทัลมีความหมายอีกอย่างหนึ่ง เฟสบุ๊ค ฝันเช่นกัน โดยพื้นฐานแล้ว Facebook เคยเป็นเครื่องมือค้นหาสำหรับผู้คน จริงๆ แล้วพอร์ทัล ทำ ค้นหาสิ่งเหล่านั้น: ด้วยกล้องความละเอียด 12 เมกะพิกเซล ที่ให้มุมมองกว้าง 140 องศา ซึ่งจะติดตามคุณไปรอบๆ ห้องเพื่อดูว่าคุณกำลังทำอะไรอยู่ ดังเทรนด์ดิจิทัล วางไว้ในการตรวจสอบของเรา, “ถ้าคุณยุ่งอยู่กับการย้ายครัวไปพร้อมๆ กับถามคุณยายถึงวิธีทำลูกชิ้นชื่อดังของเธอ คุณก็ยุ่งในขณะที่ฟังเธอพูดได้”

วิดีโอแนะนำ

เทคโนโลยีอัจฉริยะที่ขับเคลื่อนพอร์ทัลคืออะไรกันแน่? และ Facebook คิดว่าความท้าทายในการทำให้วิดีโอแชทปกติมีความเป็นส่วนตัวเหมือนกับการนั่งสนทนาจริงได้อย่างไร คำตอบเกี่ยวข้องกับปัญญาประดิษฐ์ที่น่าประทับใจ และการสัมผัสของมนุษย์เพิ่มเติม

ที่เกี่ยวข้อง

  • A.I. การตรวจจับอารมณ์ มาแล้ว และอาจอยู่ในการสัมภาษณ์งานครั้งถัดไปของคุณ
  • เพราะปี 2020 ยังไม่บ้าพอ ปากหุ่นยนต์จึงร้องเพลง A.I. คำอธิษฐานในปารีส
  • AI. การเพิ่มสเกลทำให้ภาพยนตร์เรื่องนี้จากปี 1896 ดูเหมือนถ่ายด้วยความละเอียด 4K ที่น่าทึ่ง
พอร์ทัล Facebook+ รีวิว
แดน เบเกอร์/เทรนด์ดิจิทัล

ทำให้กล้องฉลาดขึ้น

ตั้งแต่เริ่มต้น Facebook รู้ดีว่าแกนหลักของประสบการณ์พอร์ทัลคือระบบที่เรียกว่า "กล้องอัจฉริยะ" แนวคิดของกล้องอัจฉริยะคือการก้าวไปไกลกว่าการถ่ายภาพนิ่งที่บริการอย่าง Skype มอบให้เรามานานหลายปี และมีบทบาทที่สร้างสรรค์มากขึ้นในกระบวนการนี้ เช่นเดียวกับที่ผู้กำกับภาพยนตร์หรือผู้กำกับภาพรู้ว่าเมื่อใดควรใช้ภาพมุมกว้างหรือเมื่อใดควรซูมเข้าเพื่อถ่ายภาพระยะใกล้อย่างใกล้ชิด ดังนั้น เฟสบุ๊ค ท้าทายวิศวกรให้เลียนแบบความสามารถเดียวกันนี้กับพอร์ทัล

เพื่อให้กล้องตัวนี้เข้าถึงความรู้สึกของมนุษย์ Facebook ได้ทำงานร่วมกับผู้สร้างภาพยนตร์เพื่อค้นหาวิธีที่ดีที่สุดในการกลั่นกรองภูมิปัญญาของพวกเขาให้เป็นข้อมูลเชิงลึกที่เรียนรู้จากเครื่องได้ ในกรณีหนึ่ง ทางบริษัทขอให้พวกเขาสาธิตวิธีถ่ายภาพฉากที่ไม่สามารถบันทึกข้อมูลที่เกี่ยวข้องทั้งหมดจากมุมคงที่มุมเดียวได้

พอร์ทัลประกอบด้วยเลนส์มุมกว้างพิเศษซึ่งการตัดสินใจในการเคลื่อนไหวและการแก้ไขทั้งหมดจะทำในรูปแบบดิจิทัลทั้งหมด

ในอีกทางหนึ่ง วิศวกรของ Facebook พิจารณาองค์ประกอบการถ่ายภาพต่างๆ ที่ผู้ควบคุมกล้องจัดลำดับความสำคัญในการถ่ายภาพแนวตั้งและแนวนอน การสังเกตเหล่านี้เป็นพื้นฐานของโมเดลซอฟต์แวร์ที่พยายามทำให้พอร์ทัลมีพฤติกรรมการตัดสินใจบางอย่างที่ปกติแล้วเราจะถือว่ามาจากความคิดสร้างสรรค์ของมนุษย์

“เราต้องการสร้างประสบการณ์การสนทนาทางวิดีโอแบบแฮนด์ฟรีที่ขจัดความรู้สึกห่างเหินและเป็นเช่นนี้ เหมือนออกไปเที่ยวด้วยกันมากกว่า” Eric Hwang หนึ่งในวิศวกรที่อยู่เบื้องหลัง Portal อธิบายกับ Digital Trends

ระบบผลลัพธ์ที่ Facebook กล่าวว่าใช้เวลา “น้อยกว่าสองปี” ในการสร้างตั้งแต่เริ่มต้น — ช่วยให้พอร์ทัลสามารถตัดสินใจที่ออกแบบมาเพื่อปรับปรุงการไหลของการสนทนา ใน โพสต์บล็อกที่เผยแพร่ใหม่โดยจะให้รายละเอียดภาพประกอบบางส่วนว่าทำไมสิ่งนี้ถึงจำเป็น ตัวอย่างเช่น หากคุณอยู่ในห้องที่มีผู้คนพลุกพล่าน เต็มไปด้วยผู้คนโต้ตอบกัน จะต้องเลือกว่าจะติดตามบุคคลนอกเฟรมเมื่อใด หรือจะซูมออกเมื่อใดเพื่อรองรับวัตถุใหม่ๆ

วิศวกรซอฟต์แวร์ของ Facebook Eric Hwang (นั่งเก้าอี้ในตอนแรก) และ Arthur Cavalcanti สาธิตการติดตามและจัดเฟรมที่เหมือนกล้องในโรงภาพยนตร์ของ Portal

ในทำนองเดียวกัน จะต้องเรียนรู้ที่จะรับมือกับสถานการณ์แสงที่เปลี่ยนแปลงไปแบบเรียลไทม์ คุณจะทำอย่างไรหากตัวแบบของคุณนอนอยู่ในห้องมืดซึ่งมีผ้าห่มคลุมไว้ครึ่งหนึ่ง แต่มีเด็กวิ่งเล่นอยู่ในแบ็คกราวด์ทำให้เกิดภาพเบลอจากการเคลื่อนไหว พอร์ทัลจะชั่งน้ำหนักข้อมูลทั้งหมดนี้ภายในพริบตาและพยายามระบุผลลัพธ์ที่ดีที่สุด (หากคุณต้องการควบคุมผู้ที่โฟกัสด้วยตนเอง ตอนนี้ก็เป็นไปได้เช่นกัน.)

ความท้าทายทางเทคนิค

จากมุมมองด้านเทคนิค มีบางสิ่งที่ทำให้เทคโนโลยีของพอร์ทัลน่าประทับใจ ประการแรกคือสามารถทำทุกอย่างนี้ได้โดยไม่ต้องใช้กล้องที่กำลังเคลื่อนที่จริง ในช่วงต้นของกระบวนการพัฒนา วิศวกรของพอร์ทัลได้ทดลองใช้ต้นแบบซึ่งใช้กล้องแบบใช้มอเตอร์ซึ่งหมุนเพื่อหันหน้าเข้าหาวัตถุ อย่างไรก็ตาม เรื่องนี้ถูกตัดสินโดยพิจารณาจากสาเหตุที่ทำให้เกิดความล่าช้าและจุดที่อาจเกิดความล้มเหลวทางกลไก พอร์ทัลกลับประกอบด้วยเลนส์มุมกว้างพิเศษ ซึ่งการตัดสินใจด้านการเคลื่อนไหวและการแก้ไขทั้งหมดจะทำในรูปแบบดิจิทัลทั้งหมด

ประการที่สอง ทีมที่ทำงานเกี่ยวกับพอร์ทัลพบวิธีที่จะบรรลุกระบวนการตัดสินใจโดยไม่ต้องพึ่งพาการประมวลผลแบบคลาวด์ ตามคำกล่าวของ Hwang พลังการยิงในการคำนวณทั้งหมดเกิดขึ้นได้ในอุปกรณ์

วิวัฒนาการของพอร์ทัล Facebook
พอร์ทัลต้นแบบในยุคแรกๆ อาศัยมอเตอร์ในการเคลื่อนย้ายกล้องวิศวกรรมศาสตร์เฟสบุ๊ค

“การถ่ายภาพทุกคนในเฟรมวิดีโอไม่ใช่ปัญหาทางวิศวกรรมที่ยาก เนื่องจากวิศวกรจำนวนมากสามารถทำได้ด้วยความก้าวหน้าด้านการมองเห็นของคอมพิวเตอร์ในปัจจุบัน” เขากล่าว “นวัตกรรมนี้อยู่ที่การจับบุคคลที่เกี่ยวข้องหรือบุคคลแบบเรียลไทม์บนอุปกรณ์ โดยใช้ชิปเคลื่อนที่ขนาดเล็กภายในพอร์ทัลเป็นพลังในการประมวลผล โดยปกติแล้ว A.I. ประเภทนี้ งานต่างๆ ต้องใช้เซิร์ฟเวอร์ขนาดใหญ่โดยเฉพาะ [เรา] เอาชนะอุปสรรคนั้นด้วยการบีบอัดโมเดลคอมพิวเตอร์วิทัศน์ที่ซับซ้อนจนกว่าจะพอดีกับชิปที่เราใช้สำหรับ Portal และยังคงทำงานได้อย่างแม่นยำและเชื่อถือได้”

ในการทำเช่นนี้ Portal ใช้การลงทุนระยะยาวของ Facebook ในด้านปัญญาประดิษฐ์ ใช้ระบบตรวจจับท่าทาง 2 มิติซึ่งทำงานที่ 30 เฟรมต่อวินาที ความตั้งใจของท่าเหล่านี้ช่วยให้พอร์ทัลสามารถตัดสินใจได้อย่างต่อเนื่องว่าตัวแบบกำลังทำอะไรอยู่ และอาจจำเป็นต้องแพนหรือซูมแบบดิจิทัลเมื่อใด นอกจากนี้ยังใช้การวิจัยเกี่ยวกับกล้องเชิงลึกที่พัฒนาโดย Facebook Reality Labs ซึ่งเป็นส่วนหนึ่งของความพยายามเสมือนจริงของยักษ์ใหญ่โซเชียลมีเดีย

ตลาดที่กำลังเติบโต

Facebook เชื่อมั่นว่าเป็นผู้ชนะด้วยพอร์ทัล ง่ายที่จะดูว่าความมั่นใจมาจากไหน ปัจจุบันตลาดลำโพงอัจฉริยะกำลังเฟื่องฟู แม้ว่าผู้นำตลาด Amazon จะถูกครอบงำโดยส่วนใหญ่ แต่ก็เป็นเช่นนั้น เติบโตมากกว่าร้อยละ 100 ต่อปี. นั่นเป็นข่าวดีสำหรับบริษัทเทคโนโลยีที่กำลังมองหาสิ่งที่ยิ่งใหญ่ต่อไปในเวลาที่แบนราบ สมาร์ทโฟน ฝ่ายขาย.

พอร์ทัล Facebook+ รีวิว
แดน เบเกอร์/เทรนด์ดิจิทัล

ในขณะที่ Facebook เป็นบริษัทยักษ์ใหญ่ด้านเทคโนโลยีรายสุดท้าย (Amazon, Alphabet, เฟสบุ๊ค และ Apple) เพื่อกระโดดขึ้นไปบน bandwagon ก็ยังคงนิ่งอยู่ หนึ่งในคนแรก คลื่นของลำโพงอัจฉริยะที่อยู่ตรงกลางหน้าจอเป็นอุปกรณ์สื่อสาร

“พอร์ทัลเป็นผลิตภัณฑ์เดียวในตลาดประเภทนี้” Hwang กล่าว “ทุกวันนี้ ลำโพงและจอแสดงผลอัจฉริยะสร้างขึ้นจากข้อมูลและการพาณิชย์ พอร์ทัลถูกสร้างขึ้นเพื่อให้ง่ายต่อการเชื่อมต่อกับผู้คนที่สำคัญที่สุด: เพื่อนสนิทและครอบครัวของเรา และพอร์ทัลมุ่งเน้นไปที่การเชื่อมโยงผู้คน ซึ่งเป็นส่วนหนึ่งของภารกิจของ Facebook ซึ่งปัจจุบันยังให้บริการไม่ดีนักในตลาดอุปกรณ์ในบ้าน”

ความท้าทายด้านความเป็นส่วนตัวรออยู่ข้างหน้า?

แล้วอะไรจะหยุดหยุด Facebook? อาจเป็นความเป็นส่วนตัว ผู้ใช้ได้พิสูจน์แล้วว่าเต็มใจที่จะยอมรับแกดเจ็ตที่ "รับฟังตลอดเวลา" จากบริษัทอย่าง Google ที่มีความสนใจในข้อมูลผู้ใช้อย่างน่าประหลาดใจ แต่อุปกรณ์ที่ทั้งเฝ้าดูและฟังคุณยังคงรุกรานมากกว่า นอกจากนี้ชื่อเสียงของ Facebook ยังคงตกต่ำตามมา เรื่องอื้อฉาวของ Cambridge Analytica เมื่อปีที่แล้ว.

การเพิ่มความฉลาดให้กับกล้องวิดีโอแชทพอร์ทัล (Facebook)

เพียงไม่กี่วันก่อนที่บทความนี้จะถูกตีพิมพ์ วอชิงตันโพสต์ รายงานแล้ว Facebook กำลังเจรจาเพื่อทำลายสถิติข้อตกลงมูลค่าหลายพันล้านดอลลาร์กับ FTC สำหรับการละเมิดความเป็นส่วนตัว ด้วยกระแสตอบรับที่เพิ่มมากขึ้นจากผู้ใช้เก่าจำนวนมาก ยังไม่มีการเปิดเผยหากเป็นเช่นนั้น เฟสบุ๊ค มีเพลงฮิตสไตล์ Amazon Echo อยู่ในมือ — หรือความล้มเหลวสไตล์ Amazon Fire Phone

Facebook ให้คำรับรองกับเราว่าจะไม่ฟัง ดู หรือเก็บเนื้อหาของการสนทนาทางวิดีโอของพอร์ทัล ซึ่งได้รับการเข้ารหัสเพิ่มเติมเพื่อหลีกเลี่ยงการดักฟัง ความจริงที่ว่า A.I. ของพอร์ทัล สมาร์ททำงานภายในอุปกรณ์และไม่ได้เปิดอยู่ เฟสบุ๊ค เซิร์ฟเวอร์ก็หมายความว่าข้อมูลนี้จะไม่ออกจากบ้านของคุณ คำสั่งเสียงจะถูกส่งไปยังบริษัทหลังจากที่คุณพูดว่า "เฮ้พอร์ทัล" เท่านั้น และผู้ใช้สามารถลบประวัติเสียงของตนในบันทึกกิจกรรมของ Facebook ได้ตลอดเวลา

แต่ไม่อาจหลีกเลี่ยงความจริงที่ว่ายังมีการรวบรวมข้อมูลอยู่บ้าง “แม้ว่าเราจะไม่ฟัง ดู หรือเก็บเนื้อหาของการสนทนาทางวิดีโอพอร์ทัลของคุณ หรือใช้ข้อมูลนี้เพื่อกำหนดเป้าหมายโฆษณา แต่เรา ประมวลผลข้อมูลการใช้งานอุปกรณ์บางอย่างเพื่อทำความเข้าใจวิธีการใช้งานพอร์ทัลและเพื่อปรับปรุงผลิตภัณฑ์” บันทึกของ Facebook (นโยบายความเป็นส่วนตัวของพอร์ทัล สามารถอ่านได้ที่นี่.)

พอร์ทัลนำเสนอเทคโนโลยีอันชาญฉลาดซึ่งมีผลกระทบอย่างมากต่ออนาคตของวิดีโอแชท ไม่ต้องสงสัยเลยว่าบริษัทสามารถดึงเอาสิ่งที่น่าประทับใจมากออกมาได้จากมุมมองทางเทคโนโลยี แต่ไม่ว่าจะสามารถโน้มน้าวผู้มีโอกาสเป็นลูกค้าได้ว่านี่คือโซลูชันที่พวกเขาต้องการในชีวิตหรือไม่ ท้ายที่สุดแล้ว จะสามารถพิสูจน์ได้ว่าเป็นความสำเร็จที่แท้จริง

คำแนะนำของบรรณาธิการ

  • อ่าน 'พระคัมภีร์สังเคราะห์' ที่สวยงามน่าขนลุกของ A.I. ที่คิดว่าเป็นพระเจ้า
  • นางแบบภาษา: GPT-3 เปิดตัว A.I. อย่างเงียบ ๆ ได้อย่างไร การปฎิวัติ
  • เราใช้ระบบ A.I. เครื่องมือออกแบบเพื่อสร้างโลโก้ใหม่ นี่คือสิ่งที่เกิดขึ้น
  • A.I. สัญลักษณ์ประสาท คืออนาคตของปัญญาประดิษฐ์ นี่คือวิธีการทำงาน
  • ทบทวนการเติบโตของ A.I.: ปัญญาประดิษฐ์มาไกลแค่ไหนแล้วนับตั้งแต่ปี 2010

หมวดหมู่

ล่าสุด

ฉันเรียนรู้ที่จะรักซอฟต์แวร์ที่เป็นข้อขัดแย้งของ OnePlus 11 ได้อย่างไร

ฉันเรียนรู้ที่จะรักซอฟต์แวร์ที่เป็นข้อขัดแย้งของ OnePlus 11 ได้อย่างไร

เมื่อฉันหยิบของขึ้นมา โอเปิ้ล 10 โปรฉันก็พลาด O...

เทคโนโลยีชั้นนำของ Digital Trends จากงาน MWC 2023

เทคโนโลยีชั้นนำของ Digital Trends จากงาน MWC 2023

ตรวจสอบความครอบคลุมทั้งหมดของเราเกี่ยวกับ MWC 2...

Fortnite บทที่ 4 ได้ขโมยสายฟ้าของ Warzone 2.0 ไปโดยสิ้นเชิง

Fortnite บทที่ 4 ได้ขโมยสายฟ้าของ Warzone 2.0 ไปโดยสิ้นเชิง

แม้ว่า Call of Duty: Warzone 2.0 ถึงก ผู้เล่นมา...