เมื่อ Mark Zuckerberg สร้าง Facebook เวอร์ชันแรกในหอพักวิทยาลัยของเขาที่ Harvard เขาจินตนาการว่าเป็นหน้าต่างที่เปิดโอกาสให้ผู้คนได้เข้าไปดูชีวิตของผู้ใช้รายอื่น หาก Google เป็นเครื่องมือค้นหาข้อมูล ในทางกลับกัน Facebook ก็เป็นเครื่องมือค้นหาสำหรับผู้คน สิบห้าปีต่อมา Facebook ได้ยกระดับความทะเยอทะยานนี้ขึ้นไปอีกระดับ ด้วยการสร้าง Portal และ Portal+ ซึ่งเป็นกลุ่มผลิตภัณฑ์ลำโพงอัจฉริยะที่ปรับปรุงหน้าจอ ซึ่งเปิดตัวในเดือนพฤศจิกายน 2561 โซเชียลมีเดียยักษ์ใหญ่ได้สร้างหน้าต่างที่แท้จริงมากขึ้น ทำให้ผู้ใช้ Facebook สามารถโทรผ่านวิดีโอได้ อื่น.
สารบัญ
- ทำให้กล้องฉลาดขึ้น
- ความท้าทายทางเทคนิค
- ตลาดที่กำลังเติบโต
- ความท้าทายด้านความเป็นส่วนตัวรออยู่ข้างหน้า?
ลำโพงอัจฉริยะของพอร์ทัลมีความหมายอีกอย่างหนึ่ง เฟสบุ๊ค ฝันเช่นกัน โดยพื้นฐานแล้ว Facebook เคยเป็นเครื่องมือค้นหาสำหรับผู้คน จริงๆ แล้วพอร์ทัล ทำ ค้นหาสิ่งเหล่านั้น: ด้วยกล้องความละเอียด 12 เมกะพิกเซล ที่ให้มุมมองกว้าง 140 องศา ซึ่งจะติดตามคุณไปรอบๆ ห้องเพื่อดูว่าคุณกำลังทำอะไรอยู่ ดังเทรนด์ดิจิทัล วางไว้ในการตรวจสอบของเรา, “ถ้าคุณยุ่งอยู่กับการย้ายครัวไปพร้อมๆ กับถามคุณยายถึงวิธีทำลูกชิ้นชื่อดังของเธอ คุณก็ยุ่งในขณะที่ฟังเธอพูดได้”
วิดีโอแนะนำ
เทคโนโลยีอัจฉริยะที่ขับเคลื่อนพอร์ทัลคืออะไรกันแน่? และ Facebook คิดว่าความท้าทายในการทำให้วิดีโอแชทปกติมีความเป็นส่วนตัวเหมือนกับการนั่งสนทนาจริงได้อย่างไร คำตอบเกี่ยวข้องกับปัญญาประดิษฐ์ที่น่าประทับใจ และการสัมผัสของมนุษย์เพิ่มเติม
ที่เกี่ยวข้อง
- A.I. การตรวจจับอารมณ์ มาแล้ว และอาจอยู่ในการสัมภาษณ์งานครั้งถัดไปของคุณ
- เพราะปี 2020 ยังไม่บ้าพอ ปากหุ่นยนต์จึงร้องเพลง A.I. คำอธิษฐานในปารีส
- AI. การเพิ่มสเกลทำให้ภาพยนตร์เรื่องนี้จากปี 1896 ดูเหมือนถ่ายด้วยความละเอียด 4K ที่น่าทึ่ง
ทำให้กล้องฉลาดขึ้น
ตั้งแต่เริ่มต้น Facebook รู้ดีว่าแกนหลักของประสบการณ์พอร์ทัลคือระบบที่เรียกว่า "กล้องอัจฉริยะ" แนวคิดของกล้องอัจฉริยะคือการก้าวไปไกลกว่าการถ่ายภาพนิ่งที่บริการอย่าง Skype มอบให้เรามานานหลายปี และมีบทบาทที่สร้างสรรค์มากขึ้นในกระบวนการนี้ เช่นเดียวกับที่ผู้กำกับภาพยนตร์หรือผู้กำกับภาพรู้ว่าเมื่อใดควรใช้ภาพมุมกว้างหรือเมื่อใดควรซูมเข้าเพื่อถ่ายภาพระยะใกล้อย่างใกล้ชิด ดังนั้น
เพื่อให้กล้องตัวนี้เข้าถึงความรู้สึกของมนุษย์ Facebook ได้ทำงานร่วมกับผู้สร้างภาพยนตร์เพื่อค้นหาวิธีที่ดีที่สุดในการกลั่นกรองภูมิปัญญาของพวกเขาให้เป็นข้อมูลเชิงลึกที่เรียนรู้จากเครื่องได้ ในกรณีหนึ่ง ทางบริษัทขอให้พวกเขาสาธิตวิธีถ่ายภาพฉากที่ไม่สามารถบันทึกข้อมูลที่เกี่ยวข้องทั้งหมดจากมุมคงที่มุมเดียวได้
พอร์ทัลประกอบด้วยเลนส์มุมกว้างพิเศษซึ่งการตัดสินใจในการเคลื่อนไหวและการแก้ไขทั้งหมดจะทำในรูปแบบดิจิทัลทั้งหมด
ในอีกทางหนึ่ง วิศวกรของ Facebook พิจารณาองค์ประกอบการถ่ายภาพต่างๆ ที่ผู้ควบคุมกล้องจัดลำดับความสำคัญในการถ่ายภาพแนวตั้งและแนวนอน การสังเกตเหล่านี้เป็นพื้นฐานของโมเดลซอฟต์แวร์ที่พยายามทำให้พอร์ทัลมีพฤติกรรมการตัดสินใจบางอย่างที่ปกติแล้วเราจะถือว่ามาจากความคิดสร้างสรรค์ของมนุษย์
“เราต้องการสร้างประสบการณ์การสนทนาทางวิดีโอแบบแฮนด์ฟรีที่ขจัดความรู้สึกห่างเหินและเป็นเช่นนี้ เหมือนออกไปเที่ยวด้วยกันมากกว่า” Eric Hwang หนึ่งในวิศวกรที่อยู่เบื้องหลัง Portal อธิบายกับ Digital Trends
ระบบผลลัพธ์ที่ Facebook กล่าวว่าใช้เวลา “น้อยกว่าสองปี” ในการสร้างตั้งแต่เริ่มต้น — ช่วยให้พอร์ทัลสามารถตัดสินใจที่ออกแบบมาเพื่อปรับปรุงการไหลของการสนทนา ใน โพสต์บล็อกที่เผยแพร่ใหม่โดยจะให้รายละเอียดภาพประกอบบางส่วนว่าทำไมสิ่งนี้ถึงจำเป็น ตัวอย่างเช่น หากคุณอยู่ในห้องที่มีผู้คนพลุกพล่าน เต็มไปด้วยผู้คนโต้ตอบกัน จะต้องเลือกว่าจะติดตามบุคคลนอกเฟรมเมื่อใด หรือจะซูมออกเมื่อใดเพื่อรองรับวัตถุใหม่ๆ
ในทำนองเดียวกัน จะต้องเรียนรู้ที่จะรับมือกับสถานการณ์แสงที่เปลี่ยนแปลงไปแบบเรียลไทม์ คุณจะทำอย่างไรหากตัวแบบของคุณนอนอยู่ในห้องมืดซึ่งมีผ้าห่มคลุมไว้ครึ่งหนึ่ง แต่มีเด็กวิ่งเล่นอยู่ในแบ็คกราวด์ทำให้เกิดภาพเบลอจากการเคลื่อนไหว พอร์ทัลจะชั่งน้ำหนักข้อมูลทั้งหมดนี้ภายในพริบตาและพยายามระบุผลลัพธ์ที่ดีที่สุด (หากคุณต้องการควบคุมผู้ที่โฟกัสด้วยตนเอง ตอนนี้ก็เป็นไปได้เช่นกัน.)
ความท้าทายทางเทคนิค
จากมุมมองด้านเทคนิค มีบางสิ่งที่ทำให้เทคโนโลยีของพอร์ทัลน่าประทับใจ ประการแรกคือสามารถทำทุกอย่างนี้ได้โดยไม่ต้องใช้กล้องที่กำลังเคลื่อนที่จริง ในช่วงต้นของกระบวนการพัฒนา วิศวกรของพอร์ทัลได้ทดลองใช้ต้นแบบซึ่งใช้กล้องแบบใช้มอเตอร์ซึ่งหมุนเพื่อหันหน้าเข้าหาวัตถุ อย่างไรก็ตาม เรื่องนี้ถูกตัดสินโดยพิจารณาจากสาเหตุที่ทำให้เกิดความล่าช้าและจุดที่อาจเกิดความล้มเหลวทางกลไก พอร์ทัลกลับประกอบด้วยเลนส์มุมกว้างพิเศษ ซึ่งการตัดสินใจด้านการเคลื่อนไหวและการแก้ไขทั้งหมดจะทำในรูปแบบดิจิทัลทั้งหมด
ประการที่สอง ทีมที่ทำงานเกี่ยวกับพอร์ทัลพบวิธีที่จะบรรลุกระบวนการตัดสินใจโดยไม่ต้องพึ่งพาการประมวลผลแบบคลาวด์ ตามคำกล่าวของ Hwang พลังการยิงในการคำนวณทั้งหมดเกิดขึ้นได้ในอุปกรณ์
“การถ่ายภาพทุกคนในเฟรมวิดีโอไม่ใช่ปัญหาทางวิศวกรรมที่ยาก เนื่องจากวิศวกรจำนวนมากสามารถทำได้ด้วยความก้าวหน้าด้านการมองเห็นของคอมพิวเตอร์ในปัจจุบัน” เขากล่าว “นวัตกรรมนี้อยู่ที่การจับบุคคลที่เกี่ยวข้องหรือบุคคลแบบเรียลไทม์บนอุปกรณ์ โดยใช้ชิปเคลื่อนที่ขนาดเล็กภายในพอร์ทัลเป็นพลังในการประมวลผล โดยปกติแล้ว A.I. ประเภทนี้ งานต่างๆ ต้องใช้เซิร์ฟเวอร์ขนาดใหญ่โดยเฉพาะ [เรา] เอาชนะอุปสรรคนั้นด้วยการบีบอัดโมเดลคอมพิวเตอร์วิทัศน์ที่ซับซ้อนจนกว่าจะพอดีกับชิปที่เราใช้สำหรับ Portal และยังคงทำงานได้อย่างแม่นยำและเชื่อถือได้”
ในการทำเช่นนี้ Portal ใช้การลงทุนระยะยาวของ Facebook ในด้านปัญญาประดิษฐ์ ใช้ระบบตรวจจับท่าทาง 2 มิติซึ่งทำงานที่ 30 เฟรมต่อวินาที ความตั้งใจของท่าเหล่านี้ช่วยให้พอร์ทัลสามารถตัดสินใจได้อย่างต่อเนื่องว่าตัวแบบกำลังทำอะไรอยู่ และอาจจำเป็นต้องแพนหรือซูมแบบดิจิทัลเมื่อใด นอกจากนี้ยังใช้การวิจัยเกี่ยวกับกล้องเชิงลึกที่พัฒนาโดย Facebook Reality Labs ซึ่งเป็นส่วนหนึ่งของความพยายามเสมือนจริงของยักษ์ใหญ่โซเชียลมีเดีย
ตลาดที่กำลังเติบโต
Facebook เชื่อมั่นว่าเป็นผู้ชนะด้วยพอร์ทัล ง่ายที่จะดูว่าความมั่นใจมาจากไหน ปัจจุบันตลาดลำโพงอัจฉริยะกำลังเฟื่องฟู แม้ว่าผู้นำตลาด Amazon จะถูกครอบงำโดยส่วนใหญ่ แต่ก็เป็นเช่นนั้น เติบโตมากกว่าร้อยละ 100 ต่อปี. นั่นเป็นข่าวดีสำหรับบริษัทเทคโนโลยีที่กำลังมองหาสิ่งที่ยิ่งใหญ่ต่อไปในเวลาที่แบนราบ สมาร์ทโฟน ฝ่ายขาย.
ในขณะที่ Facebook เป็นบริษัทยักษ์ใหญ่ด้านเทคโนโลยีรายสุดท้าย (Amazon, Alphabet,
“พอร์ทัลเป็นผลิตภัณฑ์เดียวในตลาดประเภทนี้” Hwang กล่าว “ทุกวันนี้ ลำโพงและจอแสดงผลอัจฉริยะสร้างขึ้นจากข้อมูลและการพาณิชย์ พอร์ทัลถูกสร้างขึ้นเพื่อให้ง่ายต่อการเชื่อมต่อกับผู้คนที่สำคัญที่สุด: เพื่อนสนิทและครอบครัวของเรา และพอร์ทัลมุ่งเน้นไปที่การเชื่อมโยงผู้คน ซึ่งเป็นส่วนหนึ่งของภารกิจของ Facebook ซึ่งปัจจุบันยังให้บริการไม่ดีนักในตลาดอุปกรณ์ในบ้าน”
ความท้าทายด้านความเป็นส่วนตัวรออยู่ข้างหน้า?
แล้วอะไรจะหยุดหยุด Facebook? อาจเป็นความเป็นส่วนตัว ผู้ใช้ได้พิสูจน์แล้วว่าเต็มใจที่จะยอมรับแกดเจ็ตที่ "รับฟังตลอดเวลา" จากบริษัทอย่าง Google ที่มีความสนใจในข้อมูลผู้ใช้อย่างน่าประหลาดใจ แต่อุปกรณ์ที่ทั้งเฝ้าดูและฟังคุณยังคงรุกรานมากกว่า นอกจากนี้ชื่อเสียงของ Facebook ยังคงตกต่ำตามมา เรื่องอื้อฉาวของ Cambridge Analytica เมื่อปีที่แล้ว.
การเพิ่มความฉลาดให้กับกล้องวิดีโอแชทพอร์ทัล (Facebook)
เพียงไม่กี่วันก่อนที่บทความนี้จะถูกตีพิมพ์ วอชิงตันโพสต์ รายงานแล้ว Facebook กำลังเจรจาเพื่อทำลายสถิติข้อตกลงมูลค่าหลายพันล้านดอลลาร์กับ FTC สำหรับการละเมิดความเป็นส่วนตัว ด้วยกระแสตอบรับที่เพิ่มมากขึ้นจากผู้ใช้เก่าจำนวนมาก ยังไม่มีการเปิดเผยหากเป็นเช่นนั้น
Facebook ให้คำรับรองกับเราว่าจะไม่ฟัง ดู หรือเก็บเนื้อหาของการสนทนาทางวิดีโอของพอร์ทัล ซึ่งได้รับการเข้ารหัสเพิ่มเติมเพื่อหลีกเลี่ยงการดักฟัง ความจริงที่ว่า A.I. ของพอร์ทัล สมาร์ททำงานภายในอุปกรณ์และไม่ได้เปิดอยู่
แต่ไม่อาจหลีกเลี่ยงความจริงที่ว่ายังมีการรวบรวมข้อมูลอยู่บ้าง “แม้ว่าเราจะไม่ฟัง ดู หรือเก็บเนื้อหาของการสนทนาทางวิดีโอพอร์ทัลของคุณ หรือใช้ข้อมูลนี้เพื่อกำหนดเป้าหมายโฆษณา แต่เรา ประมวลผลข้อมูลการใช้งานอุปกรณ์บางอย่างเพื่อทำความเข้าใจวิธีการใช้งานพอร์ทัลและเพื่อปรับปรุงผลิตภัณฑ์” บันทึกของ Facebook (นโยบายความเป็นส่วนตัวของพอร์ทัล สามารถอ่านได้ที่นี่.)
พอร์ทัลนำเสนอเทคโนโลยีอันชาญฉลาดซึ่งมีผลกระทบอย่างมากต่ออนาคตของวิดีโอแชท ไม่ต้องสงสัยเลยว่าบริษัทสามารถดึงเอาสิ่งที่น่าประทับใจมากออกมาได้จากมุมมองทางเทคโนโลยี แต่ไม่ว่าจะสามารถโน้มน้าวผู้มีโอกาสเป็นลูกค้าได้ว่านี่คือโซลูชันที่พวกเขาต้องการในชีวิตหรือไม่ ท้ายที่สุดแล้ว จะสามารถพิสูจน์ได้ว่าเป็นความสำเร็จที่แท้จริง
คำแนะนำของบรรณาธิการ
- อ่าน 'พระคัมภีร์สังเคราะห์' ที่สวยงามน่าขนลุกของ A.I. ที่คิดว่าเป็นพระเจ้า
- นางแบบภาษา: GPT-3 เปิดตัว A.I. อย่างเงียบ ๆ ได้อย่างไร การปฎิวัติ
- เราใช้ระบบ A.I. เครื่องมือออกแบบเพื่อสร้างโลโก้ใหม่ นี่คือสิ่งที่เกิดขึ้น
- A.I. สัญลักษณ์ประสาท คืออนาคตของปัญญาประดิษฐ์ นี่คือวิธีการทำงาน
- ทบทวนการเติบโตของ A.I.: ปัญญาประดิษฐ์มาไกลแค่ไหนแล้วนับตั้งแต่ปี 2010