כך לימדה פייסבוק את פורטל A.I. לחשוב כמו קולנוען הוליוודי

סקירה של פייסבוק פורטל+
דן בייקר/טרנדים דיגיטליים

כאשר מארק צוקרברג בנה את הגרסה הראשונה של פייסבוק בחדר המעונות שלו בקולג' בהרווארד, הוא דמיין אותה כחלון שיאפשר לאנשים להסתכל על חייהם של משתמשים אחרים. אם גוגל הייתה מנוע חיפוש למידע אז פייסבוק, לעומת זאת, הייתה מנוע חיפוש לאנשים. 15 שנים מאוחר יותר, פייסבוק לקחה את השאיפה הזו לשלב הבא. על ידי יצירת Portal ו-Portal+, קו הרמקולים החכמים המשופרים למסך שלה, שהושק בנובמבר 2018, ענקית המדיה החברתית הקימה חלון הרבה יותר מילולי, המאפשר למשתמשי פייסבוק לבצע שיחות וידאו לאחד אַחֵר.

תוכן

  • הופך את המצלמות לחכמות יותר
  • אתגרים טכניים
  • שוק צומח
  • אתגרי הפרטיות לפנינו?

הרמקולים החכמים של פורטל מיישמים אחר פייסבוק גם לחלום. איפה שפייסבוק הייתה, בעצם, מנוע חיפוש לאנשים, פורטל למעשה עושה חפש אותם: עם מצלמת 12 מגה-פיקסל משוטטת, המתגאה בשדה ראייה של 140 מעלות, שעוקבת אחריך ברחבי החדר כדי לראות מה אתה עושה. כטרנדים דיגיטליים לשים את זה בסקירה שלנו, "אם אתה עסוק בלהסתובב במטבח בזמן שאתה שואל את סבתא איך להכין את הקציצות המפורסמות שלה, אתה יכול להיות עסוק תוך כדי הקשבה לדבר שלה."

סרטונים מומלצים

מהי בעצם הטכנולוגיה החכמה שמניעה את פורטל? ואיך לדעתה פייסבוק ניצחה את האתגר של לגרום לווידאו צ'אט רגיל להרגיש אישי כמו לשבת לשיחה אמיתית? התשובה כרוכה באינטליגנציה מלאכותית מרשימה - ומגע אנושי נוסף.

קָשׁוּר

  • חישת רגשות א.י. נמצא כאן, וזה יכול להיות בראיון העבודה הבא שלך
  • מכיוון ש-2020 לא מטורף מספיק, פה רובוט שר A.I. תפילות בפריז
  • א.י. שינוי קנה מידה גורם לסרט הזה משנת 1896 להיראות כאילו צולם ב-4K מסנוור
סקירה של פייסבוק פורטל+
דן בייקר/טרנדים דיגיטליים

הופך את המצלמות לחכמות יותר

כבר מההתחלה, פייסבוק ידעה שהליבה לחוויית הפורטל שלה תהיה מערכת המכונה "מצלמה חכמה". הרעיון של המצלמה החכמה היה לעבור מעבר לסוג הצילום הסטטי ששירותים כמו סקייפ מציעים לנו כבר שנים, ולמלא תפקיד יצירתי יותר בתהליך. כמו שבמאי קולנוע או צלם קולנוע יודעים מתי להשתמש בצילום רחב או מתי להגדיל את התצוגה לתקריב אינטימי, כך פייסבוק אתגר את המהנדסים שלה לחקות את אותה יכולת עם פורטל.

כדי לתת למצלמה הזו את המגע האנושי הדרוש, פייסבוק עבדה עם יוצרי סרטים כדי למצוא את הדרך הטובה ביותר לזקק את החוכמה שלהם לתובנות הניתנות ללמידה באמצעות מכונה. במקרה אחד, הוא ביקש מהם להדגים כיצד הם עשויים לצלם סצנה שבה אי אפשר לתפוס את כל המידע הרלוונטי מזווית אחת קבועה.

פורטל כולל עדשה רחבה במיוחד שבה כל החלטות התנועה והעריכה מתקבלות באופן דיגיטלי לחלוטין.

באחר, מהנדסי פייסבוק בחנו את מרכיבי הצילום השונים שמפעילי המצלמות מעדיפים בצילומי פורטרט ונוף. תצפיות אלו היוו את הבסיס למודלים של תוכנה המנסים להחדיר לפורטל כמה מהמוזרויות של קבלת ההחלטות שהיינו מייחסים בדרך כלל ליצירתיות אנושית.

"רצינו ליצור חווית שיחות וידאו ללא ידיים שמסירה תחושות של ריחוק פיזי וקיים יותר כמו לבלות ביחד", הסביר אריק הוואנג, אחד המהנדסים מאחורי פורטל, ל-Digital Trends.

המערכת שהתקבלה - שלדברי פייסבוק לקח "פחות משנתיים" ליצור מאפס - מאפשרת לפורטל לקבל החלטות שנועדו לשפר את זרימת השיחה. ב פוסט חדש שפורסם בבלוג, הוא מפרט כמה מההמחשות מדוע זה עשוי להיות נחוץ. לדוגמה, אם אתה בחדר צפוף, מלא באנשים המקיימים אינטראקציה זה עם זה, הוא חייב לבחור מתי לעקוב אחר אדם מחוץ לפריים או מתי להתרחק כדי להכיל נושאים חדשים.

מהנדסי התוכנה של פייסבוק אריק הוואנג (יושב בכיסא בתחילה) וארתור קוואלקנטי מדגימים את המעקב והפריים דמוי המצלמה הקולנועית של הפורטל.

באופן דומה, עליו ללמוד להתמודד עם מצבי אור משתנים בזמן אמת. מה אתה עושה אם הנושא שלך שוכב בחדר חשוך, מכוסה למחצה בשמיכה, אבל יש ילדים שמתרוצצים ברקע וגורמים לטשטוש תנועה? פורטל שוקל את כל המידע הזה בפחות מהרף עין ומנסה לקבוע את התוצאה הטובה ביותר. (אם אתה רוצה לשלוט באופן ידני במי זה מתמקד, גם זה אפשרי עכשיו.)

אתגרים טכניים

מנקודת מבט טכנית, כמה דברים הופכים את הטכנולוגיה של פורטל למרשימה. הראשון הוא שהוא יכול לעשות את כל זה ללא שימוש במצלמה נעה ממשית. בשלב מוקדם של תהליך הפיתוח, המהנדסים של פורטל ניסו אבות טיפוס שהשתמשו במצלמה ממונעת, שהסתובבה כדי להתמודד עם נושאים. עם זאת, זה הוחלט נגד על בסיס שזה גרם לפיגור ונקודה של כשל מכני פוטנציאלי. במקום זאת, פורטל כולל עדשה רחבה במיוחד שבה כל החלטות התנועה והעריכה מתקבלות באופן דיגיטלי לחלוטין.

שנית, הצוות שעבד על פורטל מצא דרך להשיג את תהליכי קבלת ההחלטות שלו מבלי להסתמך על מחשוב ענן. לפי Hwang, כוח האש החישובי מושג כולו בתוך המכשיר.

אבולוציה של פורטל פייסבוק
אבות טיפוס מוקדמים של פורטל הסתמכו על מנוע כדי להזיז פיזית את המצלמה.הנדסת פייסבוק

"לכידת כולם במסגרת וידאו היא לא בעיה הנדסית קשה, שכן מהנדסים רבים יכולים לעשות זאת עם התקדמות הראייה הממוחשבת של היום", אמר. "החידוש הוא בלכידת האנשים או האדם הרלוונטיים בזמן אמת, במכשיר, תוך שימוש רק בשבב הנייד הקטן בתוך פורטל ככוח עיבוד. בדרך כלל סוגים אלה של A.I. משימות דורשות שרתים ייעודיים וגדולים. [אנחנו] התגברנו על המכשול הזה על ידי דחיסה של מודלים מורכבים של ראייה ממוחשבת עד שיוכלו להתאים לשבב שבו אנו משתמשים עבור פורטל ועדיין לפעול בצורה מדויקת ואמינה."

לשם כך, פורטל מסתמך על ההשקעה ארוכת הטווח של פייסבוק בבינה מלאכותית. הוא משתמש במערכת 2D לזיהוי תנוחות הפועלת במהירות של 30 פריימים לשנייה. הכוונה של התנוחות הללו עוזרת לפורטל לקבל החלטות מתמשכות לגבי מה שהנבדקים שלו עושים - ומתי הוא עשוי להזדקק לתנועה דיגיטלית או זום כתוצאה מכך. בנוסף, היא משתמשת במחקר על מצלמות עומק שפותחו על ידי Facebook Reality Labs כחלק ממאמצי המציאות המדומה של ענקית המדיה החברתית.

שוק צומח

פייסבוק משוכנעת שהיא מנצחת עם פורטל. קל לראות מאיפה בא הביטחון שלה. נכון לעכשיו, שוק הרמקולים החכמים פורח. למרות שהיא נשלטת במידה רבה על ידי מובילת השוק אמזון, היא כן צומח ביותר מ-100 אחוז משנה לשנה. אלו חדשות טובות עבור חברות טכנולוגיה שמחפשות את הדבר הגדול הבא בזמן של השטחה סמארטפון מכירות.

סקירה של פייסבוק פורטל+
דן בייקר/טרנדים דיגיטליים

בעוד שפייסבוק הייתה האחרונה מבין ארבע ענקיות הטכנולוגיה הגדולות (אמזון, אלפבית, פייסבוק ואפל) לקפוץ על העגלה, זה עדיין אחד מהראשונים גל של רמקולים חכמים מרוכזים סביב המסך כמכשיר תקשורת.

"פורטל הוא המוצר היחיד בשוק מסוגו", אמר הוואנג. "כיום, רמקולים וצגים חכמים בנויים סביב מידע ומסחר. הפורטל בנוי כדי להקל על החיבור עם האנשים החשובים ביותר: החברים והמשפחה הקרובים ביותר שלנו. ופורטל מתמקד בחיבור בין אנשים - חלק מהמשימה של פייסבוק - ששוק המכשירים הביתיים אינו משרת היטב כעת".

אתגרי הפרטיות לפנינו?

אז מה עוצר לעצור את פייסבוק? ובכן, אולי פרטיות. משתמשים הוכיחו שהם נכונים באופן מפתיע לאמץ גאדג'טים "מקשיבים תמיד" מחברות כמו גוגל בעלות עניין בנתוני משתמשים. אבל מכשיר שגם צופה וגם מקשיב לך הוא עדיין פולשני יותר. יתר על כן, המוניטין של פייסבוק עדיין סובל לאחר מכן שערוריית קיימברידג' אנליטיקה בשנה שעברה.

הוספת חכמות למצלמת הווידאו צ'אט של פורטל (פייסבוק)

ימים ספורים לפני פרסום המאמר הזה בדיוק, ה וושינגטון פוסט דיווח שפייסבוק מנהלת משא ומתן על הסדר שובר שיא של מיליארדי דולרים עם ה-FTC על עבירות הפרטיות שלה. עם תגובה גוברת של משתמשים לשעבר רבים, עדיין לא נחשף אם פייסבוק יש להיט בסגנון Amazon Echo על הידיים - או פלופ בסגנון Amazon Fire Phone.

פייסבוק הבטיחה לנו שהיא לא מקשיבה, מציגה או שומרת את התוכן של שיחות וידאו בפורטל, שמוצפנות בנוסף כדי למנוע האזנת סתר. העובדה שה-A.I. חכמים פועלים באופן מקומי על המכשיר, ולא על פייסבוק שרתים, גם אומר שהמידע הזה לא יוצא מהבית שלך. פקודות קוליות נשלחות לחברה רק לאחר שאתה אומר "היי פורטל", ומשתמשים יכולים למחוק את היסטוריית הקול שלהם ביומן הפעילות של פייסבוק בכל עת.

אבל אי אפשר לעקוף את העובדה שעדיין מתקיימת מידה של איסוף נתונים. "למרות שאיננו מאזינים, מציגים או שומרים את התוכן של שיחות הווידאו שלך בפורטל, או משתמשים במידע זה כדי למקד מודעות, אנו עבדו קצת מידע על השימוש במכשיר כדי להבין כיצד נעשה שימוש בפורטל וכדי לשפר את המוצר", מציינת פייסבוק. (מדיניות הפרטיות של פורטל ניתן לקרוא כאן.)

פורטל מציע טכנולוגיה חכמה מאוד עם השלכות עצומות על עתיד הווידאו צ'אט. אין ספק שהחברה הצליחה להוציא משהו מאוד מרשים מבחינה טכנולוגית. אבל אם זה יכול לשכנע לקוחות פוטנציאליים שזהו פתרון שהם צריכים בחייהם יתגלה, בסופו של דבר, כהישג האמיתי.

המלצות עורכים

  • קרא את 'הכתב הסינטטי' היפה להחריד של א.י. שחושב שזה אלוהים
  • דוגמנית העל בשפה: איך GPT-3 פותח בשקט את ה-A.I. מַהְפֵּכָה
  • השתמשנו ב-A.I. כלי עיצוב כדי להמציא לוגו חדש. הנה מה שקרה
  • נוירו-סימבולי א.י. הוא העתיד של הבינה המלאכותית. ככה זה עובד
  • בוחנים מחדש את עלייתה של A.I.: עד כמה הגיעה הבינה המלאכותית מאז 2010?