AI קריאת שפתיים מרסק בני אדם בפירוש משפטים אילמים

LipNet: כמה קל לדעתך קריאת שפתיים?

אחד החלקים הזכורים ביותר ביצירת המדע הבדיוני של סטנלי קובריק 2001: אודיסיאה בחלל הוא קו עלילה שבו שני חברי ה Discovery One צוות החללית הולך וגובר בחשדנות כלפי התנהגותו של עוזר הבינה המלאכותית של הספינה, HAL 9000.

בידיעה ש-HAL כל הזמן מקשיב למה שהם אומרים, הם נסוגים למקום שהם יודעים ש-HAL לא יכול להקשיב ומסכים לנתק אותו. HAL מרעיש את התוכנית שלהם לאחר ששני האסטרונאוטים לא מצליחים לקחת בחשבון את יכולות קריאת שפתיים מעולות של AI.

דברים עתידניים, אה? לא לפי מחקר שבוצע על ידי חוקרים מאוניברסיטת אוקספורד. הם פיתחו תוכנית בינה מלאכותית בשם LipNet, שמסוגלת לפרש במדויק את מה שאנשים אומרים, רק על סמך האופן שבו הם מזיזים את הפה כשהם מדברים.

קָשׁוּר

  • Photoshop AI חושב ש'אושר' הוא חיוך עם שיניים רקובות
  • העליתי את רעיון הסטארט-אפ המגוחך שלי ל-VC רובוט
  • איך נדע מתי בינה מלאכותית באמת הופכת לחושית?

"LipNet מבצעת קריאת שפתיים ברמת המשפט באמצעות למידת מכונה," ברנדן שילינגפורד, אחד החוקרים בנושא עיתון, אמר ל-Digital Trends. "רשת עצבית הדומה למודלים מתקדמים של זיהוי דיבור מעבדת רצף של פריימים וידיאו, וממפה אותם למשפט. גישות קודמות עבדו על ידי מילים בודדות חזויות ולא משפטים."

סרטונים מומלצים

הביצועים של LipNet משתווים לטובה להפליא למומחי קריאת שפתיים אנושיים ב-GRID corpus, מערך הנתונים הגדול ביותר לקריאת שפתיים ברמת המשפט הזמין לציבור. למעשה, כאשר מומחים אנושיים קיבלו רק 52 אחוזים, LipNet השיגה 93 אחוזים. הגישה מבוססת המשפטים שלה לקריאת שפתיים גם ריסקה את הניסיון הקודם הטוב ביותר של מכונה, שניהלה דיוק של 79.6 אחוז באותו מערך נתונים.

עם זאת, בעוד שה-HAL 9000 הפיקטיבי משתמש בכוחות קריאת השפתיים שלו ללא תועלת, לצוות שמאחורי LipNet יש מטרות אחרות ליצירתם. בסביבות 360 מיליון אנשים ברחבי העולם יש אובדן שמיעה מוגבל. כלים כמו LipNet יכולים להיות משמעותיים ביותר עבור אנשים אלה, על ידי כך שהם עוזרים לפרש דיבור בצורה מדויקת באופן שמקל על חייהם.

"יישומים נוספים שאנו מעוניינים בהם כוללים הכתבה אילמת במרחבים ציבוריים, שיחות סמויות, זיהוי דיבור בסביבות רועשות, זיהוי ביומטרי ועיבוד סרטים אילמים", שילינגפורד נמשך.

בעוד שמעקב הולך להיות בעיה בכל טכנולוגיה כזו, ננדו דה פרייטס, שגם עבדה על הפרויקט, אמרה שלא מדובר באפליקציה שהתמקדו בה. עם זאת, הוא אמר כי "לא יהיה מפתיע" אם מעבדות אחרות ינסו לבנות על עבודה כזו למטרה זו בעתיד.

"הציבור חייב להיות מודע לכך, ולהסתמך על המוסדות הדמוקרטיים החוקיים שלנו שיקבעו חוקים מתאימים שיגנו על פרטיותנו וכבודנו", המשיך דה פרייטס. "התקווה שלנו היא שעל ידי פרסום העבודה הזו נעזור להעלות את המודעות, תוך שימת דגש על התועלת של הטכנולוגיה הזו כדי לעזור לאנשים במצוקה."

המלצות עורכים

  • יריבת ChatGPT של אפל עשויה לכתוב עבורך קוד אוטומטית
  • Meta יצרה DALL-E לווידאו, וזה גם מצמרר וגם מדהים
  • אשליות אופטיות יכולות לעזור לנו לבנות את הדור הבא של AI
  • מחשב נייד למידת מכונה של Lambda הוא Razer במסווה
  • קרא את 'הכתב הסינטטי' היפה להחריד של א.י. שחושב שזה אלוהים

שדרג את אורח החיים שלךמגמות דיגיטליות עוזרות לקוראים לעקוב אחר עולם הטכנולוגיה המהיר עם כל החדשות האחרונות, ביקורות מהנות על מוצרים, מאמרי מערכת מעוררי תובנות והצצות מיוחדות במינן.