Veritone רוצה Deepfake לשכפל את הקול שלך

יש וִידֵאוֹ שמופיע מעת לעת בפיד היוטיוב שלי. מדובר בשיחה בין הראפרים סנופ דוג ו-50 סנט שמקוננת על העובדה שבהשוואה לדור שלהם, כל אמני ההיפ-הופ המודרניים נשמעים אותו דבר. "כשאדם מחליט להיות עצמו, הוא מציע משהו שאף אחד אחר לא יכול להיות", אומר 50 סנט. "כן, 'כי ברגע שאתה תהיה אתה - מי יכול להיות אתה חוץ ממך?" סנופ מגיב.

תוכן

  • "אנחנו יכולים לשנות הרבה"
  • איך הציבור יגיב?
  • חשוב על העתיד

סנופ דוג מתחזה לזרימה דומה לראפרים של היום

כשהסרטון הועלה באוקטובר 2014, ייתכן שזה היה נכון באופן כללי. אבל רק כמה שנים מאוחר יותר זה בהחלט לא. בעולם של זיוף שמע עמוק, אפשר להכשיר A.I. להישמע דומה להחריד לאדם אחר על ידי הזנתו בקורפוס שמע המורכב משעות של הנתונים המדוברים שלו. התוצאות הן מדויק להחריד.

סרטונים מומלצים

אישי ציבור כמו הראפר ג'יי זי והפסיכולוג ג'ורדן פיטרסון כבר התלוננו על אנשים שמנצלים את הקולות שלהם על ידי יצירת זיופים עמוקים של אודיו ואז גורמים להם לומר דברים מטופשים באינטרנט. "תתעורר," כתב פיטרסון. "קדושת קולך ותדמיתך נמצאים בסיכון רציני." אלה רק המקרים השובבים. באחרים, התוצאות עלולות להתהפך לעבריינות חסרת ניואנסים. ב

תקרית אחת ב-2019, עבריינים השתמשו בזיוף שמע עמוק כדי להתחזות לקולו של מנכ"ל חברת אנרגיה ולשכנע תחת טלפון להעביר בדחיפות 243,000 דולר לחשבון בנק.

וריטון, A.I. חברה שיוצרת כלים חכמים לתיוג מדיה לתעשיית הבידור, היא מחזיר את כוח הזיוף העמוק של האודיו לידיים (או, נכון, לגרונות) של אלה שזה להם בצדק שייך. החודש הודיעה החברה Marvel.ai, מה שנשיא החברה ריאן סטילברג תיאר בפני Digital Trends כ"פתרון קול כשירות שלם". תמורת תשלום, Veritone תבנה A.I. דגם את זה נשמע בדיוק כמוך (או, סביר יותר, אדם מפורסם עם קול שניתן לזהות מיד), אשר לאחר מכן ניתן לקבל רישיון בהשאלה כמו גרסת היי-טק של של אריאל עסקת קול כבטוחה מ בת הים הקטנה.

קול סינתטי מאת MARVEL.ai

"הקול שלך הוא בעל ערך בדיוק כמו כל תוכן או תכונת מותג אחרת שיש לך", אמר סטילברג. "[זה ברמה של] השם והדמות שלך, הפנים שלך, החתימה שלך, או שיר שכתבת או פיסת תוכן שיצרת."

"אנחנו יכולים לשנות הרבה"

אנשים מסוימים, כמובן, מכרו מזמן את קולם בצורה של הקלטת פרסומות או קריינות, שירים, ועוד אינספור צורות של מונטיזציה. אבל כל המאמצים הללו דרשו מהאדם לומר את המילים. מה שהפתרון של Veritone מבטיח לעשות הוא להפוך את זה להרחבה בנפרד.

מה אם, למשל, זה היה אפשרי עבור קווין הארט לתת רישיון קולו למותג יוקרה שיוכל להשתמש בו כדי ליצור מודעות מותאמות אישית כולל את שם הצופה, המיקום של חנות המכירה הקרובה ביותר שלו, והמוצר המסוים שהם עשויים להיות בעלי סבירות גבוהה לִקְנוֹת? במקום לבלות ממש ימים בתא ההקלטה, A.I. יכול לאפשר לעשות זאת עם מעט יותר (על חלקו של הארט, לפחות) מאשר לחתום על הקו המקווקו כדי להסכים שדמיון הקול שלו ירתום על ידי השלישי האמור מפלגה. בזמן שהוא יצא לצלם סרט, לעשות סיור קומי, או לקחת חופשה, או אפילו לישון, הקול הדיגיטלי שלו יכול לגרוף את הכסף.

"אנחנו יכולים לשנות הרבה", הסבירה סטילברג, בנוגע לתהליך ההכשרה. "אנשים שכבר מדברים המון, אם הם מפיקים פודקאסט או בתקשורת, יש הרבה נתונים בחוץ. כנראה שיש לנו כבר המון מזה אם הם במקרה לקוחות שלנו".

"מה שאנחנו מוצאים כל כך מרתק בקטגוריה החדשה הזו של A.I. הוא ההרחבה והשונות."

סטילברג אמר שהרעיון של "קול כשירות" עלה על וריטון לפני מספר שנים. עם זאת, באותה תקופה הוא לא היה משוכנע שמודלים של למידת מכונה מסוגלים ליצור את הקולות הסינתטיים ההיפר-ריאליסטיים שהוא חיפש. זה חשוב במיוחד כשמדובר בקולות שאנו מכירים מקרוב, גם אם מעולם לא פגשנו את הדובר המדובר. התוצאות יכולות להיות סוג של נִשׁמָע עמק מוזר, כשכל צליל שגוי מתריע למאזינים על העובדה שהם מאזינים לזיוף. אבל כאן ב-2021 הוא משוכנע שהדברים התקדמו עד לנקודה שבה זה אפשרי כעת. מכאן Marvel.ai.

סטילברג מדבר במילות באז נרגשות על הפוטנציאל האדיר של הטכנולוגיה, ומדבר על השפע האפשרי של "דרכי ביצוע". Veritone יכולה ליצור מודלים לטקסט לדיבור. זה גם יכול לבנות מודלים של דיבור לדיבור, לפיהם שחקן קול יכול "להניע" הופעה ווקאלית על ידי קריאה המילים עם נטייה מתאימה ולאחר מכן כיסוי הקול המוגמר בסוף כמו סנאפצ'ט לְסַנֵן. החברה יכולה גם לטביעת אצבע על כל קול כדי לדעת אם קטע אודיו אמיתי שצץ במקום כלשהו נוצר באמצעות הטכנולוגיה שלה.

"ככל שתחשוב על זה יותר... אתה ממש תמצא עוד 50 [מקרי שימוש אפשריים]", אמר. "מה שאנחנו מוצאים כל כך מרתק בקטגוריה החדשה הזו של A.I. הוא ההרחבה והשונות."

קחו בחשבון כמה אחרים. ספורטאי מפורסם אולי הוא אל על מגרש הכדורסל, אבל שטן כשזה מגיע קריאת שורות בתסריט בצורה שנשמעת טבעית. באמצעות הטכנולוגיה של Veritone, חלקם בקטעי משחק וידאו או קריאת ספר אודיו של ספר הזיכרונות שלהם (שהם הם אולי גם לא כתב) יכול להיות מבוצע על ידי שחקן קול, אשר לאחר מכן מותאם דיגיטלית כך שיישמע כמו אַתלֵט. כאפשרות נוספת, ניתן לתרגם סרט למדינות אחרות עם אותו קול שחקן שקורא כעת את שורות בצרפתית, מנדרינית או כל אחת ממספר שפות, גם אם השחקן לא ממש מדבר אוֹתָם.

איך הציבור יגיב?

שאלה גדולה שתלויה על כל זה, כמובן, היא איך חברי הציבור הולכים להגיב לכל זה. זה החלק המסובך והבלתי צפוי. ידוענים כיום חייבים למלא תפקיד מורכב: גם דמויות גדולות מהחיים שראויות להדביק את פניהן על שלטי חוצות, וגם אנשים קרובים שיש להם בעיות ביחסים, מצייצים על צפייה בטלוויזיה בפיג'מה ועושים פרצופים מטופשים כשהם אוכלים חם רוטב.

מה קורה, אם כן, כשמופיעות מודעות שלא רק מציגות שורה של ידוענים שקוראים, אלא במקרים שבהם אנחנו יודעים שזה נאמר הפרפורמר מעולם לא אמר את השורות האלה, אלא השתמש בקול שלהם באופן תוכניתי כדי להביא לנו ממוקד מוֹדָעָה? סטילברג אמר שזה מעט שונה מידוען שמעביר את השליטה על המדיה החברתית שלו למנהל חשבון צד שלישי. אם אנחנו רואים את טיילור סוויפט מצייץ, אנחנו יודעים שסביר להניח שלא טיילור עצמה מקליטה את ההודעה, במיוחד אם מדובר בתמיכה או בקטע של תוכן פרסומי.

אבל הקול הוא, בצורה מאוד אמיתית, שונה, בדיוק בגלל שהוא אישי יותר. במיוחד אם זה מלווה במידה של התאמה אישית, שהיא אחד ממקרי השימוש שהכי הגיוניים. האמת היא שאם לצטט את התסריטאי וויליאם גולדמן, אף אחד לא יודע מה תהיה התגובה הציבורית - בדיוק בגלל שאף אחד לא עשה בדיוק את זה בעבר.

"זה ירוץ את הספקטרום, נכון?" אמר סטילברג. "[יש] אנשים שיגידו, 'אני הולך להשתמש בכלי הזה קצת כדי להגדיל את היום שלי כדי לעזור לי לחסוך זמן'. אחרים הולכים לומר, בפה מלא, 'אני רוצה שהקול שלי בכל מקום ירחיב את המותג שלי, ואני הולך לתת לו רישיון הַחוּצָה.'"

הניחוש הטוב ביותר שלו הוא שהקבלה תהיה על בסיס כל מקרה לגופו. "אתה צריך להיות מתואם עם תגובת הקהל שלך, ואם אתה רואה שדברים עובדים או לא עובדים", אמר. "יכול להיות שהם יאהבו את זה. הם עשויים לומר, 'אתה יודע מה? אני אוהב את העובדה שאתה מוציא לי פי 10 יותר תוכן או יותר תוכן אישי, למרות שאני יודע שהשתמשת בתוכן סינתטי כדי להגדיל אותו. תודה. תודה.'"

חשוב על העתיד

Veritone MARVEL.ai
וריטון

לגבי העתיד? סטילברג אמר כי "אנחנו רוצים לעבוד עם כל סוכנויות הכישרונות הגדולות. אנחנו חושבים שכל מי שעוסק בעשיית כסף סביב מותג נדיר צריך לחשוב על אסטרטגיית הקול שלו".

ואל תצפה שזה יישאר רק על אודיו. "תמיד היינו מוקסמים מהפוטנציאל של שימוש בתוכן סינתטי כדי להרחיב, להגדיל או להחליף לחלוטין כמה מהצורות הישנות של ייצור תוכן", המשיך. "בין אם זה במובן האודיו או, בסופו של דבר, בעתיד, א חוש וידאו.”

זה נכון: ברגע שהיא תפסה את השוק בעולם של זיופי שמע עמוקים, Veritone מתכננת ללכת צעד אחד קדימה ולהיכנס לעולם של אווטרים וירטואליים ממומשים במלואם שגם נשמעים וגם נראים בלתי ניתנים להבחנה מהמקור שלהם.

פתאום אלה מודעות מותאמות אישית מ דו"ח מיעוט נשמע הרבה פחות כמו מדע בדיוני.

המלצות עורכים

  • פרסי Tech For Change של Digital Trends CES 2023
  • בתוך המלחמה ההולכת ומסלימה במהירות בין זיופים עמוקים לגלאי זיופים עמוקים
  • אלכסה וסירי לא יכולות להבין את טון הקול שלך, אבל אוטו כן
  • קליפורניה פועלת נגד זיופים עמוקים לפוליטיקה ופורנו
  • שמור על אנונימיות באינטרנט עם טכנולוגיית Deepfake שמייצר לך פנים חדשות לגמרי