AI זה יכול לזייף את הקול שלך לאחר שלוש שניות בלבד

בינה מלאכותית (AI) היא שיש רגע עכשיו, והרוח ממשיכה לנשוב במפרשיה עם החדשות שמיקרוסופט עובדת על בינה מלאכותית שיכולה לחקות את הקול של כל אחד לאחר שהוזנה מדגימה קצרה של שלוש שניות.

הכלי החדש, המכונה VALL-E, הוכשר על כ-60,000 שעות של נתונים קוליים בשפה האנגלית, שלדברי מיקרוסופט הוא "גדול מאות מונים ממערכות קיימות". באמצעות הידע הזה, יוצריו טוענים שהוא צריך רק מעט קטן של קלט קולי כדי להבין איך לשכפל את הקול של המשתמש.

איש מדבר בטלפון
Fizkes/Shutterstock

מרשים יותר, VALL-E יכול לשחזר את הרגשות, הגוונים הקוליים והסביבה האקוסטית שנמצאת בכל דגימה, משהו שתוכניות בינה מלאכותיות קוליות אחרות נאבקו בו. זה נותן לו הילה מציאותית יותר ומקרב את התוצאות שלו למשהו שיכול לעבור כדיבור אנושי אמיתי.

קָשׁוּר

  • GPT-4: איך להשתמש בצ'אט בוט הבינה המלאכותית שמביישת את ChatGPT
  • Google Bard יכול עכשיו לדבר, אבל האם הוא יכול להטביע את ChatGPT?
  • חברת הבינה המלאכותית החדשה של אילון מאסק שואפת "להבין את היקום"

בהשוואה למתחרים אחרים של טקסט לדיבור (TTS), מיקרוסופט אומרת ש-VALL-E "מתעלה באופן משמעותי על מערכת ה-TTS החדישה ביותר במונחים של דיבור. טבעיות ודמיון דובר." במילים אחרות, VALL-E נשמע הרבה יותר כמו בני אדם אמיתיים מאשר בינה מלאכותית מתחרה שנתקלת בכניסות אודיו שהם לא אומנו עַל.

סרטונים מומלצים

ב-GitHub, מיקרוסופט יצרה א ספרייה קטנה של דוגמאות נוצר באמצעות VAL-E. התוצאות ברובן מרשימות מאוד, עם דגימות רבות שמשחזרות את התחושה והמבטא של קולות הדוברים. חלק מהדוגמאות פחות משכנעות, מה שמציין ש-VALL-E הוא כנראה לא מוצר מוגמר, אבל בסך הכל הפלט משכנע.

פוטנציאל ענק - וסיכונים

אדם המנהל שיחת וידאו במכשיר Microsoft Surface שבו פועל Windows 11.
Microsoft/Unsplash

ב נייר המציג את VALL-E, מיקרוסופט מסבירה ש-VALL-E "עשוי לשאת סיכונים פוטנציאליים בשימוש לרעה במודל, כגון קול זיוף זיהוי או התחזות לדובר ספציפי". כלי כל כך מסוגל ליצור העלאות דיבור בעלות צליל ריאליסטי הספקטרום של זיופים עמוקים יותר ויותר משכנעים, שיכול לשמש כדי לחקות כל דבר משותף רומנטי לשעבר ועד אישיות בינלאומית בולטת.

כדי להפחית את האיום הזה, מיקרוסופט אומרת "אפשר לבנות מודל זיהוי כדי להבחין אם קליפ אודיו סונתז על ידי VALL-E." החברה אומרת שהיא תשתמש גם בעצמה עקרונות AI בעת פיתוח עבודתו. עקרונות אלה מכסים תחומים כמו הוגנות, בטיחות, פרטיות ואחריות.

VALL-E הוא רק הדוגמה האחרונה לניסוי של מיקרוסופט עם AI. לאחרונה, החברה עבדה על שילוב של ChatGPT ב-Bing, באמצעות AI כדי לסכם את פגישות הצוותים שלך, והשתלת כלים מתקדמים באפליקציות כמו Outlook, Word ו-PowerPoint. ולפי Semafor, מיקרוסופט מחפשת להשקיע 10 מיליארד דולר ביצרנית ChatGPT OpenAI, חברה שכבר חרשה אליה כספים משמעותיים.

למרות הסיכונים לכאורה, כלים כמו VALL-E יכולים להיות שימושיים במיוחד ברפואה, למשל, כדי לעזור לאנשים להחזיר את הקול שלהם לאחר תאונה. היכולת לשכפל דיבור עם ערכת קלט כל כך קטנה יכולה להיות מבטיחה מאוד במצבים אלה, בתנאי שזה נעשה נכון. אבל עם כל הכסף שהוצא על AI - הן על ידי מיקרוסופט והן על ידי אחרים - ברור שזה לא ייעלם בזמן הקרוב.

המלצות עורכים

  • מחברים מובילים דורשים תשלום מחברות בינה מלאכותית על השימוש בעבודתם
  • הכלים הטובים ביותר לעריכת וידאו בינה מלאכותית
  • יצרנית ChatGPT OpenAI עומדת בפני חקירה של FTC על חוקי הגנת הצרכן
  • פריצות דרך של בינה מלאכותית יכולות להגיע דרך המוח של דבורים, אומרים מדענים
  • OpenAI בונה צוות חדש כדי לעצור בינה מלאכותית סופר אינטליגנטית

שדרג את אורח החיים שלךמגמות דיגיטליות עוזרות לקוראים לעקוב אחר עולם הטכנולוגיה המהיר עם כל החדשות האחרונות, ביקורות מהנות על מוצרים, מאמרי מערכת מעוררי תובנות והצצות מיוחדות במינן.