ამ AI-ს შეუძლია თქვენი ხმის გაყალბება სულ რაღაც სამი წამის შემდეგ

ხელოვნური ინტელექტი (AI) არის აქვს მომენტი ახლავედა ქარი აგრძელებს იალქნებით ქროლვას ახალი ამბებით, რომ Microsoft მუშაობს AI-ზე, რომელსაც შეუძლია ნებისმიერის ხმის მიბაძვა მას შემდეგ, რაც იკვებება მოკლე სამწამიანი ნიმუშით.

ახალი ინსტრუმენტი, სახელწოდებით VALL-E, გაწვრთნილი იქნა დაახლოებით 60,000 საათის ხმოვან მონაცემებზე ინგლისურ ენაზე, რომელიც Microsoft-ის თქმით, „ასობით ჯერ აღემატება არსებულ სისტემებს“. ამ ცოდნის გამოყენებით, მისი შემქმნელები აცხადებენ, რომ მას სჭირდება მხოლოდ ვოკალური შეყვანის მცირე ნაწილი, რათა გაიგოს, თუ როგორ უნდა გაიმეოროს მომხმარებლის ხმა.

მამაკაცი ტელეფონზე საუბრობს — Fizkes/Shutterstock

უფრო შთამბეჭდავია, რომ VALL-E-ს შეუძლია თითოეულ ნიმუშში ნაპოვნი ემოციების, ვოკალური ტონებისა და აკუსტიკური გარემოს რეპროდუცირება, რასაც სხვა ხმოვანი ხელოვნური ინტელექტის პროგრამები ებრძვიან. ეს აძლევს მას უფრო რეალისტურ აურას და აახლოებს მის შედეგებს ისეთთან, რაც შეიძლება გახდეს ნამდვილი ადამიანის მეტყველება.

დაკავშირებული

GPT-4: როგორ გამოვიყენოთ AI ჩატბოტი, რომელიც სირცხვილს აყენებს ChatGPT-ს
Google Bard-ს ახლა შეუძლია ლაპარაკი, მაგრამ შეუძლია თუ არა მას ჩაახშოს ChatGPT?

ელონ მასკის ახალი AI კომპანია მიზნად ისახავს "სამყაროს გაგებას"

ტექსტის გადაცემის (TTS) სხვა კონკურენტებთან შედარებით, Microsoft ამბობს, რომ VALL-E „მნიშვნელოვნად აღემატება უახლესი ნულოვანი გასროლის TTS სისტემას მეტყველების თვალსაზრისით. ბუნებრიობა და მეტყველების მსგავსება“. სხვა სიტყვებით რომ ვთქვათ, VALL-E ბევრად უფრო ჰგავს ნამდვილ ადამიანებს, ვიდრე კონკურენტ AI-ებს, რომლებიც ხვდებიან აუდიო შეყვანას, რომელიც მათ არ უსწავლიათ. on.

რეკომენდებული ვიდეოები

GitHub-ზე Microsoft-მა შექმნა ა ნიმუშების მცირე ბიბლიოთეკა შექმნილია VALL-E-ს გამოყენებით. შედეგები ძირითადად ძალიან შთამბეჭდავია, მრავალი ნიმუშით, რომლებიც ასახავს სპიკერების ხმის სიკაშკაშეს და აქცენტს. ზოგიერთი მაგალითი ნაკლებად დამაჯერებელია, რაც იმაზე მიუთითებს, რომ VALL-E ალბათ არ არის მზა პროდუქტი, მაგრამ მთლიანობაში შედეგი დამაჯერებელია.

უზარმაზარი პოტენციალი - და რისკები

პირი, რომელიც ახორციელებს ვიდეო ზარს Microsoft Surface მოწყობილობაზე, რომელიც მუშაობს Windows 11. — Microsoft/Unsplash

Ში ქაღალდი, რომელიც გვაცნობს VALL-E, Microsoft განმარტავს, რომ VALL-E „შეიძლება შეიცავდეს პოტენციურ რისკებს მოდელის ბოროტად გამოყენებისას, როგორიცაა ხმის გაყალბება კონკრეტული სპიკერის იდენტიფიცირება ან იმიტაცია“. ასეთი ქმედუნარიანი ინსტრუმენტი რეალისტური ჟღერადობის მეტყველების ამაღლებისთვის აჩრდილი სულ უფრო დამაჯერებელი ღრმა ფეიქი, რომელიც შეიძლება გამოყენებულ იქნას ნებისმიერი რამის მიბაძვისთვის, ყოფილი რომანტიკული პარტნიორიდან დაწყებული გამოჩენილი საერთაშორისო პიროვნებით დამთავრებული.

ამ საფრთხის შესამცირებლად, Microsoft-მა განაცხადა, რომ „შესაძლებელია გამოვლენის მოდელის შექმნა, რათა განისაზღვროს, არის თუ არა აუდიო კლიპის სინთეზირებული VALL-E-ს მიერ“. კომპანია ამბობს, რომ ის ასევე გამოიყენებს საკუთარს AI პრინციპები მისი მუშაობის შემუშავებისას. ეს პრინციპები მოიცავს ისეთ სფეროებს, როგორიცაა სამართლიანობა, უსაფრთხოება, კონფიდენციალურობა და ანგარიშვალდებულება.

VALL-E არის Microsoft-ის AI ექსპერიმენტების უახლესი მაგალითი. ბოლო დროს კომპანია მუშაობს ChatGPT-ის ინტეგრირება Bing-ში, AI-ს გამოყენებით გადახედეთ თქვენი გუნდების შეხვედრებსდა მოწინავე ხელსაწყოების გადანერგვა აპებში, როგორიცაა Outlook, Word და PowerPoint. და Semafor-ის თანახმად, Microsoft ეძებს 10 მილიარდი დოლარის ინვესტიცია ChatGPT მწარმოებელ OpenAI-ში, კომპანიაში, რომელშიც უკვე დახარჯული აქვს მნიშვნელოვანი თანხები.

აშკარა რისკების მიუხედავად, ისეთი ხელსაწყოები, როგორიცაა VALL-E, შეიძლება განსაკუთრებით სასარგებლო იყოს მედიცინაში, მაგალითად, რათა დაეხმარონ ადამიანებს ავარიის შემდეგ ხმის აღდგენაში. ამ სიტუაციებში მეტყველების გამეორების შესაძლებლობა ასეთი მცირე შეყვანის ნაკრებით შეიძლება იყოს უზომოდ პერსპექტიული, იმ პირობით, რომ ეს სწორად გაკეთდება. მაგრამ მთელი ფული, რომელიც იხარჯება AI-ზე - როგორც Microsoft-ის, ისე სხვების მიერ - აშკარაა, რომ ის მალე არ გაქრება.

რედაქტორების რეკომენდაციები

საუკეთესო ავტორები ითხოვენ ანაზღაურებას ხელოვნური ინტელექტის ფირმებისგან მათი ნამუშევრის გამოყენებისთვის
საუკეთესო AI ვიდეო რედაქტირების ხელსაწყოები
ChatGPT-ის შემქმნელი OpenAI-ის წინაშე დგას FTC გამოძიება მომხმარებელთა დაცვის კანონების გამო
მეცნიერები ამბობენ, რომ ხელოვნური ინტელექტის გარღვევა შესაძლოა ფუტკრის ტვინის მეშვეობით მოხდეს
OpenAI აშენებს ახალ გუნდს, რათა შეაჩეროს სუპერინტელექტუალური ხელოვნური ინტელექტის მოტყუება

განაახლეთ თქვენი ცხოვრების წესიDigital Trends ეხმარება მკითხველს თვალყური ადევნონ ტექნოლოგიების სწრაფ სამყაროს ყველა უახლესი სიახლეებით, სახალისო პროდუქტების მიმოხილვებით, გამჭრიახი რედაქციებითა და უნიკალური თვალით.

ამ AI-ს შეუძლია თქვენი ხმის გაყალბება სულ რაღაც სამი წამის შემდეგ

უზარმაზარი პოტენციალი - და რისკები

რედაქტორების რეკომენდაციები

კატეგორიები

Ბოლო

Hymer VisionVenture-ის კონცეფცია ასახავს 2025 წლის Camper Van-ს

განახლებული Google Pixel 3 ახლა უფრო იაფია, ვიდრე ოდესმე Amazon-ზე

U2 ტური დოკუმენტური ფილმი, კონცერტი პრემიერა HBO-ზე ნოემბერში