Η Meta (πρώην Facebook) παρουσιάζει την πρώτη της προσφορά τεχνητής νοημοσύνης μετά την έκρηξη της βιομηχανίας γεννητριών AI στα τέλη του 2022.
Η γεννήτρια κειμένου σε ήχο της μάρκας, που ονομάζεται Voicebox, αναμένεται να είναι το ισοδύναμο φωνής ChatGPT, το οποίο επεξεργάζεται τα μηνύματα κειμένου σε λεπτομερή γραπτά αποτελέσματα και Dall-E που αναπτύσσει ρεαλιστικά έργα τέχνης. Το Voicebox με τη σειρά του θα μπορεί να δέχεται μηνύματα κειμένου και να παράγει ηχητικά κλιπ, σύμφωνα με Engadget.
Έχοντας εκπαιδεύσει τη νέα γεννήτρια σε περισσότερες από 50.000 ώρες αφιλτραρισμένου ήχου, συμπεριλαμβανομένης της ομιλίας δημόσιου τομέα και των μεταγραφών στα Αγγλικά, Γαλλικά, Ισπανικά, Γερμανικά, Πολωνικά και Πορτογαλικά. Το Voicebox είναι έτοιμο να αναπτύξει αποτελέσματα σε ομιλία με ήχο συνομιλίας σε διάφορες διαθέσιμες γλώσσες. Η Meta ισχυρίζεται επίσης ότι το μοντέλο της έχει υποβάθμιση ποσοστού σφάλματος 1 τοις εκατό, σε σύγκριση με άλλα μοντέλα.
Σχετίζεται με
- Τα νέα εργαλεία τεχνητής νοημοσύνης του Zoom θα σας επιτρέψουν να αποκλείσετε οριστικά τις συναντήσεις
- Η Meta θα εισαγάγει πράκτορες AI σε «δισεκατομμύρια ανθρώπους»
- Η Meta θέλει να υπερφορτώσει τη Wikipedia με μια αναβάθμιση AI
Σύμφωνα με τους ερευνητές του Meta, το μοντέλο εκπαιδεύτηκε βάζοντάς το να προβλέπει τμήματα ομιλίας μέσα σε μια μεταγραφή αντί να χρειάζεται να αναπτύξει ένα σύνολο εργασιών από την αρχή. Το εργαλείο έχει επίσης τη δυνατότητα επεξεργασίας κλιπ ήχου για ανεπιθύμητο θόρυβο ή λανθασμένες λέξεις, με παρόμοιο τρόπο με το λογισμικό επεξεργασίας στατικών εικόνων, όπως π.χ. Adobe Photoshop.
Προτεινόμενα βίντεο
Η Meta δήλωσε ότι δεν σκοπεύει να κυκλοφορήσει την εφαρμογή Voicebox ή τον πηγαίο κώδικα στο κοινό επί του παρόντος λόγω «των πιθανών κινδύνων κακή χρήση." Αυτό είναι κατανοητό καθώς πρόσφατα, το Ομοσπονδιακό Γραφείο Ερευνών (FBI) εξέδωσε μια προειδοποίηση σχετικά με την αυξανόμενη χρήση του βαθύ ψεύτικο περιεχόμενο σε εγκλήματα, συμπεριλαμβανομένου του εκβιασμού, του εκβιασμού και της παρενόχλησης.
Η εταιρεία κυκλοφόρησε δείγματα ήχου με την ερευνητική της εργασία που παρουσιάζει την εφαρμογή. Επίσης περιγράφει τα πιθανά μελλοντικά σχέδια για την παροχή βοήθειας σε «ασθενείς με βλάβη φωνητικών χορδών, NPC εντός του παιχνιδιού και ψηφιακούς βοηθούς».
Η Meta βρίσκεται σε μια ενδιαφέρουσα θέση προσπαθώντας να συμβαδίσει με τις τρέχουσες τάσεις του κλάδου. Παρά το γεγονός ότι διαθέτει πολλά μοντέλα των ακουστικών Meta Quest VR, φαίνεται ότι η εταιρεία δεν προχωρά πλέον με τα σχέδιά της να αναπτύξει έννοια μετασύνδεσης υπέρ της καινοτομίας της τεχνητής νοημοσύνης. Εν τω μεταξύ, η Apple παρουσίασε πρόσφατα το πρώτο της Ακουστικά Vision Pro και επενδύει στην εικονική πραγματικότητα. Επί του παρόντος, η Apple δεν έχει επιδείξει κάποιο σημαντικό ενδιαφέρον για την τεχνητή νοημοσύνη.
Συστάσεις των συντακτών
- Οι γερουσιαστές θα λάβουν μαθήματα τεχνητής νοημοσύνης πριν από τις αποφάσεις ρύθμισης
- Η νέα εφαρμογή ChatGPT του OpenAI είναι δωρεάν για iPhone και iPad
- Το αφεντικό της Meta Zuckerberg λέει ότι η νέα ομάδα χτίζει «Πρόσωπα AI»
Αναβαθμίστε τον τρόπο ζωής σαςΤο Digital Trends βοηθά τους αναγνώστες να παρακολουθούν τον γρήγορο κόσμο της τεχνολογίας με όλα τα τελευταία νέα, διασκεδαστικές κριτικές προϊόντων, διορατικά editorial και μοναδικές κρυφές ματιές.