Το New Voice A.I της Nvidia. Ακούγεται σαν πραγματικό πρόσωπο

Η «παράξενη κοιλάδα» χρησιμοποιείται συχνά για να περιγράψει τεχνητή νοημοσύνη (A.I.) μίμηση της ανθρώπινης συμπεριφοράς. Αλλά η νέα φωνή της Nvidia A.I. είναι πολύ πιο ρεαλιστικό από οτιδήποτε έχουμε ακούσει ποτέ πριν. Χρησιμοποιώντας έναν συνδυασμό A.I. και μια ανθρώπινη εγγραφή αναφοράς, η ψεύτικη φωνή ακούγεται σχεδόν πανομοιότυπη με μια πραγματική.

Όλες οι αισθήσεις: Η NVIDIA μοιράζεται έρευνα σύνθεσης έκφρασης ομιλίας στο Interspeech

Σε ένα βίντεο (παραπάνω), η εσωτερική δημιουργική ομάδα της Nvidia περιγράφει τη διαδικασία επίτευξης ακριβούς σύνθεσης φωνής. Η ομάδα εξισώνει την ομιλία με τη μουσική, με πολύπλοκους και αποχρώσεις ρυθμούς, τόνους και ηχοχρώματα που δεν είναι εύκολο να αναπαραχθούν. Η Nvidia δημιουργεί εργαλεία για την αναπαραγωγή αυτών των περιπλοκών με το A.I.

Προτεινόμενα βίντεο

Η εταιρεία παρουσίασε τις τελευταίες της εξελίξεις στο Interspeech, το οποίο είναι ένα τεχνικό συνέδριο αφιερωμένο στην έρευνα στις τεχνολογίες επεξεργασίας ομιλίας. Τα φωνητικά εργαλεία της Nvidia είναι διαθέσιμα μέσω του ανοιχτού κώδικα

Εργαλειοθήκη NeMo, και έχουν βελτιστοποιηθεί για να τρέχουν σε GPU της Nvidia (σύμφωνα με την Nvidia, φυσικά).

Το A.I. Η φωνή δεν είναι απλώς ένα demo. Η Nvidia έχει μεταβεί σε A.I. αφηγητής για το Είμαι A.I. σειρά βίντεο, η οποία δείχνει τις επιπτώσεις της μηχανικής μάθησης σε διάφορους κλάδους. Τώρα, η Nvidia είναι σε θέση να κάνει μια τεχνητή φωνή ως αφηγητής, χωρίς τα συνηθισμένα ηχητικά τεχνουργήματα που συνοδεύουν τις συνθετικές φωνές.

Η Nvidia αντιμετωπίζει το A.I. φωνές με έναν από τους δύο τρόπους. Το πρώτο είναι να εκπαιδεύσετε ένα μοντέλο μετατροπής κειμένου σε ομιλία σε μια ομιλία που εκφωνείται από έναν άνθρωπο. Μετά από αρκετή εκπαίδευση, το μοντέλο μπορεί να λάβει οποιαδήποτε εισαγωγή κειμένου και να το μετατρέψει σε ομιλία. Η άλλη μέθοδος είναι η μετατροπή φωνής. Σε αυτήν την περίπτωση, το πρόγραμμα χρησιμοποιεί ένα αρχείο ήχου ενός ανθρώπου που μιλάει και μετατρέπει τη φωνή σε A.I. ένα, που ταιριάζει με το μοτίβο και τον τονισμό.

Για πρακτικές εφαρμογές, η Nvidia επισημαίνει τους αμέτρητους εικονικούς βοηθούς που διευθύνουν γραμμές εξυπηρέτησης πελατών, καθώς και αυτούς που υπάρχουν σε έξυπνες συσκευές όπως Alexa και Βοηθός Google. Ωστόσο, η Nvidia λέει ότι αυτή η τεχνολογία φτάνει πολύ πιο μακριά. «Η μετατροπή κειμένου σε ομιλία μπορεί να χρησιμοποιηθεί σε παιχνίδια, για να βοηθήσει άτομα με φωνητικές αναπηρίες ή για να βοηθήσει τους χρήστες να μεταφράζουν μεταξύ των γλωσσών με τη δική τους φωνή», αναφέρει η Nvidia. ανάρτηση διαβάζει.

Η Nvidia αναπτύσσει την ικανότητα να εξαπατά τους ανθρώπους χρησιμοποιώντας A.I. Η εταιρεία προχώρησε πρόσφατα σε λεπτομέρειες σχετικά με το πώς δημιούργησε έναν εικονικό CEO για το συνέδριο τεχνολογίας GPU, με τη βοήθεια εν μέρει από το δικό της λογισμικό Omniverse.

Συστάσεις των συντακτών

  • Δοκίμασα τη νέα δυνατότητα RTX της Nvidia και διόρθωσε το χειρότερο μέρος των παιχνιδιών υπολογιστή
  • Δοκίμασα το νέο RTX 4060 της Nvidia έναντι του RX 7600 — και δεν είναι όμορφο
  • Το νέο εργαλείο Guardrails της Nvidia διορθώνει το μεγαλύτερο πρόβλημα με τα chatbot AI
  • Ωχ — Η Nvidia μόλις αποκάλυψε κατά λάθος μια ολοκαίνουργια GPU
  • Άλλαξα σε μια GPU AMD για ένα μήνα — αυτός είναι ο λόγος που δεν μου λείπει η Nvidia

Αναβαθμίστε τον τρόπο ζωής σαςΤο Digital Trends βοηθά τους αναγνώστες να παρακολουθούν τον γρήγορο κόσμο της τεχνολογίας με όλα τα τελευταία νέα, διασκεδαστικές κριτικές προϊόντων, διορατικά editorial και μοναδικές κρυφές ματιές.