Οι συνθετικές φωνές όπως αυτές που χρησιμοποιούνται από τη Siri και την Alexa είναι μια χαρά για να μας πουν την πρόγνωση του καιρού της ημέρας ή πώς απομένουν πολλά λεπτά σε ένα χρονόμετρο μαγειρέματος, αλλά θα θέλατε πραγματικά να σας διαβάζουν οι επίπεδες, μονότονες αποχρώσεις τους ηχητικά βιβλία; Μάλλον όχι, γι' αυτό οι περισσότεροι από εμάς απευθυνόμαστε σε υπηρεσίες ανθρώπινης φωνής όπως το Audible για να λάβουμε τη διόρθωση του ηχητικού βιβλίου μας. Ωστόσο, οι ηθοποιοί ανθρώπινης φωνής μπορεί να μην πάρουν το νεύμα για πολύ ακόμη, λόγω της πρωτοποριακής δουλειάς μιας startup με έδρα το Λονδίνο που ονομάζεται DeepZen.
Χρησιμοποιώντας αλγόριθμους τεχνητής νοημοσύνης, επαυξημένο από την τεχνολογική δύναμη πυρός του Το Power A.I της IBM. και τις τεχνολογίες Watson, η DeepZen έχει αναπτύξει εργαλεία μετατροπής κειμένου σε ομιλία που όχι μόνο ακούγονται ανθρώπινα με την πρώτη ακρόαση, αλλά μπορούν επίσης να συλλάβουν τα συναισθηματικά σημάδια που απαιτούνται για την ανάγνωση κειμένου με συναρπαστικό τρόπο. Με αυτόν τον τρόπο, η εταιρεία ισχυρίζεται ότι θα μπορούσε να μειώσει τον χρόνο και το κόστος για την παραγωγή ακουστικών βιβλίων έως και 90%.
Προτεινόμενα βίντεο
«Το σύστημά μας είναι πραγματικά επαναστατικό», δήλωσε στο Digital Trends ο Taylan Kamis, Διευθύνων Σύμβουλος και συνιδρυτής της DeepZen. «Λειτουργεί χρησιμοποιώντας βαθιά μάθηση και νευρωνικά δίκτυα για να κατανοήσουμε πώς μιλάει και διαβάζει ένας άνθρωπος. Στη συνέχεια εκπαιδεύουμε το σύστημα ώστε να μπορεί να αναγνωρίσει πού να εφαρμόσει τα σωστά συναισθήματα και τον τονισμό κατά την ανάγνωση ενός κειμένου. Το αποτέλεσμα είναι η ανθρώπινη ομιλία που μοιάζει πολύ με την πραγματική».
Σχετίζεται με
- Οι οπτικές ψευδαισθήσεις θα μπορούσαν να μας βοηθήσουν να δημιουργήσουμε την επόμενη γενιά τεχνητής νοημοσύνης
- Τελική πινελιά: Πώς οι επιστήμονες δίνουν στα ρομπότ ανθρώπινες απτικές αισθήσεις
- Διαβάστε την απόκοσμα όμορφη «συνθετική γραφή» ενός A.I. που νομίζει ότι είναι Θεός
Αναπόφευκτα, μια τέτοια εργασία μπορεί να θεωρηθεί ως ένα ακόμη παράδειγμα αιχμής A.I. εργαλεία απειλεί ένα ανθρώπινο επάγγελμα. Σε αυτήν την περίπτωση, αυτό το επάγγελμα περιλαμβάνει ηθοποιούς που, παρά το τι μπορούν να επιτύχουν μερικές προσωπικότητες υψηλού προφίλ, δεν έχουν την πιο σταθερή, σταθερή καριέρα όπως είναι. Θα ήταν αφελές να πιστεύουμε ότι λογισμικό όπως αυτό δεν θα έχει αντίκτυπο στο μέλλον των φωνητικών ηθοποιών, αλλά, καθώς Ο Kamis επισημαίνει ότι υπάρχουν πολλά σενάρια στα οποία εργαλεία όπως το DeepZen θα μπορούσαν να είναι καθαρά θετικά για ανθρωπότητα.
Για παράδειγμα, θα μπορούσε να καταστήσει δυνατή τη δημιουργία ηχητικών βιβλίων βασισμένων σε έργα νέων και αναδυόμενων συγγραφέων ή από εκδότες που δεν έχουν την πολυτέλεια των μεγάλων προϋπολογισμών. Θα μπορούσε επίσης να χρησιμοποιηθεί για να βοηθήσει στην ανάπτυξη ανώτερων εργαλείων μετατροπής κειμένου σε ομιλία για άτομα που έχουν δυσλεξία ή με άλλον τρόπο έχουν πρόβλημα στην ανάγνωση.
«Όσον αφορά το μέλλον, εξετάζουμε επίσης την παραγωγή φωνής για τη βιομηχανία παραγωγής βίντεο, όπως καθώς και παιχνίδια, όπου υπάρχει ανάγκη για μετατροπή κειμένου σε ομιλία σε πραγματικό χρόνο για τη βελτίωση της εμπειρίας του παίκτη», Kami είπε. «Εξετάζουμε και άλλες γλώσσες».
Μπορείτε να δείτε ένα δείγμα του συστήματος εδώ.
Συστάσεις των συντακτών
- Ρομπότ ασφαλείας θα μπορούσαν να έρχονται σε ένα σχολείο κοντά σας
- Πώς θα ξέρουμε πότε ένα AI γίνεται πραγματικά αισθητό;
- Αναλογικό A.I.; Ακούγεται τρελό, αλλά μπορεί να είναι το μέλλον
- Το μέλλον της A.I.: 4 μεγάλα πράγματα που πρέπει να προσέξετε τα επόμενα χρόνια
- Αυτή η τεχνολογία ήταν επιστημονική φαντασία πριν από 20 χρόνια. Τώρα είναι πραγματικότητα
Αναβαθμίστε τον τρόπο ζωής σαςΤο Digital Trends βοηθά τους αναγνώστες να παρακολουθούν τον γρήγορο κόσμο της τεχνολογίας με όλα τα τελευταία νέα, διασκεδαστικές κριτικές προϊόντων, διορατικά editorial και μοναδικές κρυφές ματιές.