Το Lip-Reading AI συντρίβει τους ανθρώπους κατά την ερμηνεία σιωπηλών προτάσεων

LipNet: Πόσο εύκολο πιστεύετε ότι είναι το lipreading;

Ένα από τα πιο αξιομνημόνευτα μέρη του αριστουργήματος επιστημονικής φαντασίας του Στάνλεϊ Κιούμπρικ 2001: A Space Odyssey είναι μια πλοκή στην οποία δύο μέλη του Discovery One Το πλήρωμα του διαστημόπλοιου γίνεται όλο και πιο καχύποπτο για τη συμπεριφορά του βοηθού τεχνητής νοημοσύνης του πλοίου, HAL 9000.

Γνωρίζοντας ότι ο HAL ακούει συνεχώς αυτά που λένε, υποχωρούν κάπου που ξέρουν ότι ο HAL δεν μπορεί να ακούσει και συμφωνούν να τον αποσυνδέσουν. Ο HAL βροντοφωνάζει το σχέδιό τους αφού οι δύο αστροναύτες αποτυγχάνουν να λάβουν υπόψη τους το Οι ανώτερες δυνατότητες ανάγνωσης χειλιών του AI.

Φουτουριστικά πράγματα, ε; Όχι σύμφωνα με έρευνα που πραγματοποιήθηκε από ερευνητές στο Πανεπιστήμιο της Οξφόρδης. Έχουν αναπτύξει ένα πρόγραμμα τεχνητής νοημοσύνης που ονομάζεται LipNet, το οποίο είναι σε θέση να ερμηνεύει με ακρίβεια αυτά που λένε οι άνθρωποι, με βάση τον τρόπο που κινούν το στόμα τους όταν μιλούν.

Σχετίζεται με

  • Το Photoshop AI πιστεύει ότι η «ευτυχία» είναι ένα χαμόγελο με σάπια δόντια
  • Έθεσα την γελοία ιδέα μου για εκκίνηση σε ένα ρομπότ VC
  • Πώς θα ξέρουμε πότε ένα AI γίνεται πραγματικά αισθητό;

"Το LipNet εκτελεί ανάγνωση χειλιών σε επίπεδο πρότασης χρησιμοποιώντας μηχανική μάθηση." Μπρένταν Σίλινγκφορντ, ένας από τους ερευνητές στο χαρτί, είπε στο Digital Trends. «Ένα νευρωνικό δίκτυο παρόμοιο με τα τελευταίας τεχνολογίας μοντέλα αναγνώρισης ομιλίας επεξεργάζεται μια ακολουθία πλαισίων βίντεο, αντιστοιχίζοντας τα σε μια πρόταση. Οι προηγούμενες προσεγγίσεις λειτουργούσαν με προβλεπόμενες μεμονωμένες λέξεις αντί για προτάσεις.»

Προτεινόμενα βίντεο

Η απόδοση του LipNet συγκρίνεται απίστευτα ευνοϊκά με τους ειδικούς της ανθρώπινης γλωσσικής διάδοσης στο GRID corpus, το μεγαλύτερο δημοσίως διαθέσιμο σύνολο δεδομένων λιπαντικών σε επίπεδο προτάσεων. Στην πραγματικότητα, όπου οι ειδικοί στον άνθρωπο πήραν μόλις 52 τοις εκατό, το LipNet σημείωσε 93 τοις εκατό. Η βασισμένη σε προτάσεις προσέγγισή του στην ανάγνωση των χειλιών κατέρριψε επίσης την καλύτερη προηγούμενη προσπάθεια ενός μηχανήματος, το οποίο διαχειρίστηκε 79,6 τοις εκατό ακρίβεια στο ίδιο σύνολο δεδομένων.

Ωστόσο, ενώ το πλασματικό HAL 9000 χρησιμοποιεί τις δυνάμεις του να διαβάζει τα χείλη χωρίς καλό, η ομάδα πίσω από το LipNet έχει άλλους στόχους για τη δημιουργία τους. Περίπου 360 εκατομμύρια άνθρωποι παγκοσμίως έχουν απώλεια ακοής με αναπηρία. Εργαλεία όπως το LipNet θα μπορούσαν να είναι εξαιρετικά σημαντικά για αυτά τα άτομα, βοηθώντας στην ακριβή ερμηνεία της ομιλίας με τρόπο που διευκολύνει τη ζωή τους.

«Άλλες εφαρμογές που μας ενδιαφέρουν περιλαμβάνουν σιωπηλή υπαγόρευση σε δημόσιους χώρους, κρυφές συνομιλίες, αναγνώριση ομιλίας σε θορυβώδη περιβάλλοντα, βιομετρική αναγνώριση και επεξεργασία βωβών ταινιών», Shillingford συνεχίζεται.

Ενώ η επιτήρηση θα είναι ένα πρόβλημα με οποιαδήποτε τεχνολογία όπως αυτή, Nando de Freitas, ο οποίος εργάστηκε επίσης στο έργο, είπε ότι δεν είναι μια εφαρμογή στην οποία έχουν επικεντρωθεί. Ωστόσο, είπε ότι «δεν θα ήταν έκπληξη» εάν άλλα εργαστήρια προσπαθούσαν να αξιοποιήσουν μια τέτοια εργασία για αυτόν τον σκοπό στο μέλλον.

«Το κοινό πρέπει να το γνωρίζει αυτό και να βασίζεται στους νόμιμους δημοκρατικούς θεσμούς μας για να θεσπίσουν κατάλληλους νόμους που προστατεύουν το απόρρητο και την αξιοπρέπειά μας», συνέχισε ο de Freitas. «Ελπίζουμε ότι δημοσιεύοντας αυτό το έργο, θα βοηθήσουμε στην ευαισθητοποίηση, ενώ παράλληλα τονίζουμε τη χρησιμότητα αυτής της τεχνολογίας για να βοηθήσει τους ανθρώπους που έχουν ανάγκη».

Συστάσεις των συντακτών

  • Ο αντίπαλος ChatGPT της Apple μπορεί να γράψει αυτόματα κώδικα για εσάς
  • Η Meta έφτιαξε το DALL-E για βίντεο και είναι ανατριχιαστικό και εκπληκτικό
  • Οι οπτικές ψευδαισθήσεις θα μπορούσαν να μας βοηθήσουν να δημιουργήσουμε την επόμενη γενιά τεχνητής νοημοσύνης
  • Ο φορητός υπολογιστής μηχανικής εκμάθησης της Lambda είναι ένας μεταμφιεσμένος Razer
  • Διαβάστε την απόκοσμα όμορφη «συνθετική γραφή» ενός A.I. που νομίζει ότι είναι Θεός

Αναβαθμίστε τον τρόπο ζωής σαςΤο Digital Trends βοηθά τους αναγνώστες να παρακολουθούν τον γρήγορο κόσμο της τεχνολογίας με όλα τα τελευταία νέα, διασκεδαστικές κριτικές προϊόντων, διορατικά editorial και μοναδικές κρυφές ματιές.