Facebook A.I. Θα μπορούσε να διορθώσει το ενοχλητικό πρόβλημα στις εφαρμογές συνομιλίας βίντεο

click fraud protection

Η επικοινωνία στο Facebook μπορεί να πραγματοποιείται κυρίως μέσω κειμένου, αλλά ο γίγαντας των μέσων κοινωνικής δικτύωσης μπορεί ωστόσο να βοηθήσει στην επίλυση ορισμένων από τις μεγαλύτερες προκλήσεις με την ακουστική επικοινωνία. Ανακοινώθηκε την Παρασκευή 10 Ιουλίου, ενόψει της Διεθνές Συνέδριο για τη Μηχανική Μάθηση, το Facebook έχει αναπτύξει ένα νέο, τεχνητή νοημοσύνη αιχμής που μπορεί να διακρίνει έως και πέντε φωνές που μιλούν ταυτόχρονα.

Αυτό θα μπορούσε να μεταμορφώσει τα πάντα, από ακουστικά βαρηκοΐας επόμενης γενιάς ή έξυπνα ηχεία που καλούν και ενισχύουν ορισμένα φωνές για μελλοντικές βιντεοδιάσκεψη τύπου Zoom εκμάθηση καλύτερης ιεράρχησης των ηχείων για να σταματήσουν όλοι να μιλούν για το καθένα άλλα.

Προτεινόμενα βίντεο

"Αυτή είναι μια εποπτευόμενη προσέγγιση μάθησης για τον διαχωρισμό της ομιλίας," Eliya Nachmani, βοηθός ερευνητής στο FAIR (Facebook ΟΛΑ ΣΥΜΠΕΡΙΛΑΜΒΑΝΟΝΤΑΙ. Έρευνα) Τελ Αβίβ, είπε στο Digital Trends. «Για πρώτη φορά, δείχνουμε ότι είναι δυνατός ο διαχωρισμός πέντε ξεχωριστών ηχείων από μία μόνο εγγραφή μικροφώνου. Δείχνουμε επίσης πώς το μοντέλο μπορεί να ανιχνεύσει τον αριθμό των ηχείων στην εγγραφή και να προδιαμορφώσει ανάλογα. Το μοντέλο είναι χωρίς μάσκες, πράγμα που σημαίνει ότι δεν υπολογίζουμε κάλυψη που αφαιρεί άλλες φωνές. Αντίθετα, το μοντέλο μας μαθαίνει να φιλτράρει τις άλλες φωνές ή τον θόρυβο του περιβάλλοντος."

2 Κινούμενο σχέδιο διαχωρισμού φωνής ηχείου FINAL

Αυτό το στοιχείο "χωρίς μάσκα" είναι σημαντικό. Τα προηγούμενα μοντέλα που πέτυχαν εντυπωσιακά σημεία αναφοράς χρησιμοποιούν μια μάσκα για να αφαιρέσουν άλλες φωνές. Το πρόβλημα με αυτήν την προσέγγιση είναι ότι τα μοντέλα χειροτερεύουν καθώς ο αριθμός των ηχείων αυξάνεται ή είναι άγνωστος. Ενώ το μοντέλο του Facebook εξακολουθεί να απαιτεί τον καθορισμό του αριθμού των ηχείων, χρησιμοποιεί κάποια έξυπνη τεχνολογία υπολογίστε αυτόματα τον αριθμό των ατόμων που μιλούν και, στη συνέχεια, επιλέξτε το πιο κατάλληλο μοντέλο για να εργαστείτε αυτόν τον αριθμό.

Ο Nachmani επεσήμανε ότι αυτή η τεχνολογία διαχωρισμού ομιλίας θα μπορούσε να έχει και άλλες εφαρμογές. Εκτός από τον διαχωρισμό των φωνών, θα μπορούσε επίσης να ταξινομήσει άλλους ήχους από το θόρυβο του περιβάλλοντος. Για παράδειγμα, αυτό θα μπορούσε να το επιτρέψει απομονώστε διαφορετικά μουσικά όργανα από ένα μόνο αρχείο ήχου.

Θα βρει κάποια από αυτή την τεχνολογία το δρόμο της σε ένα προϊόν Facebook σύντομα; Αυτό δεν είναι ξεκάθαρο. Αυτό είναι θεμελιώδες A.I. έρευνα που δεν πρόκειται απαραιτήτως να αφιερωθεί στο μέλλον Facebook εφαρμογή. Αλλά είναι σίγουρα εύκολο να δούμε πώς ένα τέτοιο εργαλείο μπορεί να είναι χρήσιμο. Δεδομένου ότι Facebook προσφέρει ήδη διάφορες δυνατότητες συνομιλίας μέσω βίντεο και φωνής, δεν είναι έξω από τη σφαίρα της πιθανότητας ότι αυτό θα μπορούσε να φτάσει σε ένα μελλοντικό προϊόν κάποια στιγμή στο μέλλον.

Αυτό το A.I. Η επίδειξη είναι μόνο ένα από τα περισσότερα από 30 έγγραφα που συζητά το Facebook στο Διεθνές Συνέδριο για τη Μηχανική Μάθηση, το οποίο ξεκινά αυτό το Σαββατοκύριακο.

Συστάσεις των συντακτών

  • Το Twitter μόλις διόρθωσε ένα από τα πιο ενοχλητικά προβλήματά του
  • Πώς η Nintendo θα μπορούσε να χρησιμοποιήσει το A.I. για να φέρει το 4K gaming στο Switch Pro
  • Έξυπνο νέο A.I. το σύστημα υπόσχεται να εκπαιδεύσει τον σκύλο σας ενώ λείπετε από το σπίτι
  • Αυτή η βασική ανθρώπινη δεξιότητα είναι το επόμενο σημαντικό ορόσημο για την A.I.
  • Σύνοψη του GTC 2020: Ο εικονικός κόσμος της Nvidia για ρομπότ, A.I. βιντεοκλήσεις

Αναβαθμίστε τον τρόπο ζωής σαςΤο Digital Trends βοηθά τους αναγνώστες να παρακολουθούν τον γρήγορο κόσμο της τεχνολογίας με όλα τα τελευταία νέα, διασκεδαστικές κριτικές προϊόντων, διορατικά editorial και μοναδικές κρυφές ματιές.