Αναρωτηθήκατε ποτέ πώς το Apple HomePod μπορεί να σας ακούσει να λέτε, "Hey Siri" από απέναντι από ένα θορυβώδες δωμάτιο; Χρειάστηκαν πολλοί πολύ έξυπνοι άνθρωποι για να συμβεί αυτό.
Ενα νέο ανάρτηση στο ιστολόγιο μηχανικής εκμάθησης της Apple λεπτομερώς όλη τη σκέψη και την τεχνολογία — τόσο το υλικό όσο και το λογισμικό — πίσω από την ικανότητα του ηχείου σε σχήμα marshmallow να κρέμεται από κάθε σας λέξη. Οι προκλήσεις, αποδεικνύεται, ήταν αρκετά τεράστιες.
Προτεινόμενα βίντεο
«Το τυπικό περιβάλλον ήχου για το HomePod έχει πολλές προκλήσεις — ηχώ, αντήχηση και θόρυβος», εξηγεί η Apple. «Σε αντίθεση με το Siri στο iPhone, το οποίο λειτουργεί κοντά στο στόμα του χρήστη, το Siri στο HomePod πρέπει να λειτουργεί καλά σε ένα μακρινό πεδίο. Οι χρήστες θέλουν να επικαλούνται το Siri από πολλές τοποθεσίες, όπως ο καναπές ή η κουζίνα, ανεξάρτητα από το πού βρίσκεται το HomePod.»
Σχετίζεται με
- Πόσο κοστίζει το Spotify Premium και μπορείτε να πάρετε μια προσφορά;
- Σύντομα, το Apple AirPods Pro θα μπορεί να αντιδρά στο περιβάλλον σας
- Δείτε πώς μπορείτε να αποκτήσετε δωρεάν το The Last of Us από την AMD
Για να αντιμετωπίσει αυτά τα προβλήματα, η ομάδα χρησιμοποίησε ένα μείγμα από αυτό που αποκαλεί «εποπτευόμενη βαθιά μάθηση» και «Μη εποπτευόμενη διαδικτυακή εκμάθηση» για να καθορίσετε πώς να ερμηνεύσετε τα σήματα από τα πολλαπλά ενσωματωμένα σήματα μικρόφωνα. Ουσιαστικά, το ηχείο μπορεί να χρησιμοποιήσει αυτόν τον αλγόριθμο μηχανικής εκμάθησης για να καθορίσει ποια είναι η βέλτιστη ροή ήχου για να ακούει ανά πάσα στιγμή, επιτρέποντάς του να έχει πάντα ένα έντονο αυτί για το πού μπορεί να ακούει, "Hey Siri".
Υπάρχει ένα σωρό δροσερό λογισμικό που επιτρέπει στο ηχείο να βελτιστοποιεί την ανίχνευση ομιλίας και να συντονίζει πράγματα όπως μουσική, περιβαλλοντικούς ήχους και άλλους ήχους που δεν έχουν ομιλία. Αλλά ακόμα και όταν επικεντρώνεται στην ομιλία, υπάρχουν άλλες προκλήσεις.
«Η αναγνώριση ομιλίας σε μακρινό πεδίο γίνεται πιο δύσκολη όταν ένας άλλος ενεργός ομιλητής, όπως ένα άτομο ή μια τηλεόραση, είναι παρών στο ίδιο δωμάτιο με τον συνομιλητή-στόχο», αναφέρει η ανάρτηση. "Σε αυτό το σενάριο, η ανίχνευση φωνητικής ενεργοποίησης, η αποκωδικοποίηση ομιλίας και το τελικό σημείο μπορούν να υποβαθμιστούν σημαντικά εάν η φωνητική εντολή δεν διαχωρίζεται από τα στοιχεία παρεμβολής ομιλίας."
Η ομάδα ανέπτυξε μια μοναδική φόρμουλα για την αντιμετώπιση αυτού του ζητήματος — η πραγματική φόρμουλα βρίσκεται στο τον ιστότοπο της εταιρείας — και μάλιστα ανέπτυξε ειδικούς τρόπους αντιμετώπισης της ακύρωσης ηχούς και κατάπνιξη.
Το γεγονός ότι έγινε τόση πολλή σκέψη για τη δημιουργία ενός προϊόντος όπως το HomePod και την πραγματοποίηση του να λειτουργήσει δεν είναι τόσο περίεργο, αλλά το να μπορείς για να ακούσετε ακριβώς ποιες ήταν οι προκλήσεις και πώς επιλύθηκαν απευθείας από την Apple - μια από τις πιο μυστικοπαθείς εταιρείες στη Γη - είναι δροσιστικός. Σας συνιστούμε να δείτε την πλήρη ανάρτηση του ιστολογίου για περισσότερες πληροφορίες.
Όσο είστε σε αυτό, φροντίστε να ελέγξετε τη λίστα μας τα καλύτερα έξυπνα ηχεία αν είστε στην αγορά.
Συστάσεις των συντακτών
- Πόσο κοστίζει το Apple Music και πώς μπορείτε να το αποκτήσετε δωρεάν;
- Τι είναι το NFC; Πώς λειτουργεί και τι μπορείτε να κάνετε με αυτό
- Τι είναι το Dolby Atmos Music και πώς μπορείτε να το ακούσετε στο σπίτι και εν κινήσει;
- Έλα, Apple — αν η Sonos μπορεί να παραδεχτεί ότι έκανε λάθος με το Bluetooth, μπορείς και εσύ
- Apple AirPlay 2: εξηγείται πλήρως η τεχνολογία ασύρματης ροής ήχου και βίντεο
Αναβαθμίστε τον τρόπο ζωής σαςΤο Digital Trends βοηθά τους αναγνώστες να παρακολουθούν τον γρήγορο κόσμο της τεχνολογίας με όλα τα τελευταία νέα, διασκεδαστικές κριτικές προϊόντων, διορατικά editorial και μοναδικές κρυφές ματιές.