Δείτε πώς το Facebook δίδαξε το Portal A.I. να σκέφτεται σαν σκηνοθέτης του Χόλιγουντ

Αξιολόγηση Facebook Portal+
Dan Baker/Digital Trends

Όταν ο Mark Zuckerberg έχτισε την πρώτη έκδοση του Facebook στον κοιτώνα του κολεγίου του στο Χάρβαρντ, το φαντάστηκε ως ένα παράθυρο που θα επέτρεπε στους ανθρώπους να κοιτάζουν τις ζωές άλλων χρηστών. Εάν το Google ήταν μια μηχανή αναζήτησης πληροφοριών, τότε το Facebook, αντίθετα, ήταν μια μηχανή αναζήτησης για τους ανθρώπους. Δεκαπέντε χρόνια αργότερα, το Facebook ανέβασε αυτή τη φιλοδοξία στο επόμενο επίπεδο. Με τη δημιουργία του Portal και του Portal+, της σειράς έξυπνων ηχείων με βελτιωμένη οθόνη, που κυκλοφόρησε τον Νοέμβριο του 2018, η Ο γίγαντας των social media έχει δημιουργήσει ένα πολύ πιο κυριολεκτικό παράθυρο, επιτρέποντας στους χρήστες του Facebook να πραγματοποιούν βιντεοκλήσεις σε έναν αλλο.

Περιεχόμενα

  • Κάνοντας τις κάμερες πιο έξυπνες
  • Τεχνικές προκλήσεις
  • Μια αναπτυσσόμενη αγορά
  • Μελλοντικές προκλήσεις απορρήτου;

Τα έξυπνα ηχεία του Portal κυριολεκτούν ένα άλλο Facebook όνειρο επίσης. Εκεί που το Facebook ήταν, στην ουσία, μια μηχανή αναζήτησης για ανθρώπους, το Portal στην πραγματικότητα

κάνει ψάξτε τα: με μια περιστρεφόμενη κάμερα 12 megapixel, με οπτικό πεδίο 140 μοιρών, που σας ακολουθεί σε όλο το δωμάτιο για να δείτε τι κάνετε. Ως Digital Trends βάλτε το στην κριτική μας, «Αν είστε απασχολημένοι με τις μετακινήσεις σας στην κουζίνα ενώ ρωτάτε τη γιαγιά πώς να φτιάξει τα διάσημα κεφτεδάκια της, μπορείτε να είστε απασχολημένοι ακούγοντας την ομιλία της».

Προτεινόμενα βίντεο

Ποια ακριβώς είναι η έξυπνη τεχνολογία που οδηγεί το Portal; Και πώς πιστεύει το Facebook ότι έχει λύσει την πρόκληση να κάνει την τακτική συνομιλία μέσω βίντεο να νιώθει τόσο προσωπική όσο το να κάθεσαι για μια πραγματική συνομιλία; Η απάντηση περιλαμβάνει κάποια εντυπωσιακή τεχνητή νοημοσύνη - και μια πρόσθετη ανθρώπινη πινελιά.

Σχετίζεται με

  • Συναισθηματική A.I. είναι εδώ και θα μπορούσε να είναι στην επόμενη συνέντευξη εργασίας σας
  • Επειδή το 2020 δεν είναι αρκετά τρελό, ένα στόμα ρομπότ τραγουδάει A.I. προσευχές στο Παρίσι
  • ΟΛΑ ΣΥΜΠΕΡΙΛΑΜΒΑΝΟΝΤΑΙ. Η αναβάθμιση κάνει αυτή την ταινία του 1896 να μοιάζει σαν να γυρίστηκε σε εκθαμβωτική ανάλυση 4Κ
Αξιολόγηση Facebook Portal+
Dan Baker/Digital Trends

Κάνοντας τις κάμερες πιο έξυπνες

Από την αρχή, το Facebook γνώριζε ότι ο πυρήνας της εμπειρίας του στο Portal θα ήταν το λεγόμενο σύστημα «Έξυπνης Κάμερας». Η ιδέα της Έξυπνης Κάμερας ήταν να προχωρήσει πέρα ​​από το είδος της στατικής λήψης που μας προσφέρει εδώ και χρόνια υπηρεσίες όπως το Skype και να παίξει έναν πιο δημιουργικό ρόλο στη διαδικασία. Ακριβώς όπως ένας σκηνοθέτης ή διευθυντής φωτογραφίας ξέρει πότε πρέπει να χρησιμοποιήσει ένα ευρύ πλάνο ή πότε να μεγεθύνει για ένα οικείο κοντινό πλάνο, έτσι Facebook προκάλεσε τους μηχανικούς της να μιμηθούν την ίδια ικανότητα με το Portal.

Για να δώσει σε αυτήν την κάμερα την απαραίτητη ανθρώπινη πινελιά, το Facebook συνεργάστηκε με κινηματογραφιστές για να βρει τον καλύτερο τρόπο απόσταξης της σοφίας τους σε γνώσεις που μαθαίνονται από μηχανή. Σε μια περίπτωση, τους ζήτησε να δείξουν πώς θα μπορούσαν να τραβήξουν μια σκηνή στην οποία ήταν αδύνατο να καταγραφούν όλες οι σχετικές πληροφορίες από μια σταθερή γωνία.

Το Portal περιλαμβάνει έναν εξαιρετικά ευρυγώνιο φακό στον οποίο όλες οι αποφάσεις κίνησης και επεξεργασίας λαμβάνονται εξ ολοκλήρου ψηφιακά.

Σε μια άλλη, οι μηχανικοί του Facebook εξέτασαν τα διάφορα φωτογραφικά στοιχεία που δίνουν προτεραιότητα στους χειριστές φωτογραφικών μηχανών σε λήψεις πορτρέτου και τοπίων. Αυτές οι παρατηρήσεις αποτέλεσαν τη βάση μοντέλων λογισμικού που προσπαθούν να εμποτίσουν το Portal με μερικές από τις ιδιορρυθμίες λήψης αποφάσεων που κανονικά θα αποδίδαμε στην ανθρώπινη δημιουργικότητα.

«Θέλαμε να δημιουργήσουμε μια εμπειρία βιντεοκλήσεων hands-free που αφαιρεί τα αισθήματα φυσικής απόστασης και είναι περισσότερο σαν να κάνουμε παρέα μαζί», εξήγησε στο Digital Trends ο Eric Hwang, ένας από τους μηχανικούς πίσω από το Portal.

Το προκύπτον σύστημα - το οποίο λέει το Facebook χρειάστηκε «κάτω από δύο χρόνια» για να το δημιουργήσει από την αρχή - επιτρέπει στο Portal να λαμβάνει αποφάσεις που έχουν σχεδιαστεί για να βελτιώσουν τη ροή μιας συνομιλίας. Σε ένα πρόσφατα δημοσιευμένη ανάρτηση ιστολογίου, περιγράφει λεπτομερώς ορισμένες από τις απεικονίσεις του γιατί αυτό μπορεί να είναι απαραίτητο. Για παράδειγμα, εάν βρίσκεστε σε ένα γεμάτο δωμάτιο, γεμάτο με άτομα που αλληλεπιδρούν μεταξύ τους, πρέπει να επιλέξει πότε θα ακολουθήσει ένα άτομο εκτός κάδρου ή πότε θα σμίκρυνση για να φιλοξενήσει νέα θέματα.

Οι μηχανικοί λογισμικού του Facebook Eric Hwang (καθισμένος αρχικά στην καρέκλα) και ο Arthur Cavalcanti επιδεικνύουν την κινηματογραφική παρακολούθηση και το καδράρισμα του Portal που μοιάζει με κάμερα.

Ομοίως, πρέπει να μάθει να αντιμετωπίζει μεταβαλλόμενες συνθήκες φωτός σε πραγματικό χρόνο. Τι κάνετε εάν το θέμα σας είναι ξαπλωμένο σε ένα σκοτεινό δωμάτιο, μισοκαλυμμένο από μια κουβέρτα, αλλά υπάρχουν παιδιά που τρέχουν στο παρασκήνιο προκαλώντας θόλωση κίνησης; Το Portal ζυγίζει όλες αυτές τις πληροφορίες σε λιγότερο από ένα ριπή οφθαλμού και προσπαθεί να προσδιορίσει το καλύτερο αποτέλεσμα. (Εάν θέλετε να ελέγχετε χειροκίνητα σε ποιον εστιάζει, είναι και αυτό πλέον δυνατό.)

Τεχνικές προκλήσεις

Από τεχνική άποψη, μερικά πράγματα κάνουν την τεχνολογία του Portal εντυπωσιακή. Το πρώτο είναι ότι μπορεί να τα κάνει όλα αυτά χωρίς τη χρήση πραγματικής κινούμενης κάμερας. Στην αρχή της διαδικασίας ανάπτυξης, οι μηχανικοί του Portal δοκίμασαν πρωτότυπα που χρησιμοποιούσαν μια μηχανοκίνητη κάμερα, η οποία περιστρεφόταν για να βλέπει τα θέματα. Ωστόσο, αυτό απορρίφθηκε με βάση το γεγονός ότι προκάλεσε καθυστέρηση και ένα σημείο πιθανής μηχανικής βλάβης. Αντίθετα, το Portal περιλαμβάνει έναν εξαιρετικά ευρυγώνιο φακό στον οποίο όλες οι αποφάσεις κίνησης και επεξεργασίας λαμβάνονται εξ ολοκλήρου ψηφιακά.

Δεύτερον, η ομάδα που εργάζεται στο Portal βρήκε έναν τρόπο να επιτύχει τις διαδικασίες λήψης αποφάσεων χωρίς να χρειάζεται να βασίζεται στο cloud computing. Σύμφωνα με τον Hwang, η υπολογιστική ισχύς πυρός επιτυγχάνεται όλη στη συσκευή.

Εξέλιξη του Facebook Portal
Τα πρώιμα πρωτότυπα του Portal βασίζονταν σε έναν κινητήρα για τη φυσική κίνηση της κάμερας.Μηχανική Facebook

«Η καταγραφή όλων σε ένα καρέ βίντεο δεν είναι ένα δύσκολο μηχανολογικό πρόβλημα, καθώς πολλοί μηχανικοί μπορούν να το κάνουν αυτό με τις σημερινές εξελίξεις στην όραση υπολογιστών», είπε. «Η καινοτομία έγκειται στην καταγραφή των σχετικών ατόμων ή ατόμων σε πραγματικό χρόνο, στη συσκευή, χρησιμοποιώντας μόνο το μικρό τσιπ για κινητά μέσα στο Portal ως επεξεργαστική ισχύ. Συνήθως αυτοί οι τύποι A.I. Οι εργασίες απαιτούν αποκλειστικούς, μεγάλους διακομιστές. Ξεπεράσαμε αυτό το εμπόδιο συμπιέζοντας πολύπλοκα μοντέλα υπολογιστικής όρασης μέχρι να χωρέσουν στο τσιπ που χρησιμοποιούμε για το Portal και να συνεχίσουν να λειτουργούν με ακρίβεια και αξιοπιστία.»

Για να γίνει αυτό, το Portal βασίζεται στη μακροπρόθεσμη επένδυση του Facebook στην τεχνητή νοημοσύνη. Χρησιμοποιεί ένα σύστημα ανίχνευσης πόζας 2D που τρέχει με 30 καρέ ανά δευτερόλεπτο. Η σκοπιμότητα αυτών των στάσεων βοηθά το Portal να λαμβάνει συνεχείς αποφάσεις σχετικά με το τι κάνουν τα θέματά του — και πότε μπορεί να χρειαστεί να κάνει ψηφιακή μετατόπιση ή μεγέθυνση ως αποτέλεσμα. Επιπλέον, χρησιμοποιεί έρευνα σε κάμερες βάθους που αναπτύχθηκαν από το Facebook Reality Labs ως μέρος των προσπαθειών εικονικής πραγματικότητας του γίγαντα των κοινωνικών μέσων.

Μια αναπτυσσόμενη αγορά

Το Facebook είναι πεπεισμένο ότι είναι νικητής με το Portal. Είναι εύκολο να καταλάβεις από πού πηγάζει η αυτοπεποίθησή του. Αυτή τη στιγμή, η αγορά των έξυπνων ηχείων ανθεί. Αν και κυριαρχείται σε μεγάλο βαθμό από τον ηγέτη της αγοράς Amazon, είναι αυξάνονται περισσότερο από 100 τοις εκατό από έτος σε έτος. Αυτά είναι καλά νέα για τις εταιρείες τεχνολογίας που αναζητούν το επόμενο μεγάλο πράγμα σε μια περίοδο ισοπέδωσης smartphone εκπτώσεις.

Αξιολόγηση Facebook Portal+
Dan Baker/Digital Trends

Ενώ το Facebook ήταν ο τελευταίος από τους τέσσερις μεγάλους τεχνολογικούς γίγαντες (Amazon, Alphabet, Facebook και Apple) για να πηδήξουμε στο bandwagon, είναι ακόμα ένας από τους πρώτους κύμα έξυπνων ηχείων που επικεντρώνονται γύρω από την οθόνη ως συσκευή επικοινωνίας.

«Το Portal είναι το μόνο προϊόν στην αγορά του είδους του», είπε ο Hwang. «Σήμερα, τα έξυπνα ηχεία και οθόνες χτίζονται γύρω από τις πληροφορίες και το εμπόριο. Η πύλη έχει δημιουργηθεί για να διευκολύνει τη σύνδεση με τους ανθρώπους που έχουν μεγαλύτερη σημασία: τους στενότερους φίλους και την οικογένειά μας. Και το Portal επικεντρώνεται στη σύνδεση ανθρώπων - μέρος της αποστολής του Facebook - που δεν εξυπηρετείται καλά επί του παρόντος από την αγορά οικιακών συσκευών».

Μελλοντικές προκλήσεις απορρήτου;

Τι εμποδίζει λοιπόν το Facebook; Λοιπόν, δυνητικά απόρρητο. Οι χρήστες έχουν αποδειχθεί εκπληκτικά πρόθυμοι να αγκαλιάσουν τα gadget "πάντα ακούγοντας" από εταιρείες όπως η Google με κεκτημένο συμφέρον στα δεδομένα χρηστών. Αλλά μια συσκευή που σας παρακολουθεί και σας ακούει είναι ακόμα πιο επεμβατική. Επιπλέον, η φήμη του Facebook εξακολουθεί να υποφέρει μετά το περσινό σκάνδαλο Cambridge Analytica.

Προσθήκη smarts στην κάμερα συνομιλίας μέσω βίντεο του Portal (Facebook)

Λίγες μέρες πριν από τη δημοσίευση αυτού του άρθρου, το Washington Post έχουν αναφερθεί ότι το Facebook διαπραγματεύεται έναν διακανονισμό ρεκόρ, πολλών δισεκατομμυρίων δολαρίων με την FTC για τα παραπτώματα της ιδιωτικής ζωής. Με την αυξανόμενη αντίδραση πολλών πρώην χρηστών, δεν έχει ακόμη αποκαλυφθεί αν Facebook έχει στα χέρια του μια επιτυχία σε στυλ Amazon Echo — ή ένα flop τύπου Amazon Fire Phone.

Το Facebook μας διαβεβαίωσε ότι δεν ακούει, δεν προβάλλει και δεν διατηρεί τα περιεχόμενα των βιντεοκλήσεων του Portal, τα οποία είναι επιπλέον κρυπτογραφημένα για την αποφυγή υποκλοπής. Το γεγονός ότι το Portal’s A.I. Τα smart εκτελούνται τοπικά στη συσκευή και όχι σε Facebook διακομιστές, σημαίνει επίσης ότι αυτές οι πληροφορίες δεν φεύγουν από το σπίτι σας. Οι φωνητικές εντολές αποστέλλονται στην εταιρεία μόνο αφού πείτε "Hey Portal" και οι χρήστες μπορούν να διαγράψουν το φωνητικό ιστορικό τους στο αρχείο καταγραφής δραστηριότητας του Facebook ανά πάσα στιγμή.

Αλλά δεν μπορεί να παρακάμψει το γεγονός ότι υπάρχει ακόμη ένας βαθμός συλλογής δεδομένων. "Ενώ δεν ακούμε, δεν προβάλλουμε ή δεν διατηρούμε τα περιεχόμενα των βιντεοκλήσεων σας στο Portal ή δεν χρησιμοποιούμε αυτές τις πληροφορίες για τη στόχευση διαφημίσεων, Επεξεργαστείτε ορισμένες πληροφορίες χρήσης της συσκευής για να κατανοήσετε πώς χρησιμοποιείται το Portal και να βελτιώσετε το προϊόν», σημειώνει το Facebook. (Πολιτική απορρήτου της πύλης μπορείτε να διαβάσετε εδώ.)

Το Portal προσφέρει μια πολύ έξυπνη τεχνολογία με τεράστιες συνέπειες για το μέλλον της συνομιλίας μέσω βίντεο. Δεν υπάρχει αμφιβολία ότι η εταιρεία κατάφερε να βγάλει κάτι πολύ εντυπωσιακό από τεχνολογική άποψη. Αλλά αν μπορεί να πείσει τους πιθανούς πελάτες ότι αυτή είναι μια λύση που χρειάζονται στη ζωή τους, θα αποδειχθεί τελικά το πραγματικό επίτευγμα.

Συστάσεις των συντακτών

  • Διαβάστε την απόκοσμα όμορφη «συνθετική γραφή» ενός A.I. που νομίζει ότι είναι Θεός
  • Γλώσσα supermodel: Πώς το GPT-3 εισάγει αθόρυβα το A.I. επανάσταση
  • Χρησιμοποιήσαμε ένα A.I. εργαλείο σχεδίασης για να δημιουργήσετε ένα νέο λογότυπο. Να τι συνέβη
  • Νευρο-συμβολική A.I. είναι το μέλλον της τεχνητής νοημοσύνης. Ετσι δουλευει
  • Επανεξετάζοντας την άνοδο της A.I.: Πόσο μακριά έχει φτάσει η τεχνητή νοημοσύνη από το 2010;