Ο Meta έφτιαξε το DALL-E για βίντεο και είναι ανατριχιαστικό και εκπληκτικό

Η Meta αποκάλυψε ένα τρελό μοντέλο τεχνητής νοημοσύνης που επιτρέπει στους χρήστες να μετατρέψουν τις δακτυλογραφημένες περιγραφές τους σε βίντεο. Το σύστημα ονομάζεται Κάνε ένα βίντεο και είναι η πιο πρόσφατη σε μια τάση περιεχομένου που δημιουργείται με τεχνητή νοημοσύνη στον Ιστό.

Το σύστημα δέχεται σύντομες περιγραφές όπως «ένα ρομπότ που σερφάρει σε ένα κύμα στον ωκεανό» ή «ψάρι κλόουν που κολυμπάει στον κοραλλιογενή ύφαλο» και δημιουργεί δυναμικά ένα σύντομο GIF της περιγραφής. Υπάρχουν ακόμη και τρία διαφορετικά στυλ βίντεο για να διαλέξετε: σουρεαλιστικά, ρεαλιστικά και στυλιζαρισμένα.

Η ζωγραφική ενός καλλιτέχνη με πινέλο σε καμβά από κοντά

Σύμφωνα με α Ανάρτηση στο Facebook από τον Διευθύνοντα Σύμβουλο της Meta, Mark Zuckerberg, η μετάφραση γραπτού κειμένου σε βίντεο είναι πολύ πιο δύσκολη λόγω του πώς το βίντεο απαιτεί κίνηση:

Προτεινόμενα βίντεο

«Είναι πολύ πιο δύσκολο να δημιουργήσεις βίντεο από φωτογραφίες, γιατί πέρα ​​από τη σωστή παραγωγή κάθε pixel, το σύστημα πρέπει επίσης να προβλέψει πώς θα αλλάξουν με την πάροδο του χρόνου. Το Make-A-Video το λύνει αυτό προσθέτοντας ένα επίπεδο μάθησης χωρίς επίβλεψη που επιτρέπει στο σύστημα να κατανοήσει την κίνηση στον φυσικό κόσμο και να την εφαρμόσει στην παραδοσιακή δημιουργία κειμένου σε εικόνα."

Ένα νεαρό ζευγάρι που περπατά σε μια δυνατή βροχή

Η ερευνητική ομάδα AI της Meta έγραψε α χαρτί περιγράφοντας πώς λειτουργεί το σύστημα και πώς διαφέρει από τις τρέχουσες μεθόδους μετατροπής κειμένου σε εικόνα (T2I). Σε αντίθεση με άλλα μοντέλα γλώσσας μηχανής, η μέθοδος Text-to-Video (T2V) της Meta δεν χρησιμοποιεί προκαθορισμένα ζεύγη κειμένου-βίντεο. Για παράδειγμα, δεν συνδυάζει το "man walking" με ένα βίντεο ενός πραγματικού άνδρα που περπατά.

Αν αυτό μοιάζει πολύ με το DALL-E, τη δημοφιλή εφαρμογή T2I, δεν θα ήσασταν μακριά. Άλλες εφαρμογές T2I έχουν κυκλοφορήσει από τότε που το DALL-E κέρδισε δημοτικότητα. Το TikTok κυκλοφόρησε ένα φίλτρο τον Αύγουστο ονομάζεται AI Greenscreen που δημιουργεί εικόνες στυλ ζωγραφικής με βάση τις λέξεις που πληκτρολογείτε.

Ένα χνουδωτό μωρό νωθρό με ένα πορτοκαλί πλεκτό καπέλο που προσπαθεί να καταλάβει ένα φορητό υπολογιστή από κοντά, εξαιρετικά λεπτομερή οθόνη φωτισμού στούντιο που αντανακλά στο μάτι του

Το περιεχόμενο που δημιουργείται από AI έχει γίνει αρκετά δημοφιλές τα τελευταία χρόνια. Deepfake τεχνολογία, τεχνικές μηχανικής μάθησης για την αντικατάσταση του προσώπου ενός ατόμου με ένα άλλο, χρησιμοποιούνται ακόμη και από στούντιο οπτικών εφέ για εκπομπές μεγάλου προϋπολογισμού όπως Ο Μανταλοριανός.

Τον Ιούλιο, οι Times ανέφεραν κατά λάθος μια Ουκρανή εν μέσω του πολέμου Ρωσίας-Ουκρανίας. Το ΠΡΟΒΛΗΜΑ ΕΙΝΑΙ δεν ήταν αληθινή.

Η απειλή της AI πιθανώς δεν αποτελεί πραγματική απειλή, αλλά έργα όπως το DALL-E και το Make-A-Video είναι διασκεδαστικές εξερευνήσεις σε μερικές από τις ενδιαφέρουσες δυνατότητες.

Συστάσεις των συντακτών

  • Ο αντίπαλος ChatGPT της Apple μπορεί να γράψει αυτόματα κώδικα για εσάς
  • Το Bing Image Creator φέρνει εικόνες που δημιουργούνται από το DALL-E AI στο πρόγραμμα περιήγησής σας
  • Έχω δει το (μακρινό) μέλλον της τεχνητής νοημοσύνης στον ιστό - εδώ είναι εκπληκτικό και πού δυσκολεύεται
  • Το AI Dall-E που δημιουργεί εικόνα είναι πλέον δωρεάν για να παίξει οποιοσδήποτε
  • Έθεσα την γελοία ιδέα μου για εκκίνηση σε ένα ρομπότ VC

Αναβαθμίστε τον τρόπο ζωής σαςΤο Digital Trends βοηθά τους αναγνώστες να παρακολουθούν τον γρήγορο κόσμο της τεχνολογίας με όλα τα τελευταία νέα, διασκεδαστικές κριτικές προϊόντων, διορατικά editorial και μοναδικές κρυφές ματιές.