Ετοιμαστείτε: Τα GIF που δημιουργούνται από AI ενδέχεται να έρθουν σύντομα

Με chatbots και γεννήτριες κειμένου σε εικόνα καταιγίζοντας το Διαδίκτυο, το επόμενο όριο της τεχνητής νοημοσύνης μπορεί να είναι οι γεννήτριες κειμένου σε βίντεο.

Η Nvidia δημοσίευσε πρόσφατα μια ερευνητική εργασία με τίτλο "Σύνθεση βίντεο υψηλής ανάλυσης με μοντέλα λανθάνουσας διάχυσης" σχετικά με τα πειράματά της στο Toronto AI Lab που περιγράφει λεπτομερώς τον τρόπο με τον οποίο χρησιμοποιεί το Stable Diffusion για να δημιουργήσει ένα εργαλείο που μπορεί να κάνει την κινούμενη τέχνη να προκύπτει από μηνύματα προτροπής κειμένου.

Προτεινόμενα βίντεο

Η τεχνολογική εταιρεία παρουσίασε επιδείξεις των μοντέλων λανθάνουσας διάχυσης (LDM), τα οποία χρησιμοποιούν κείμενο για τη δημιουργία βίντεο κλιπ χωρίς μεγάλες ποσότητες επεξεργασίας υπολογιστή, TechRadar διάσημος.

Το εργαλείο μπορεί να δημιουργήσει κινούμενες εικόνες σε στυλ GIF που είναι βίντεο διάρκειας περίπου 4,7 δευτερολέπτων σε ανάλυση 1.280 x 2.048. Είναι επίσης σε θέση να δημιουργεί μεγαλύτερα βίντεο σε χαμηλότερη ανάλυση 512 x 1024, σύμφωνα με την ερευνητική εργασία.

Έχοντας δει μια επίδειξη της τεχνολογίας, η TechRadar είπε ότι το εργαλείο είναι πιθανότατα ιδανικό ως δημιουργία κειμένου σε GIF σε αυτό το σημείο. Η δημοσίευση σημείωσε ότι μπορούσε εύκολα να χειριστεί απλές προτροπές όπως π.χ ένας θύελλας που σκουπίζει με ηλεκτρική σκούπα στην παραλία ή Το αρκουδάκι παίζει ηλεκτρική κιθάρα, υψηλής ευκρίνειας, . Παρόλα αυτά, το αποτέλεσμα παρήγαγε τυχαία τεχνουργήματα και μουτζούρες στα GIF, όπως συμβαίνει σε άλλα εργαλεία τεχνητής νοημοσύνης που χρησιμοποιούνται τακτικά, όπως Μεσοταξίδι.

Η δημοσίευση πιστεύει ότι τα μεγαλύτερα βίντεο χρειάζονται ακόμα λίγη περισσότερη ανάπτυξη προτού φτάσουν στην πρώτη τους ώρα, αλλά πιστεύει ότι η Nvidia θα εργαστεί γρήγορα για να ετοιμάσει την τεχνολογία. Μπορεί να λειτουργούν καλά για βιβλιοθήκες αποθεμάτων και παρόμοιους σκοπούς.

Υπάρχουν και άλλες εταιρείες που πειραματίζονται με γεννήτριες κειμένου σε βίντεο με τεχνητή νοημοσύνη. Η Google παρουσίασε τη γεννήτρια Phenaki της, η οποία επιτρέπει μεγαλύτερες προτροπές που παράγουν κλιπ 20 δευτερολέπτων. Μια άλλη startup που ονομάζεται Runway ανακοίνωσε το μοντέλο βίντεο δεύτερης γενιάς της τον περασμένο μήνα, το οποίο βασίζεται επίσης στο Stable Diffusion. Το demo της προτροπής ο αργά το απόγευμα ήλιος που κρυφοκοιτάζει μέσα από το παράθυρο μιας σοφίτας στη Νέα Υόρκη δείχνει πώς μπορείτε να προσθέσετε ελαφρά κινούμενα εφέ σε στατικές εικόνες.

Οι χρήστες θα επωφεληθούν επίσης από την προσθήκη AI σε άλλα προγράμματα, όπως το Adobe Firefly και το Adobe Premiere Rush, σύμφωνα με το TechRadar.

Κάποιες άλλες εταιρείες, όπως π.χ Narakeet και Lume5, εμπορεύονται ότι διαθέτουν γεννήτριες κειμένου σε βίντεο. Ωστόσο, πολλά από αυτά τα εργαλεία λειτουργούν περισσότερο σαν παρουσιάσεις PowerPoint, συνδυάζοντας κείμενο, ήχο, εικόνες, και ίσως κάποια ήδη παραγόμενα κλιπ βίντεο με προτροπές, σε αντίθεση με τη δημιουργία ενός μοναδικού δουλειά.

Συστάσεις των συντακτών

  • Οι ανακαλύψεις στην τεχνητή νοημοσύνη θα μπορούσαν να έρθουν μέσω του εγκεφάλου των μελισσών, λένε οι επιστήμονες
  • Η Nvidia φέρνει την τεχνητή νοημοσύνη τύπου ChatGPT στα βιντεοπαιχνίδια και ήδη ανησυχώ
  • Πώς η γενετική τεχνητή νοημοσύνη θα δημιουργήσει παιχνίδια με «ευρύτερους, μεγαλύτερους και βαθύτερους κόσμους»
  • Σταματήστε να χρησιμοποιείτε εργαλεία παραγωγής τεχνητής νοημοσύνης όπως το ChatGPT, η Samsung παραγγέλνει το προσωπικό
  • Η νέα εφαρμογή Designer της Microsoft καθιστά τη γεννήτρια τεχνητή νοημοσύνη νεκρή απλή

Αναβαθμίστε τον τρόπο ζωής σαςΤο Digital Trends βοηθά τους αναγνώστες να παρακολουθούν τον γρήγορο κόσμο της τεχνολογίας με όλα τα τελευταία νέα, διασκεδαστικές κριτικές προϊόντων, διορατικά editorial και μοναδικές κρυφές ματιές.