ChatGPT είναι υπέροχο, αλλά αυτή τη στιγμή, περιορίζεται μόνο σε κείμενο — εισαγωγή κειμένου, αποστολή κειμένου. GPT-4 έπρεπε να επεκταθεί σε αυτό προσθέτοντας επεξεργασία εικόνας για να του επιτρέψει να δημιουργεί κείμενο με βάση εικόνες.
Περιεχόμενα
- Τι είναι το MiniGPT-4;
- Πώς να χρησιμοποιήσετε το MiniGPT-4
- Περιορισμοί του MiniGPT-4
MiniGPT-4: Βελτίωση της κατανόησης της γλώσσας της όρασης με προηγμένα μοντέλα μεγάλων γλωσσών
Ωστόσο, το OpenAI δεν έχει κυκλοφορήσει ακόμη αυτό το χαρακτηριστικό, όπου έρχεται το MiniGPT-4. Αυτό το έργο ανοιχτού κώδικα μας δίνει μια προεπισκόπηση της επεξεργασίας εικόνας GPT-4 μπορεί να είναι - και είναι αρκετά τακτοποιημένο.
Προτεινόμενα βίντεο
Τι είναι το MiniGPT-4;

Το MiniGPT-4 είναι ένα έργο ανοιχτού κώδικα που δημοσιεύτηκε στο GitHub για να επιδείξει τις δυνατότητες γλώσσας όρασης σε ένα σύστημα AI. Μερικά παραδείγματα του τι μπορεί να κάνει περιλαμβάνουν τη δημιουργία περιγραφών εικόνων, τη σύνταξη ιστοριών με βάση εικόνες ή ακόμα και τη δημιουργία ιστοτόπων μόνο από σχέδια.
Σχετίζεται με
- Οι κορυφαίοι συγγραφείς απαιτούν πληρωμή από εταιρείες τεχνητής νοημοσύνης για τη χρήση του έργου τους
- GPT-4: πώς να χρησιμοποιήσετε το chatbot AI που κάνει το ChatGPT σε ντροπή
- Το Wix χρησιμοποιεί το ChatGPT για να σας βοηθήσει να δημιουργήσετε γρήγορα έναν ολόκληρο ιστότοπο
Παρά το ότι υπονοεί το όνομα, το MiniGPT-4 δεν είναι επίσημα συνδεδεμένο με το OpenAI ή το GPT-4. Δημιουργήθηκε από μια ομάδα Ph. D. φοιτητές με έδρα τη Σαουδική Αραβία στο King Abdullah University of Science and Technology. Βασίζεται επίσης σε ένα διαφορετικό μοντέλο μεγάλης γλώσσας (LLM) που ονομάζεται Vicuna, το οποίο έχει δημιουργηθεί στο ανοιχτού κώδικα Large Language Model Meta AI (LLaMA). Δεν είναι τόσο ισχυρό όσο το ChatGPT, αλλά όπως βαθμολογείται από
Πώς να χρησιμοποιήσετε το MiniGPT-4
Το MiniGPT-4 είναι απλώς ένα demo και βρίσκεται ακόμα στην πρώτη του έκδοση. Προς το παρόν, η πρόσβαση σε αυτό είναι δωρεάν στην επίσημη ιστοσελίδα του ομίλου. Για να το χρησιμοποιήσετε, απλώς σύρετε μια εικόνα μέσα ή κάντε κλικ στο «Απόθεση εικόνας εδώ». Μόλις μεταφορτωθεί, πληκτρολογήστε την προτροπή σας στο πλαίσιο αναζήτησης.
Τι είδους πράγματα πρέπει να δοκιμάσετε; Λοιπόν, το να ζητήσετε από το MiniGPT-4 να περιγράψει μια εικόνα είναι αρκετά απλό. Αλλά ίσως χρειάζεστε κάποιο αντίγραφο για μια ανάρτηση στο Instagram για την εταιρεία σας. Ή ίσως θέλετε να μάθετε τα υλικά που χρειάζονται για ένα ενδιαφέρον πιάτο, ακόμα και μια συνταγή για το πώς να το μαγειρέψετε. Το MiniGPT-4 μπορεί να χειριστεί αυτές τις εργασίες εκπληκτικά καλά.
Οι πτυχές κωδικοποίησης είναι λίγο πιο τραχιές γύρω από τις άκρες. Η μετατροπή ενός απλού σχεδίου χαρτοπετσέτας σε λειτουργικό ιστότοπο ήταν ένα τέχνασμα που έδειξε το OpenAI όταν ανακοινώθηκε για πρώτη φορά το GPT-4. Αλλά το MiniGPT-4 δεν φαίνεται να μπορεί να το χειριστεί τόσο καλά ακόμα. Το ChatGPT θα παρέχει πιο ακριβή κώδικα — στην πραγματικότητα, η εκτέλεση οποιουδήποτε κώδικα MiniGPT-4 είναι μέσω ChatGPT ή
Ένα πράγμα που πρέπει να σημειωθεί είναι ότι το MiniGPT-4 χρησιμοποιεί την GPU του τοπικού σας συστήματος. Έτσι, εάν δεν έχετε μια αρκετά ισχυρή διακριτή GPU, μπορεί να βρείτε την εμπειρία αρκετά αργή. Για το πλαίσιο, το δοκίμασα σε ένα M2 Max MacBook Pro, και χρειάστηκαν περίπου 30 δευτερόλεπτα για να δημιουργηθεί κείμενο με βάση μια εικόνα που ανέβασα.
Περιορισμοί του MiniGPT-4
Η ταχύτητα του MiniGPT-4 είναι σίγουρα ένας περιορισμός. Εάν προσπαθείτε να αποκτήσετε πρόσβαση σε αυτό χωρίς κάποια αξιοπρεπή γραφικά, είναι πολύ αργό για να ανταποκριθείτε. Εάν είστε συνηθισμένοι στην ταχύτητα του ChatGPT που βασίζεται σε σύννεφο ή ακόμα Δημιουργός εικόνων Bing, το MiniGPT-4 θα είναι οδυνηρά αργό.
Πέρα από αυτό, το MiniGPT-4 έχει όλους τους ίδιους περιορισμούς με το ChatGPT ή Google Bard ή οποιοδήποτε άλλο chatbot τεχνητής νοημοσύνης, καθώς μπορεί να "παραισθανθεί" ή να δημιουργήσει πληροφορίες.
Συστάσεις των συντακτών
- Να γιατί οι άνθρωποι πιστεύουν ότι το GPT-4 μπορεί να γίνεται πιο χαζό με την πάροδο του χρόνου
- ChatGPT: τα τελευταία νέα, οι διαμάχες και οι συμβουλές που πρέπει να γνωρίζετε
- Τι είναι μια προτροπή DAN για το ChatGPT;
- Το Google Bard μπορεί τώρα να μιλήσει, αλλά μπορεί να πνίξει το ChatGPT;
- Ο κατασκευαστής ChatGPT OpenAI αντιμετωπίζει έρευνα της FTC σχετικά με τους νόμους περί προστασίας των καταναλωτών
Αναβαθμίστε τον τρόπο ζωής σαςΤο Digital Trends βοηθά τους αναγνώστες να παρακολουθούν τον γρήγορο κόσμο της τεχνολογίας με όλα τα τελευταία νέα, διασκεδαστικές κριτικές προϊόντων, διορατικά editorial και μοναδικές κρυφές ματιές.