ChatGPT je skvělé, ale právě teď je omezeno pouze na text – text dovnitř, text ven. GPT-4 Mělo se to rozšířit přidáním zpracování obrazu, aby bylo možné generovat text na základě obrázků.
Obsah
- Co je MiniGPT-4?
- Jak používat MiniGPT-4
- Omezení MiniGPT-4
MiniGPT-4: Zlepšení porozumění zraku a jazyka pomocí pokročilých modelů velkých jazyků
OpenAI však tuto funkci ještě nevydala, což je místo, kde přichází MiniGPT-4. Tento open source projekt nám dává náhled na to, v čem je zpracování obrazu GPT-4 může být – a je to docela pěkné.
Doporučená videa
Co je MiniGPT-4?
![](/f/b962aa0f22e137f4f676135e0e59b504.jpg)
MiniGPT-4 je projekt s otevřeným zdrojovým kódem, který byl zveřejněn na GitHubu, aby demonstroval schopnosti vizuálního jazyka v systému AI. Mezi příklady toho, co dokáže, patří generování popisů obrázků, psaní příběhů na základě obrázků nebo dokonce vytváření webových stránek pouze z kreseb.
Příbuzný
- Špičkoví autoři požadují od firem zabývajících se umělou inteligencí platby za použití jejich díla
- GPT-4: jak používat chatbota s umělou inteligencí, který dělá ChatGPT hanbou
- Wix používá ChatGPT, který vám pomůže rychle vytvořit celý web
Navzdory tomu, co název napovídá, MiniGPT-4 není oficiálně připojen k OpenAI nebo GPT-4. Byla vytvořena skupinou Ph. D. studenti sídlící v Saúdské Arábii na King Abdullah University of Science and Technology. Je také založen na jiném velkém jazykovém modelu (LLM) nazvaném Vicuna, který sám byl postaven na open-source Large Language Model Meta AI (LLaMA). Není to tak silné jako ChatGPT, ale podle hodnocení
Jak používat MiniGPT-4
MiniGPT-4 je pouze demo a je stále ve své první verzi. Prozatím je přístupný zdarma na oficiálních stránkách skupiny. Chcete-li jej použít, jednoduše přetáhněte obrázek dovnitř nebo klikněte na „Drop Image Here“. Po nahrání zadejte výzvu do vyhledávacího pole.
Jaké druhy věcí byste měli vyzkoušet? Požádat MiniGPT-4 o popis obrázku je dost jednoduché. Ale možná budete potřebovat nějakou kopii pro příspěvek na Instagramu pro vaši společnost. Nebo možná chcete znát ingredience potřebné pro zajímavý pokrm a dokonce i recept na jeho vaření. MiniGPT-4 tyto úkoly zvládne překvapivě dobře.
Aspekty kódování jsou na okrajích trochu drsnější. Přeměna jednoduché kresby ubrouskem na fungující webovou stránku byl trik, který OpenAI předvedla, když byla poprvé oznámena GPT-4. Zdá se však, že MiniGPT-4 to zatím nezvládá tak dobře. ChatGPT poskytne přesnější kód – ve skutečnosti spustí jakýkoli kód MiniGPT-4 prostřednictvím ChatGPT nebo
Jedna věc, kterou je třeba poznamenat, je, že MiniGPT-4 používá GPU vašeho místního systému. Pokud tedy nemáte poměrně výkonný samostatný GPU, může vám to připadat poměrně pomalé. Pro kontext jsem to vyzkoušel na a MacBook Pro M2 Maxa vygenerování textu na základě obrázku, který jsem nahrál, trvalo asi 30 sekund.
Omezení MiniGPT-4
Rychlost MiniGPT-4 je jistě omezení. Pokud se k tomu pokoušíte přistupovat bez slušné grafiky, je příliš pomalé na to, abyste cítil odezvu. Pokud jste zvyklí na rychlost cloudového ChatGPT nebo dokonce Bing Image Creator, MiniGPT-4 se bude cítit bolestně pomalý.
Kromě toho má MiniGPT-4 všechna stejná omezení jako ChatGPT nebo Google Bard nebo jakýkoli jiný chatbot s umělou inteligencí, který může „halucinovat“ nebo si vymýšlet informace.
Doporučení redakce
- Zde je důvod, proč si lidé myslí, že GPT-4 může být časem hloupější
- ChatGPT: nejnovější zprávy, kontroverze a tipy, které potřebujete vědět
- Co je výzva DAN pro ChatGPT?
- Google Bard nyní umí mluvit, ale dokáže přehlušit ChatGPT?
- Tvůrce ChatGPT OpenAI čelí vyšetřování FTC kvůli zákonům na ochranu spotřebitele
Upgradujte svůj životní stylDigitální trendy pomáhají čtenářům mít přehled o rychle se měnícím světě technologií se všemi nejnovějšími zprávami, zábavnými recenzemi produktů, zasvěcenými úvodníky a jedinečnými náhledy.