MiniGPT-4: Bezplatný nástroj umělé inteligence pro převod obrázků na text, který můžete vyzkoušet již dnes

ChatGPT je skvělé, ale právě teď je omezeno pouze na text – text dovnitř, text ven. GPT-4 Mělo se to rozšířit přidáním zpracování obrazu, aby bylo možné generovat text na základě obrázků.

Obsah

  • Co je MiniGPT-4?
  • Jak používat MiniGPT-4
  • Omezení MiniGPT-4

MiniGPT-4: Zlepšení porozumění zraku a jazyka pomocí pokročilých modelů velkých jazyků

OpenAI však tuto funkci ještě nevydala, což je místo, kde přichází MiniGPT-4. Tento open source projekt nám dává náhled na to, v čem je zpracování obrazu GPT-4 může být – a je to docela pěkné.

Doporučená videa

Co je MiniGPT-4?

MiniGPT-4 je projekt s otevřeným zdrojovým kódem, který byl zveřejněn na GitHubu, aby demonstroval schopnosti vizuálního jazyka v systému AI. Mezi příklady toho, co dokáže, patří generování popisů obrázků, psaní příběhů na základě obrázků nebo dokonce vytváření webových stránek pouze z kreseb.

Příbuzný

  • Špičkoví autoři požadují od firem zabývajících se umělou inteligencí platby za použití jejich díla
  • GPT-4: jak používat chatbota s umělou inteligencí, který dělá ChatGPT hanbou
  • Wix používá ChatGPT, který vám pomůže rychle vytvořit celý web

Navzdory tomu, co název napovídá, MiniGPT-4 není oficiálně připojen k OpenAI nebo GPT-4. Byla vytvořena skupinou Ph. D. studenti sídlící v Saúdské Arábii na King Abdullah University of Science and Technology. Je také založen na jiném velkém jazykovém modelu (LLM) nazvaném Vicuna, který sám byl postaven na open-source Large Language Model Meta AI (LLaMA). Není to tak silné jako ChatGPT, ale podle hodnocení GPT-4 sama se Vicuna dostane do 90 %.

Jak používat MiniGPT-4

MiniGPT-4 je pouze demo a je stále ve své první verzi. Prozatím je přístupný zdarma na oficiálních stránkách skupiny. Chcete-li jej použít, jednoduše přetáhněte obrázek dovnitř nebo klikněte na „Drop Image Here“. Po nahrání zadejte výzvu do vyhledávacího pole.

Jaké druhy věcí byste měli vyzkoušet? Požádat MiniGPT-4 o popis obrázku je dost jednoduché. Ale možná budete potřebovat nějakou kopii pro příspěvek na Instagramu pro vaši společnost. Nebo možná chcete znát ingredience potřebné pro zajímavý pokrm a dokonce i recept na jeho vaření. MiniGPT-4 tyto úkoly zvládne překvapivě dobře.

Aspekty kódování jsou na okrajích trochu drsnější. Přeměna jednoduché kresby ubrouskem na fungující webovou stránku byl trik, který OpenAI předvedla, když byla poprvé oznámena GPT-4. Zdá se však, že MiniGPT-4 to zatím nezvládá tak dobře. ChatGPT poskytne přesnější kód – ve skutečnosti spustí jakýkoli kód MiniGPT-4 prostřednictvím ChatGPT nebo GPT-4 přinese vám lepší výsledky.

Jedna věc, kterou je třeba poznamenat, je, že MiniGPT-4 používá GPU vašeho místního systému. Pokud tedy nemáte poměrně výkonný samostatný GPU, může vám to připadat poměrně pomalé. Pro kontext jsem to vyzkoušel na a MacBook Pro M2 Maxa vygenerování textu na základě obrázku, který jsem nahrál, trvalo asi 30 sekund.

Omezení MiniGPT-4

Rychlost MiniGPT-4 je jistě omezení. Pokud se k tomu pokoušíte přistupovat bez slušné grafiky, je příliš pomalé na to, abyste cítil odezvu. Pokud jste zvyklí na rychlost cloudového ChatGPT nebo dokonce Bing Image Creator, MiniGPT-4 se bude cítit bolestně pomalý.

Kromě toho má MiniGPT-4 všechna stejná omezení jako ChatGPT nebo Google Bard nebo jakýkoli jiný chatbot s umělou inteligencí, který může „halucinovat“ nebo si vymýšlet informace.

Doporučení redakce

  • Zde je důvod, proč si lidé myslí, že GPT-4 může být časem hloupější
  • ChatGPT: nejnovější zprávy, kontroverze a tipy, které potřebujete vědět
  • Co je výzva DAN pro ChatGPT?
  • Google Bard nyní umí mluvit, ale dokáže přehlušit ChatGPT?
  • Tvůrce ChatGPT OpenAI čelí vyšetřování FTC kvůli zákonům na ochranu spotřebitele

Upgradujte svůj životní stylDigitální trendy pomáhají čtenářům mít přehled o rychle se měnícím světě technologií se všemi nejnovějšími zprávami, zábavnými recenzemi produktů, zasvěcenými úvodníky a jedinečnými náhledy.