MiniGPT-4: uma ferramenta gratuita de IA de imagem para texto que você pode experimentar hoje

Bate-papoGPT é ótimo, mas no momento está limitado apenas a texto - entrada e saída de texto. GPT-4 deveria expandir isso adicionando processamento de imagem para permitir a geração de texto baseado em imagens.

Conteúdo

  • O que é MiniGPT-4?
  • Como usar o MiniGPT-4
  • Limitações do MiniGPT-4

MiniGPT-4: Aprimorando a Compreensão da Visão-Linguagem com Modelos Avançados de Grandes Linguagens

No entanto, a OpenAI ainda não lançou esse recurso, e é aí que entra o MiniGPT-4. Este projeto de código aberto nos dá uma prévia do que é o processamento de imagem GPT-4 pode ser assim - e é muito legal.

Vídeos recomendados

O que é MiniGPT-4?

MiniGPT-4 é um projeto de código aberto publicado no GitHub para demonstrar capacidades de linguagem de visão em um sistema de IA. Alguns exemplos do que pode fazer incluem gerar descrições de imagens, escrever histórias baseadas em imagens ou até mesmo criar sites apenas a partir de desenhos.

Relacionado

  • Os principais autores exigem pagamento de empresas de IA pelo uso de seu trabalho
  • GPT-4: como usar o chatbot AI que envergonha o ChatGPT
  • Wix usa ChatGPT para ajudá-lo a construir rapidamente um site inteiro

Apesar do que o nome indica, o MiniGPT-4 não está oficialmente conectado ao OpenAI ou GPT-4. Foi criado por um grupo de Ph. estudantes baseados na Arábia Saudita na Universidade King Abdullah de Ciência e Tecnologia. Também é baseado em um modelo de linguagem grande (LLM) diferente chamado Vicuna, que foi construído no Large Language Model Meta AI (LLaMA) de código aberto. Não é tão poderoso quanto o ChatGPT, mas conforme avaliado por GPT-4 em si, a Vicuna chega a 90%.

Como usar o MiniGPT-4

O MiniGPT-4 é apenas uma demonstração e ainda está em sua primeira versão. Por enquanto, ele pode ser acessado gratuitamente no site oficial do grupo. Para usá-lo, basta arrastar uma imagem ou clicar em “Soltar imagem aqui”. Depois de carregado, digite sua solicitação na caixa de pesquisa.

Que tipo de coisas você deve experimentar? Bem, pedir ao MiniGPT-4 para descrever uma imagem é bastante simples. Mas talvez você precise de alguma cópia para uma postagem no Instagram da sua empresa. Ou talvez você queira saber os ingredientes necessários para um prato interessante e até mesmo uma receita de como prepará-lo. O MiniGPT-4 pode lidar com essas tarefas surpreendentemente bem.

Os aspectos de codificação são um pouco mais ásperos. Transformar um simples desenho de guardanapo em um site funcional foi um truque mostrado pela OpenAI quando o GPT-4 foi anunciado pela primeira vez. Mas o MiniGPT-4 ainda não parece ser capaz de lidar com isso tão bem. ChatGPT fornecerá código mais preciso - na verdade, executar qualquer código MiniGPT-4 por meio de ChatGPT ou GPT-4 você obterá melhores resultados.

Uma coisa a notar é que o MiniGPT-4 usa a GPU do seu sistema local. Portanto, a menos que você tenha uma GPU discreta bastante poderosa, poderá achar a experiência bastante lenta. Para contextualizar, experimentei em um MacBook Pro M2 Max, e demorou cerca de 30 segundos para gerar texto com base em uma imagem que carreguei.

Limitações do MiniGPT-4

A velocidade do MiniGPT-4 é certamente uma limitação. Se você está tentando acessar isso sem alguns gráficos decentes, é muito lento para responder. Se você está acostumado com a velocidade do ChatGPT baseado em nuvem ou mesmo Criador de imagens do Bing, o MiniGPT-4 parecerá dolorosamente lento.

Além disso, o MiniGPT-4 tem todas as mesmas limitações que o ChatGPT ou Google Bardo ou qualquer outro chatbot de IA, pois pode “alucinar” ou inventar informações.

Recomendações dos Editores

  • Veja por que as pessoas pensam que o GPT-4 pode ficar mais burro com o tempo
  • ChatGPT: as últimas notícias, polêmicas e dicas que você precisa saber
  • O que é um prompt DAN para ChatGPT?
  • O Google Bard agora pode falar, mas será que pode abafar o ChatGPT?
  • OpenAI, fabricante do ChatGPT, enfrenta investigação da FTC sobre leis de proteção ao consumidor

Atualize seu estilo de vidaDigital Trends ajuda os leitores a manter o controle sobre o mundo acelerado da tecnologia com as últimas notícias, análises divertidas de produtos, editoriais criteriosos e prévias únicas.