MiniGPT-4: Bugün deneyebileceğiniz ücretsiz bir görüntüden metne yapay zeka aracı

SohbetGPT harika, ancak şu anda yalnızca metinle sınırlı; metin girişi, metin çıkışı. GPT-4 resimlere dayalı metin oluşturmasına izin vermek için görüntü işlemeyi ekleyerek bunu genişletmesi gerekiyordu.

İçindekiler

  • MiniGPT-4 nedir?
  • MiniGPT-4 nasıl kullanılır?
  • MiniGPT-4'ün Sınırlamaları

MiniGPT-4: Gelişmiş Büyük Dil Modelleriyle Görüş-Dil Anlayışının Geliştirilmesi

Ancak OpenAI bu özelliği henüz yayınlamadı; MiniGPT-4 tam da bu noktada devreye giriyor. Bu açık kaynaklı proje bize görüntü işlemenin ne olduğuna dair bir önizleme veriyor GPT-4 şöyle olabilir - ve oldukça düzgün.

Önerilen Videolar

MiniGPT-4 nedir?

MiniGPT-4, bir yapay zeka sistemindeki görüş dili yeteneklerini göstermek için GitHub'da yayınlanan açık kaynaklı bir projedir. Neler yapabileceğine dair bazı örnekler arasında görsellerin açıklamalarını oluşturmak, görsellere dayalı hikayeler yazmak ve hatta sadece çizimlerden web siteleri oluşturmak yer alıyor.

İlgili

  • En iyi yazarlar, çalışmalarını kullanmaları karşılığında yapay zeka firmalarından ödeme talep ediyor
  • GPT-4: ChatGPT'yi utandıran yapay zeka sohbet robotu nasıl kullanılır?
  • Wix, bir web sitesinin tamamını hızlı bir şekilde oluşturmanıza yardımcı olmak için ChatGPT'yi kullanıyor

İsminin ima ettiği şeye rağmen MiniGPT-4 resmi olarak OpenAI veya GPT-4'e bağlı değildir. Bir grup doktora öğrencisi tarafından yaratıldı. Suudi Arabistan'daki Kral Abdullah Bilim ve Teknoloji Üniversitesi'ndeki öğrenciler. Ayrıca, kendisi de açık kaynaklı Büyük Dil Modeli Meta AI (LLaMA) üzerine inşa edilmiş olan Vicuna adı verilen farklı bir büyük dil modeline (LLM) dayanmaktadır. ChatGPT kadar güçlü değil ancak GPT-4 Vicuna'nın kendisi %90'ın içindedir.

MiniGPT-4 nasıl kullanılır?

MiniGPT-4 sadece bir demodur ve hala ilk versiyonundadır. Şimdilik ücretsiz olarak erişilebiliyor Grubun resmi web sitesinde. Kullanmak için bir görseli sürüklemeniz veya “Resmi Buraya Bırak”ı tıklamanız yeterli. Yüklendikten sonra isteminizi arama kutusuna yazın.

Ne tür şeyler denemelisiniz? MiniGPT-4'ten bir görüntüyü tanımlamasını istemek yeterince basittir. Ancak belki de şirketiniz için bir Instagram gönderisi için bir kopyaya ihtiyacınız vardır. Ya da belki ilginç bir yemek için gereken malzemeleri ve hatta onu nasıl pişireceğinize dair bir tarifi bilmek istiyorsunuz. MiniGPT-4 bu görevleri şaşırtıcı derecede iyi bir şekilde yerine getirebilir.

Kodlama yönleri kenarlarda biraz daha kabadır. Basit bir peçete çizimini işleyen bir web sitesine dönüştürmek, GPT-4 ilk duyurulduğunda OpenAI tarafından gösterilen bir numaraydı. Ancak MiniGPT-4 henüz bunu tam olarak halledebilecek gibi görünmüyor. ChatGPT daha doğru kod sağlayacaktır; aslında MiniGPT-4 kodu ne olursa olsun ChatGPT veya GPT-4 size daha iyi sonuçlar verecektir.

Unutulmaması gereken bir nokta, MiniGPT-4'ün yerel sisteminizin GPU'sunu kullanmasıdır. Dolayısıyla, oldukça güçlü bir ayrık GPU'nuz olmadığı sürece deneyimi oldukça yavaş bulabilirsiniz. Bağlam açısından, bunu denedim M2 Max MacBook Prove yüklediğim bir görsele dayalı olarak metin oluşturmak yaklaşık 30 saniye sürdü.

MiniGPT-4'ün Sınırlamaları

MiniGPT-4'ün hızı kesinlikle bir sınırlamadır. Buna iyi grafikler olmadan erişmeye çalışıyorsanız, yanıt verme hissi çok yavaştır. Bulut tabanlı ChatGPT'nin hızına alışkınsanız veya hatta Bing Görüntü OluşturucuMiniGPT-4 acı verici derecede yavaşlayacak.

Bunun ötesinde MiniGPT-4, ChatGPT veya MiniGPT ile aynı sınırlamalara sahiptir. Google Ozanı veya "halüsinasyon görebilen" veya bilgi uydurabilen başka bir AI sohbet robotu.

Editörlerin Önerileri

  • İşte bu yüzden insanlar GPT-4'ün zamanla daha da aptallaşabileceğini düşünüyor
  • ChatGPT: bilmeniz gereken en son haberler, tartışmalar ve ipuçları
  • ChatGPT için DAN istemi nedir?
  • Google Bard artık konuşabiliyor ama ChatGPT'yi bastırabilir mi?
  • ChatGPT yapımcısı OpenAI, tüketici koruma yasaları nedeniyle FTC soruşturmasıyla karşı karşıya

Yaşam tarzınızı yükseltinDigital Trends, en son haberler, eğlenceli ürün incelemeleri, anlayışlı başyazılar ve türünün tek örneği olan ön bakışlarla okuyucuların teknolojinin hızlı tempolu dünyasını takip etmelerine yardımcı olur.