MiniGPT-4: أداة ذكاء اصطناعي مجانية لتحويل الصورة إلى نص يمكنك تجربتها اليوم

ChatGPT أمر رائع، ولكنه في الوقت الحالي يقتصر على النص فقط - إدخال النص وإخراج النص. جي بي تي-4 كان من المفترض التوسع في هذا عن طريق إضافة معالجة الصور للسماح لها بإنشاء نص بناءً على الصور.

محتويات

  • ما هو MiniGPT-4؟
  • كيفية استخدام MiniGPT-4
  • حدود MiniGPT-4

MiniGPT-4: تعزيز فهم الرؤية واللغة باستخدام نماذج اللغات الكبيرة المتقدمة

ومع ذلك، لم تطلق OpenAI هذه الميزة بعد، وهنا يأتي دور MiniGPT-4. يمنحنا هذا المشروع مفتوح المصدر معاينة لما تتم فيه معالجة الصور جي بي تي-4 قد يكون الأمر كذلك - وهو أنيق جدًا.

مقاطع الفيديو الموصى بها

ما هو MiniGPT-4؟

MiniGPT-4 هو مشروع مفتوح المصدر تم نشره على GitHub لإثبات قدرات لغة الرؤية في نظام الذكاء الاصطناعي. تتضمن بعض الأمثلة على ما يمكن أن تفعله إنشاء أوصاف للصور، أو كتابة قصص بناءً على الصور، أو حتى إنشاء مواقع ويب من الرسومات فقط.

متعلق ب

  • يطالب كبار المؤلفين بالدفع من شركات الذكاء الاصطناعي مقابل استخدام أعمالهم
  • GPT-4: كيفية استخدام chatbot AI الذي يضع ChatGPT في العار
  • يستخدم Wix ChatGPT لمساعدتك في إنشاء موقع ويب كامل بسرعة

على الرغم مما يوحي به الاسم، فإن MiniGPT-4 غير متصل رسميًا بـ OpenAI أو GPT-4. تم إنشاؤه من قبل مجموعة من الدكتوراه. طلاب مقيمون في المملكة العربية السعودية في جامعة الملك عبد الله للعلوم والتقنية. ويعتمد أيضًا على نموذج لغة كبير مختلف (LLM) يسمى Vicuna، والذي تم بناؤه في حد ذاته على نموذج اللغة الكبير Meta AI (LLaMA) مفتوح المصدر. إنها ليست قوية تمامًا مثل ChatGPT، ولكن يتم تصنيفها حسب

جي بي تي-4 في حد ذاتها، تحصل Vicuna على نسبة 90%.

كيفية استخدام MiniGPT-4

MiniGPT-4 هو مجرد عرض تجريبي ولا يزال في نسخته الأولى. في الوقت الحالي، يمكن الوصول إليه مجانًا على الموقع الرسمي للمجموعة. لاستخدامها، ما عليك سوى سحب الصورة أو النقر على "إسقاط الصورة هنا". بمجرد تحميله، اكتب مطالبتك في مربع البحث.

ما هي أنواع الأشياء التي يجب عليك تجربتها؟ حسنًا، إن مطالبة MiniGPT-4 بوصف صورة أمر بسيط بما فيه الكفاية. ولكن ربما تحتاج إلى بعض النسخ لمنشور Instagram لشركتك. أو ربما تريد معرفة المكونات اللازمة لطبق مثير للاهتمام، وحتى وصفة لكيفية طهيه. يستطيع MiniGPT-4 التعامل مع هذه المهام بشكل جيد بشكل مدهش.

تكون جوانب الترميز أكثر خشونة قليلاً حول الحواف. كان تحويل رسم بسيط على منديل إلى موقع ويب فعال بمثابة خدعة أظهرتها شركة OpenAI عندما تم الإعلان عن GPT-4 لأول مرة. لكن لا يبدو أن MiniGPT-4 قادر على التعامل مع هذا الأمر بشكل جيد حتى الآن. سيوفر ChatGPT تعليمات برمجية أكثر دقة - في الواقع، تشغيل أي رمز MiniGPT-4 من خلال ChatGPT أو جي بي تي-4 سوف صافي لك نتائج أفضل.

شيء واحد يجب ملاحظته هو أن MiniGPT-4 يستخدم وحدة معالجة الرسومات الخاصة بنظامك المحلي. لذلك، ما لم يكن لديك وحدة معالجة رسومات منفصلة قوية إلى حد ما، فقد تجد التجربة بطيئة إلى حد ما. للسياق، لقد جربته على ام 2 ماكس ماك بوك برو، واستغرق الأمر حوالي 30 ثانية لإنشاء نص بناءً على الصورة التي قمت بتحميلها.

حدود MiniGPT-4

من المؤكد أن سرعة MiniGPT-4 تمثل قيدًا. إذا كنت تحاول الوصول إلى هذا بدون بعض الرسومات الجيدة، فمن البطيء جدًا أن تشعر بالاستجابة. إذا كنت معتادًا على سرعة ChatGPT السحابية أو حتى برنامج بنج لإنشاء الصور، سيبدو MiniGPT-4 بطيئًا بشكل مؤلم.

علاوة على ذلك، يتمتع MiniGPT-4 بنفس القيود التي يتمتع بها ChatGPT أو جوجل بارد أو أي برنامج دردشة آخر يعمل بالذكاء الاصطناعي حيث يمكنه "الهلوسة" أو اختلاق المعلومات.

توصيات المحررين

  • لهذا السبب يعتقد الناس أن GPT-4 قد يصبح أكثر غباءً بمرور الوقت
  • ChatGPT: آخر الأخبار والخلافات والنصائح التي تحتاج إلى معرفتها
  • ما هي مطالبة DAN لـ ChatGPT؟
  • بإمكان Google Bard الآن التحدث، لكن هل يمكنه إخفاء ChatGPT؟
  • يواجه صانع ChatGPT OpenAI تحقيقًا من لجنة التجارة الفيدرالية (FTC) بشأن قوانين حماية المستهلك

ترقية نمط حياتكتساعد الاتجاهات الرقمية القراء على متابعة عالم التكنولوجيا سريع الخطى من خلال أحدث الأخبار ومراجعات المنتجات الممتعة والمقالات الافتتاحية الثاقبة ونظرات خاطفة فريدة من نوعها.