MiniGPT-4: เครื่องมือ AI รูปภาพเป็นข้อความฟรีที่คุณลองใช้ได้แล้ววันนี้

ChatGPT เยี่ยมมาก แต่ตอนนี้จำกัดอยู่แค่ข้อความเท่านั้น ทั้งข้อความเข้าและข้อความออก GPT-4 ควรขยายเรื่องนี้ด้วยการเพิ่มการประมวลผลรูปภาพเพื่อให้สามารถสร้างข้อความตามรูปภาพได้

สารบัญ

  • MiniGPT-4 คืออะไร?
  • วิธีการใช้งาน MiniGPT-4
  • ข้อจำกัดของ MiniGPT-4

MiniGPT-4: ปรับปรุงความเข้าใจภาษาการมองเห็นด้วยโมเดลภาษาขนาดใหญ่ขั้นสูง

อย่างไรก็ตาม OpenAI ยังไม่ได้เปิดตัวฟีเจอร์นี้ ซึ่งเป็นที่มาของ MiniGPT-4 โครงการโอเพ่นซอร์สนี้ช่วยให้เราเห็นตัวอย่างว่าการประมวลผลภาพใช้อะไรบ้าง GPT-4 อาจจะเป็นเช่นนั้น — และมันก็ค่อนข้างเรียบร้อย

วิดีโอแนะนำ

MiniGPT-4 คืออะไร?

MiniGPT-4 เป็นโปรเจ็กต์โอเพ่นซอร์สที่โพสต์บน GitHub เพื่อสาธิตความสามารถด้านการมองเห็นในระบบ AI ตัวอย่างบางส่วนของสิ่งที่สามารถทำได้ ได้แก่ การสร้างคำอธิบายรูปภาพ การเขียนเรื่องราวจากรูปภาพ หรือแม้แต่การสร้างเว็บไซต์จากภาพวาด

ที่เกี่ยวข้อง

  • นักเขียนชั้นนำเรียกร้องเงินจากบริษัท AI เพื่อใช้งานของพวกเขา
  • GPT-4: วิธีใช้แชทบอท AI ที่ทำให้ ChatGPT อับอาย
  • Wix ใช้ ChatGPT เพื่อช่วยคุณสร้างเว็บไซต์ทั้งหมดได้อย่างรวดเร็ว

แม้ว่าชื่อจะสื่อถึงอะไร แต่ MiniGPT-4 ไม่ได้เชื่อมต่อกับ OpenAI หรือ GPT-4 อย่างเป็นทางการ ถูกสร้างขึ้นโดยกลุ่มปริญญาเอก นักศึกษาที่อยู่ในซาอุดีอาระเบียที่มหาวิทยาลัยวิทยาศาสตร์และเทคโนโลยี King Abdullah นอกจากนี้ยังขึ้นอยู่กับโมเดลภาษาขนาดใหญ่ (LLM) อื่นที่เรียกว่า Vicuna ซึ่งตัวมันเองถูกสร้างขึ้นบนโอเพ่นซอร์ส Large Language Model Meta AI (LLaMA) มันไม่ได้ทรงพลังเท่ากับ ChatGPT แต่ให้คะแนนตาม

GPT-4 ตัว Vicuna จะได้รับภายใน 90%

วิธีการใช้งาน MiniGPT-4

MiniGPT-4 เป็นเพียงตัวอย่างและยังอยู่ในเวอร์ชันแรก สำหรับตอนนี้สามารถเข้าถึงได้ฟรี ที่เว็บไซต์อย่างเป็นทางการของกลุ่ม. หากต้องการใช้งาน เพียงลากรูปภาพเข้ามาหรือคลิก "วางรูปภาพที่นี่" เมื่ออัปโหลดแล้ว ให้พิมพ์ข้อความแจ้งของคุณลงในช่องค้นหา

คุณควรลองทำสิ่งใดบ้าง? การขอให้ MiniGPT-4 อธิบายภาพนั้นง่ายเพียงพอ แต่บางทีคุณอาจต้องการสำเนาสำหรับโพสต์ Instagram สำหรับบริษัทของคุณ หรือบางทีคุณอาจต้องการทราบส่วนผสมที่จำเป็นสำหรับอาหารจานที่น่าสนใจ และแม้กระทั่งสูตรวิธีทำอาหาร MiniGPT-4 สามารถจัดการงานเหล่านี้ได้ดีอย่างน่าประหลาดใจ

ด้านการเขียนโค้ดมีความหยาบมากขึ้นเล็กน้อยบริเวณขอบ การเปลี่ยนภาพวาดผ้าเช็ดปากธรรมดาๆ ให้เป็นเว็บไซต์ที่ใช้งานได้นั้นเป็นกลอุบายที่ OpenAI แสดงเมื่อมีการประกาศ GPT-4 เป็นครั้งแรก แต่ดูเหมือนว่า MiniGPT-4 จะยังไม่สามารถจัดการเรื่องนั้นได้ดีนัก ChatGPT จะให้โค้ดที่แม่นยำยิ่งขึ้น — อันที่จริงการรันโค้ด MiniGPT-4 ก็ตามผ่าน ChatGPT หรือ GPT-4 จะทำให้คุณได้รับผลลัพธ์ที่ดีกว่า

สิ่งหนึ่งที่ควรทราบก็คือ MiniGPT-4 ใช้ GPU ของระบบในเครื่องของคุณ ดังนั้น เว้นแต่คุณจะมี GPU แยกที่ทรงพลังพอสมควร คุณอาจพบว่าประสบการณ์นั้นค่อนข้างช้า สำหรับบริบท ฉันลองใช้กับ a M2 แม็กซ์แมคบุ๊คโปรและใช้เวลาประมาณ 30 วินาทีในการสร้างข้อความตามรูปภาพที่ฉันอัปโหลด

ข้อจำกัดของ MiniGPT-4

ความเร็วของ MiniGPT-4 ถือเป็นข้อจำกัดอย่างแน่นอน หากคุณพยายามเข้าถึงสิ่งนี้โดยไม่มีกราฟิกที่ดี การตอบสนองจะช้าเกินไป หากคุณคุ้นเคยกับความเร็วของ ChatGPT บนคลาวด์หรือแม้แต่ โปรแกรมสร้างภาพ Bing, MiniGPT-4 จะรู้สึกช้าลงอย่างเจ็บปวด

นอกเหนือจากนั้น MiniGPT-4 ยังมีข้อจำกัดเหมือนกับ ChatGPT หรือ กูเกิล เบิร์ด หรือแชทบอท AI อื่น ๆ ที่สามารถ "เห็นภาพหลอน" หรือสร้างข้อมูลได้

คำแนะนำของบรรณาธิการ

  • นี่คือสาเหตุที่ผู้คนคิดว่า GPT-4 อาจจะโง่ลงเมื่อเวลาผ่านไป
  • ChatGPT: ข่าวสารล่าสุด ข้อโต้แย้ง และเคล็ดลับที่คุณต้องรู้
  • พรอมต์ DAN สำหรับ ChatGPT คืออะไร
  • Google Bard สามารถพูดได้แล้ว แต่จะทำให้ ChatGPT จมหายไปได้หรือไม่
  • OpenAI ผู้ผลิต ChatGPT เผชิญกับการสอบสวน FTC เกี่ยวกับกฎหมายคุ้มครองผู้บริโภค

อัพเกรดไลฟ์สไตล์ของคุณDigital Trends ช่วยให้ผู้อ่านติดตามโลกแห่งเทคโนโลยีที่เปลี่ยนแปลงไปอย่างรวดเร็วด้วยข่าวสารล่าสุด รีวิวผลิตภัณฑ์สนุกๆ บทบรรณาธิการที่เจาะลึก และการแอบดูที่ไม่ซ้ำใคร

หมวดหมู่

ล่าสุด

ทุกสิ่งที่คุณจำเป็นต้องรู้เกี่ยวกับ Chime.in

ทุกสิ่งที่คุณจำเป็นต้องรู้เกี่ยวกับ Chime.in

เว็บไซต์โซเชียลเน็ตเวิร์กอีกเว็บหนึ่งกำลังทำให้...

ติดตาม 'Twin Peaks' ด้วยรายละเอียดซีรีส์ดั้งเดิมของเรา

ติดตาม 'Twin Peaks' ด้วยรายละเอียดซีรีส์ดั้งเดิมของเรา

ทวินพีคส์ | ความมืดแห่งอนาคตในอดีต | ซีรีส์ SHO...

อธิบายแผนการโทรศัพท์ของ AT&T

อธิบายแผนการโทรศัพท์ของ AT&T

แผนบริการโทรศัพท์ของ T-Mobile อาจได้รับความสนใจ...