ChatGPT เยี่ยมมาก แต่ตอนนี้จำกัดอยู่แค่ข้อความเท่านั้น ทั้งข้อความเข้าและข้อความออก GPT-4 ควรขยายเรื่องนี้ด้วยการเพิ่มการประมวลผลรูปภาพเพื่อให้สามารถสร้างข้อความตามรูปภาพได้
สารบัญ
- MiniGPT-4 คืออะไร?
- วิธีการใช้งาน MiniGPT-4
- ข้อจำกัดของ MiniGPT-4
MiniGPT-4: ปรับปรุงความเข้าใจภาษาการมองเห็นด้วยโมเดลภาษาขนาดใหญ่ขั้นสูง
อย่างไรก็ตาม OpenAI ยังไม่ได้เปิดตัวฟีเจอร์นี้ ซึ่งเป็นที่มาของ MiniGPT-4 โครงการโอเพ่นซอร์สนี้ช่วยให้เราเห็นตัวอย่างว่าการประมวลผลภาพใช้อะไรบ้าง GPT-4 อาจจะเป็นเช่นนั้น — และมันก็ค่อนข้างเรียบร้อย
วิดีโอแนะนำ
MiniGPT-4 คืออะไร?
MiniGPT-4 เป็นโปรเจ็กต์โอเพ่นซอร์สที่โพสต์บน GitHub เพื่อสาธิตความสามารถด้านการมองเห็นในระบบ AI ตัวอย่างบางส่วนของสิ่งที่สามารถทำได้ ได้แก่ การสร้างคำอธิบายรูปภาพ การเขียนเรื่องราวจากรูปภาพ หรือแม้แต่การสร้างเว็บไซต์จากภาพวาด
ที่เกี่ยวข้อง
- นักเขียนชั้นนำเรียกร้องเงินจากบริษัท AI เพื่อใช้งานของพวกเขา
- GPT-4: วิธีใช้แชทบอท AI ที่ทำให้ ChatGPT อับอาย
- Wix ใช้ ChatGPT เพื่อช่วยคุณสร้างเว็บไซต์ทั้งหมดได้อย่างรวดเร็ว
แม้ว่าชื่อจะสื่อถึงอะไร แต่ MiniGPT-4 ไม่ได้เชื่อมต่อกับ OpenAI หรือ GPT-4 อย่างเป็นทางการ ถูกสร้างขึ้นโดยกลุ่มปริญญาเอก นักศึกษาที่อยู่ในซาอุดีอาระเบียที่มหาวิทยาลัยวิทยาศาสตร์และเทคโนโลยี King Abdullah นอกจากนี้ยังขึ้นอยู่กับโมเดลภาษาขนาดใหญ่ (LLM) อื่นที่เรียกว่า Vicuna ซึ่งตัวมันเองถูกสร้างขึ้นบนโอเพ่นซอร์ส Large Language Model Meta AI (LLaMA) มันไม่ได้ทรงพลังเท่ากับ ChatGPT แต่ให้คะแนนตาม
วิธีการใช้งาน MiniGPT-4
MiniGPT-4 เป็นเพียงตัวอย่างและยังอยู่ในเวอร์ชันแรก สำหรับตอนนี้สามารถเข้าถึงได้ฟรี ที่เว็บไซต์อย่างเป็นทางการของกลุ่ม. หากต้องการใช้งาน เพียงลากรูปภาพเข้ามาหรือคลิก "วางรูปภาพที่นี่" เมื่ออัปโหลดแล้ว ให้พิมพ์ข้อความแจ้งของคุณลงในช่องค้นหา
คุณควรลองทำสิ่งใดบ้าง? การขอให้ MiniGPT-4 อธิบายภาพนั้นง่ายเพียงพอ แต่บางทีคุณอาจต้องการสำเนาสำหรับโพสต์ Instagram สำหรับบริษัทของคุณ หรือบางทีคุณอาจต้องการทราบส่วนผสมที่จำเป็นสำหรับอาหารจานที่น่าสนใจ และแม้กระทั่งสูตรวิธีทำอาหาร MiniGPT-4 สามารถจัดการงานเหล่านี้ได้ดีอย่างน่าประหลาดใจ
ด้านการเขียนโค้ดมีความหยาบมากขึ้นเล็กน้อยบริเวณขอบ การเปลี่ยนภาพวาดผ้าเช็ดปากธรรมดาๆ ให้เป็นเว็บไซต์ที่ใช้งานได้นั้นเป็นกลอุบายที่ OpenAI แสดงเมื่อมีการประกาศ GPT-4 เป็นครั้งแรก แต่ดูเหมือนว่า MiniGPT-4 จะยังไม่สามารถจัดการเรื่องนั้นได้ดีนัก ChatGPT จะให้โค้ดที่แม่นยำยิ่งขึ้น — อันที่จริงการรันโค้ด MiniGPT-4 ก็ตามผ่าน ChatGPT หรือ
สิ่งหนึ่งที่ควรทราบก็คือ MiniGPT-4 ใช้ GPU ของระบบในเครื่องของคุณ ดังนั้น เว้นแต่คุณจะมี GPU แยกที่ทรงพลังพอสมควร คุณอาจพบว่าประสบการณ์นั้นค่อนข้างช้า สำหรับบริบท ฉันลองใช้กับ a M2 แม็กซ์แมคบุ๊คโปรและใช้เวลาประมาณ 30 วินาทีในการสร้างข้อความตามรูปภาพที่ฉันอัปโหลด
ข้อจำกัดของ MiniGPT-4
ความเร็วของ MiniGPT-4 ถือเป็นข้อจำกัดอย่างแน่นอน หากคุณพยายามเข้าถึงสิ่งนี้โดยไม่มีกราฟิกที่ดี การตอบสนองจะช้าเกินไป หากคุณคุ้นเคยกับความเร็วของ ChatGPT บนคลาวด์หรือแม้แต่ โปรแกรมสร้างภาพ Bing, MiniGPT-4 จะรู้สึกช้าลงอย่างเจ็บปวด
นอกเหนือจากนั้น MiniGPT-4 ยังมีข้อจำกัดเหมือนกับ ChatGPT หรือ กูเกิล เบิร์ด หรือแชทบอท AI อื่น ๆ ที่สามารถ "เห็นภาพหลอน" หรือสร้างข้อมูลได้
คำแนะนำของบรรณาธิการ
- นี่คือสาเหตุที่ผู้คนคิดว่า GPT-4 อาจจะโง่ลงเมื่อเวลาผ่านไป
- ChatGPT: ข่าวสารล่าสุด ข้อโต้แย้ง และเคล็ดลับที่คุณต้องรู้
- พรอมต์ DAN สำหรับ ChatGPT คืออะไร
- Google Bard สามารถพูดได้แล้ว แต่จะทำให้ ChatGPT จมหายไปได้หรือไม่
- OpenAI ผู้ผลิต ChatGPT เผชิญกับการสอบสวน FTC เกี่ยวกับกฎหมายคุ้มครองผู้บริโภค
อัพเกรดไลฟ์สไตล์ของคุณDigital Trends ช่วยให้ผู้อ่านติดตามโลกแห่งเทคโนโลยีที่เปลี่ยนแปลงไปอย่างรวดเร็วด้วยข่าวสารล่าสุด รีวิวผลิตภัณฑ์สนุกๆ บทบรรณาธิการที่เจาะลึก และการแอบดูที่ไม่ซ้ำใคร