Alibaba Cloud ประกาศเปิดตัว QVQ-72B-Preview โมเดล AI ทดลองแบบโอเพนซอร์ส ที่สามารถวิเคราะห์และให้เหตุผลจากภาพได้อย่างละเอียด พร้อมความสามารถในการคิดวิเคราะห์แบบเป็นขั้นตอน

โมเดล QVQ-72B-Preview ถูกพัฒนาต่อยอดจาก Qwen2-VL-72B โดยเพิ่มความสามารถในการวิเคราะห์ภาพและให้เหตุผลที่ซับซ้อนมากขึ้น ผู้ใช้งานสามารถส่งภาพพร้อมคำถามให้โมเดลวิเคราะห์ จากนั้นโมเดลจะตอบกลับมาพร้อมการอธิบายแบบเป็นขั้นตอน เริ่มจากการระบุสิ่งที่เห็นในภาพ ก่อนจะวิเคราะห์และให้เหตุผลอย่างละเอียด ทีมผู้พัฒนาระบุว่าโมเดลนี้ทำคะแนนได้ดีในการทดสอบหลายด้าน โดยเฉพาะการทดสอบ MMMU ที่ได้คะแนน 70.3 ใกล้เคียงกับ Claude 3.5 Sonnet
อย่างไรก็ตาม เนื่องจากยังเป็นเวอร์ชันทดลอง โมเดลยังมีข้อจำกัดบางประการ เช่น การสลับภาษาในการตอบ และการตอบที่ยืดยาวเกินไป ทาง Alibaba ได้เผยแพร่โมเดลนี้บน GitHub และ Hugging Face ภายใต้ใบอนุญาต Qwen เพื่อให้นักพัฒนาสามารถนำไปต่อยอดได้ โดยถือเป็นก้าวสำคัญสู่การพัฒนา AGI หรือปัญญาประดิษฐ์ที่มีความสามารถเทียบเท่ามนุษย์
TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย






