Alibaba Cloud ประกาศเปิดตัว QVQ-72B-Preview โมเดล AI ทดลองแบบโอเพนซอร์ส ที่สามารถวิเคราะห์และให้เหตุผลจากภาพได้อย่างละเอียด พร้อมความสามารถในการคิดวิเคราะห์แบบเป็นขั้นตอน
โมเดล QVQ-72B-Preview ถูกพัฒนาต่อยอดจาก Qwen2-VL-72B โดยเพิ่มความสามารถในการวิเคราะห์ภาพและให้เหตุผลที่ซับซ้อนมากขึ้น ผู้ใช้งานสามารถส่งภาพพร้อมคำถามให้โมเดลวิเคราะห์ จากนั้นโมเดลจะตอบกลับมาพร้อมการอธิบายแบบเป็นขั้นตอน เริ่มจากการระบุสิ่งที่เห็นในภาพ ก่อนจะวิเคราะห์และให้เหตุผลอย่างละเอียด ทีมผู้พัฒนาระบุว่าโมเดลนี้ทำคะแนนได้ดีในการทดสอบหลายด้าน โดยเฉพาะการทดสอบ MMMU ที่ได้คะแนน 70.3 ใกล้เคียงกับ Claude 3.5 Sonnet
อย่างไรก็ตาม เนื่องจากยังเป็นเวอร์ชันทดลอง โมเดลยังมีข้อจำกัดบางประการ เช่น การสลับภาษาในการตอบ และการตอบที่ยืดยาวเกินไป ทาง Alibaba ได้เผยแพร่โมเดลนี้บน GitHub และ Hugging Face ภายใต้ใบอนุญาต Qwen เพื่อให้นักพัฒนาสามารถนำไปต่อยอดได้ โดยถือเป็นก้าวสำคัญสู่การพัฒนา AGI หรือปัญญาประดิษฐ์ที่มีความสามารถเทียบเท่ามนุษย์