Alibaba เปิดตัวโมเดล QVQ-72B สำหรับวิเคราะห์ภาพและให้เหตุผลจากภาพได้อย่างละเอียด

Alibaba Cloud ประกาศเปิดตัว QVQ-72B-Preview โมเดล AI ทดลองแบบโอเพนซอร์ส ที่สามารถวิเคราะห์และให้เหตุผลจากภาพได้อย่างละเอียด พร้อมความสามารถในการคิดวิเคราะห์แบบเป็นขั้นตอน

โมเดล QVQ-72B-Preview ถูกพัฒนาต่อยอดจาก Qwen2-VL-72B โดยเพิ่มความสามารถในการวิเคราะห์ภาพและให้เหตุผลที่ซับซ้อนมากขึ้น ผู้ใช้งานสามารถส่งภาพพร้อมคำถามให้โมเดลวิเคราะห์ จากนั้นโมเดลจะตอบกลับมาพร้อมการอธิบายแบบเป็นขั้นตอน เริ่มจากการระบุสิ่งที่เห็นในภาพ ก่อนจะวิเคราะห์และให้เหตุผลอย่างละเอียด ทีมผู้พัฒนาระบุว่าโมเดลนี้ทำคะแนนได้ดีในการทดสอบหลายด้าน โดยเฉพาะการทดสอบ MMMU ที่ได้คะแนน 70.3 ใกล้เคียงกับ Claude 3.5 Sonnet

อย่างไรก็ตาม เนื่องจากยังเป็นเวอร์ชันทดลอง โมเดลยังมีข้อจำกัดบางประการ เช่น การสลับภาษาในการตอบ และการตอบที่ยืดยาวเกินไป ทาง Alibaba ได้เผยแพร่โมเดลนี้บน GitHub และ Hugging Face ภายใต้ใบอนุญาต Qwen เพื่อให้นักพัฒนาสามารถนำไปต่อยอดได้ โดยถือเป็นก้าวสำคัญสู่การพัฒนา AGI หรือปัญญาประดิษฐ์ที่มีความสามารถเทียบเท่ามนุษย์

ที่มา: https://siliconangle.com/2024/12/26/alibaba-announces-advanced-experimental-visual-reasoning-qvq-72b-ai-model/

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่สหรัฐอเมริกา แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

Elastic 9.4 ออกแล้ว

Elastic ได้ออกมาประกาศเปิดตัว Elastic 9.4 อย่างเป็นทางการ โดยเพิ่มความสามารถในการตรวจสอบการทำงานของ Context Engineering, Application และ Infrastructure เพิ่มเติม, เสริม AI ในการรักษาความมั่นคงปลอดภัย และเพิ่มความสามารถอื่นๆ อีกมากมาย ดังนี้

Extreme Networks เปิดตัว Wi-Fi 7 AP รุ่นใหม่ พร้อม Agentic AI สำหรับบริหารจัดการระบบเครือข่ายแบบอัตโนมัติ

Extreme Networks ได้ออกมาประกาศถึงอัปเดตครั้งใหญ่ โดยเปิดตัว Wi-Fi 7 Access Point รุ่นใหม่ล่าสุด 5 รุ่น พร้อมนวัตกรรมใหม่ในการบริหารจัดการระบบเครือข่ายด้วย AI Agent เพื่อดูแลรักษาระบบเครือข่ายขององค์กรให้ทำงานได้อย่างต่อเนื่องโดยอัตโนมัติ