Alibaba เปิดตัวโมเดล QVQ-72B สำหรับวิเคราะห์ภาพและให้เหตุผลจากภาพได้อย่างละเอียด

Alibaba Cloud ประกาศเปิดตัว QVQ-72B-Preview โมเดล AI ทดลองแบบโอเพนซอร์ส ที่สามารถวิเคราะห์และให้เหตุผลจากภาพได้อย่างละเอียด พร้อมความสามารถในการคิดวิเคราะห์แบบเป็นขั้นตอน

โมเดล QVQ-72B-Preview ถูกพัฒนาต่อยอดจาก Qwen2-VL-72B โดยเพิ่มความสามารถในการวิเคราะห์ภาพและให้เหตุผลที่ซับซ้อนมากขึ้น ผู้ใช้งานสามารถส่งภาพพร้อมคำถามให้โมเดลวิเคราะห์ จากนั้นโมเดลจะตอบกลับมาพร้อมการอธิบายแบบเป็นขั้นตอน เริ่มจากการระบุสิ่งที่เห็นในภาพ ก่อนจะวิเคราะห์และให้เหตุผลอย่างละเอียด ทีมผู้พัฒนาระบุว่าโมเดลนี้ทำคะแนนได้ดีในการทดสอบหลายด้าน โดยเฉพาะการทดสอบ MMMU ที่ได้คะแนน 70.3 ใกล้เคียงกับ Claude 3.5 Sonnet

อย่างไรก็ตาม เนื่องจากยังเป็นเวอร์ชันทดลอง โมเดลยังมีข้อจำกัดบางประการ เช่น การสลับภาษาในการตอบ และการตอบที่ยืดยาวเกินไป ทาง Alibaba ได้เผยแพร่โมเดลนี้บน GitHub และ Hugging Face ภายใต้ใบอนุญาต Qwen เพื่อให้นักพัฒนาสามารถนำไปต่อยอดได้ โดยถือเป็นก้าวสำคัญสู่การพัฒนา AGI หรือปัญญาประดิษฐ์ที่มีความสามารถเทียบเท่ามนุษย์

ที่มา: https://siliconangle.com/2024/12/26/alibaba-announces-advanced-experimental-visual-reasoning-qvq-72b-ai-model/

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่ Cupertino, CA แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

Nutanix ประกาศพร้อมให้บริการ NCM Self-Service เวอร์ชัน 4.0

ช่วงกลางเดือนที่แล้ว Nutanix ผู้นำด้านโซลูชัน Hyper-Converged Infrastructure ได้ประกาศเปิดตัว Nutanix Cloud Manager (NCM) Self-Service เวอร์ชัน 4.0 เป็นที่เรียบร้อย ที่พร้อมสนับสนุนการทำ …

Seagate เข้าซื้อกิจการ Intevac เสริมแกร่งเทคโนโลยีการผลิตดิสก์

Seagate ได้ประกาศความตั้งใจในการเข้าซื้อ Intevac ผู้ผลิตอุปกรณ์ฮาร์ดไดร์ฟด้วยเงินสดราว 119 ล้านเหรียญสหรัฐฯ