Alibaba เปิดตัวโมเดล QVQ-72B สำหรับวิเคราะห์ภาพและให้เหตุผลจากภาพได้อย่างละเอียด

Alibaba Cloud ประกาศเปิดตัว QVQ-72B-Preview โมเดล AI ทดลองแบบโอเพนซอร์ส ที่สามารถวิเคราะห์และให้เหตุผลจากภาพได้อย่างละเอียด พร้อมความสามารถในการคิดวิเคราะห์แบบเป็นขั้นตอน

โมเดล QVQ-72B-Preview ถูกพัฒนาต่อยอดจาก Qwen2-VL-72B โดยเพิ่มความสามารถในการวิเคราะห์ภาพและให้เหตุผลที่ซับซ้อนมากขึ้น ผู้ใช้งานสามารถส่งภาพพร้อมคำถามให้โมเดลวิเคราะห์ จากนั้นโมเดลจะตอบกลับมาพร้อมการอธิบายแบบเป็นขั้นตอน เริ่มจากการระบุสิ่งที่เห็นในภาพ ก่อนจะวิเคราะห์และให้เหตุผลอย่างละเอียด ทีมผู้พัฒนาระบุว่าโมเดลนี้ทำคะแนนได้ดีในการทดสอบหลายด้าน โดยเฉพาะการทดสอบ MMMU ที่ได้คะแนน 70.3 ใกล้เคียงกับ Claude 3.5 Sonnet

อย่างไรก็ตาม เนื่องจากยังเป็นเวอร์ชันทดลอง โมเดลยังมีข้อจำกัดบางประการ เช่น การสลับภาษาในการตอบ และการตอบที่ยืดยาวเกินไป ทาง Alibaba ได้เผยแพร่โมเดลนี้บน GitHub และ Hugging Face ภายใต้ใบอนุญาต Qwen เพื่อให้นักพัฒนาสามารถนำไปต่อยอดได้ โดยถือเป็นก้าวสำคัญสู่การพัฒนา AGI หรือปัญญาประดิษฐ์ที่มีความสามารถเทียบเท่ามนุษย์

ที่มา: https://siliconangle.com/2024/12/26/alibaba-announces-advanced-experimental-visual-reasoning-qvq-72b-ai-model/

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่สหรัฐอเมริกา แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Sonar ผู้ให้บริการแพลตฟอร์มตรวจสอบคุณภาพและความมั่นคงปลอดภัยของโค้ด ประกาศเข้าซื้อกิจการ Gitar สตาร์ตอัปผู้เชี่ยวชาญด้านระบบ AI-native Code Review การเข้าซื้อกิจการครั้งนี้มีเป้าหมายเพื่อผสานความสามารถด้านการคิดวิเคราะห์ของ Gitar เข้ากับเอนจินตรวจสอบโค้ดของ Sonar เพื่อสร้างความมั่นคงปลอดภัยที่รัดกุมยิ่งขึ้นสำหรับทีม DevOps ในยุคที่ …

Huawei เปิดตัวสถาปัตยกรรมชิปใหม่ แก้ปัญหาคว่ำบาตรและข้อจำกัด Moore’s Law

Huawei Technologies ยักษ์ใหญ่ด้านอิเล็กทรอนิกส์จากจีนได้เปิดตัวเฟรมเวิร์กการออกแบบชิปใหม่ ซึ่งบริษัทระบุว่าจะช่วยลดช่องว่างในอุตสาหกรรมเซมิคอนดักเตอร์กับผู้นำระดับโลกอย่าง TSMC และ Nvidia ได้