Alibaba Cloud เปิดตัว “Qwen2-VL” วิเคราะห์วีดีโอได้มากกว่า 20 นาที

Alibaba Cloud ยักษ์ใหญ่ผู้ให้บริการ Cloud สัญชาติจีน ล่าสุดได้ประกาศเปิดตัว Qwen2-VL โมเดลภาพและภาษาล่าสุดที่มีการปรับปรุงเรื่องความเข้าใจในภาพและวีดีโอ ที่สามารถประมวลผลภาพและข้อความได้ในหลากหลายภาษา ที่สำคัญคือสามารถวิเคราะห์วีดีโอได้ยาวมากกว่า 20 นาทีด้วย

โดย Alibaba Cloud ได้เปิดตัว Qwen2-VL โมเดล Qwen เวอร์ชันล่าสุดที่จะมาแข่งขันกับฝั่งตะวันตก ไม่ว่าจะเป็น Llama 3.1 ของ Meta, GPT-4o ของ OpenAI หรือ Claude 3 Haiku ของ Anthropic ซึ่ง Alibaba Cloud เผยว่าประสิทธิภาพจากการ Benchmark นั้นไม่แพ้กับโมเดลชั้นนำเหล่านั้นเลย

แน่นอนว่า Qwen2-VL นั้นสามารถสรุปเนื้อหาในวีดีโอได้ พร้อมกับสามารถตอบคำถาที่เกี่ยวข้อง และสามารถสนทนาได้อย่างต่อเนื่อง ซึ่งสามารถนำไปต่อยอดทำแชทบอทได้อย่างแน่นอน ซึ่งจุดที่น่าสนใจคือ Qwen2-VL นี้สามารถเข้าใจและวิเคราะห์วีดีโอได้นานมากกว่า 20 นาที ที่จะสามารถสรุปและตอบคำถามได้

สำหรับผู้ที่สนใจ Qwen2-VL ทาง Alibaba Cloud มีให้ใช้งาน 3 ขนาด คือ 72b, 7b และ 2b โดยสามารถเข้าไปทดลองและดูรายละเอียดเพิ่มเติมได้ที่ Hugging Face 

ที่มา: https://venturebeat.com/ai/alibaba-releases-new-ai-model-qwen2-vl-that-can-analyze-videos-more-than-20-minutes-long/

About chatchai

Tech Writer แห่ง TechTalk Thai ที่สนใจในทุกนวัตกรรมและเทคโนโลยี

Check Also

เลือก Cloud Infrastructure ที่เหมาะกับการใช้งาน AI ระดับองค์กร [PR]

เมื่อองค์กรเริ่มนำ AI เข้ามาเป็นส่วนสำคัญในการขับเคลื่อนธุรกิจ ความพร้อมของโครงสร้างพื้นฐานจึงกลายเป็นอีกหนึ่งปัจจัยที่ไม่อาจมองข้าม จากรายงานของ McKinsey & Company (2025) ระบุว่า สัดส่วนองค์กรที่นำ AI มาใช้ในการทำงานเพิ่มขึ้นเป็น 88 เปอร์เซ็นต์ …

HPE อัดยาแรง! แจกฟรี VM Essentials 1 ปี พร้อม Zerto 1 ดอลลาร์ ดึงลูกค้า VMware

HPE ใช้จังหวะที่ VMware ปรับขึ้นค่าไลเซนส์ นำเสนอสิทธิพิเศษให้ลูกค้าใช้งานระบบ VM Essentials ฟรี 1 ปีเต็ม พร้อมสิทธิ์ใช้งานซอฟต์แวร์ปกป้องข้อมูล Zerto ในราคาเพียง 1 ดอลลาร์ …