Alibaba Cloud เปิดตัว “Qwen2-VL” วิเคราะห์วีดีโอได้มากกว่า 20 นาที

Alibaba Cloud ยักษ์ใหญ่ผู้ให้บริการ Cloud สัญชาติจีน ล่าสุดได้ประกาศเปิดตัว Qwen2-VL โมเดลภาพและภาษาล่าสุดที่มีการปรับปรุงเรื่องความเข้าใจในภาพและวีดีโอ ที่สามารถประมวลผลภาพและข้อความได้ในหลากหลายภาษา ที่สำคัญคือสามารถวิเคราะห์วีดีโอได้ยาวมากกว่า 20 นาทีด้วย

โดย Alibaba Cloud ได้เปิดตัว Qwen2-VL โมเดล Qwen เวอร์ชันล่าสุดที่จะมาแข่งขันกับฝั่งตะวันตก ไม่ว่าจะเป็น Llama 3.1 ของ Meta, GPT-4o ของ OpenAI หรือ Claude 3 Haiku ของ Anthropic ซึ่ง Alibaba Cloud เผยว่าประสิทธิภาพจากการ Benchmark นั้นไม่แพ้กับโมเดลชั้นนำเหล่านั้นเลย

แน่นอนว่า Qwen2-VL นั้นสามารถสรุปเนื้อหาในวีดีโอได้ พร้อมกับสามารถตอบคำถาที่เกี่ยวข้อง และสามารถสนทนาได้อย่างต่อเนื่อง ซึ่งสามารถนำไปต่อยอดทำแชทบอทได้อย่างแน่นอน ซึ่งจุดที่น่าสนใจคือ Qwen2-VL นี้สามารถเข้าใจและวิเคราะห์วีดีโอได้นานมากกว่า 20 นาที ที่จะสามารถสรุปและตอบคำถามได้

สำหรับผู้ที่สนใจ Qwen2-VL ทาง Alibaba Cloud มีให้ใช้งาน 3 ขนาด คือ 72b, 7b และ 2b โดยสามารถเข้าไปทดลองและดูรายละเอียดเพิ่มเติมได้ที่ Hugging Face 

ที่มา: https://venturebeat.com/ai/alibaba-releases-new-ai-model-qwen2-vl-that-can-analyze-videos-more-than-20-minutes-long/

About chatchai

Tech Writer แห่ง TechTalk Thai ที่สนใจในทุกนวัตกรรมและเทคโนโลยี

Check Also

รู้จัก GhostGPT แชทบอทของเหล่าร้าย ผู้ช่วยชั้นดีของแฮ็กเกอร์

โดยทั่วไปผู้คนมักคุ้นกับ ChatGPT เป็นอย่างดีแล้ว แต่อีกด้านหนึ่งเรามักได้ยินเรื่องที่ว่าแฮ็กเกอร์เองก็มี AI เพื่อช่วยในการโจมตีได้ แม้ตัว ChatGPT หรือ Generative AI ภาคปกติจะมีการป้องกันแค่ไหนก็ตามสุดท้ายแล้วในโลกที่เปิดกว้าง คนที่คิดร้ายก็มักจะหาทางได้เสมอ และ GhostGPT …

SAP ร่วมกับ Microsoft กระตุ้นลูกค้าเข้าสู่โครงการ RISE with SAP ผ่าน Azure

RISE with SAP เป็นแคมเปญส่งเสริมกระตุ้นให้ผู้ใช้งานเดินทางสู่ ERP บนเวอร์ชันคลาวด์ที่มีประสิทธิภาพสูงกว่า โดยประกาศล่าสุดแสดงให้เห็นถึงความร่วมมือที่ Microsoft และ SAP มีร่วมกันเพื่อสนับสนุนลูกค้าที่สนใจใช้โครงสร้างพื้นฐานของ Microsoft Azure