
นอกจาก Qwen ที่ปล่อยออกมาเป็นโมเดลเปิดแล้ว Alibaba Cloud ล่าสุดได้ปล่อยโมเดล Wan2.1 สำหรับสร้างวีดีโอรุ่นล่าสุดออกมาเป็น Open Source และที่สำคัญคือเคลมเหนือกว่าโมเดล Sora ของ OpenAI อีกด้วย
Alibaba Cloud ได้ประกาศปล่อยโมเดลซีรีส์ Wan2.1 รุ่นล่าสุดภายใต้ Tongyi Wanxiang (Wan) โมเดล Foundation Model ของบริษัท ให้เป็น Open Source พร้อมกับโชว์ประสิทธิภาพในการทดสอบผ่าน VBench ที่เคลมว่าเหนือกว่า Sora จากทาง OpenAI แล้วด้วย

โดย Wan2.1 คือโมเดลสร้างวีดีโอรุ่นแรกของ Alibaba Cloud ที่สามารถสนับสนุนการใช้ข้อความได้ทั้งภาษาจีนและภาษาอังกฤษ ซึ่งสามารถสร้างสรรค์วีดีโออกมาได้อย่างถูกต้องด้วยการเคลื่อนไหวที่ซับซ้อน พร้อมกับเพิ่มคุณภาพพิกเซล ดำเนินการตามหลักฟิสิกส์ และปรับปรุงให้การดำเนินการคำสั่งได้อย่างแม่นยำ ซึ่ง VBench ได้ให้คะแนนสูงถึง 86.22% อีกด้วย
ทาง Alibaba Cloud ได้ปล่อย Wan2.1 ออกมา 4 ขนาดด้วยกัน ได้เแก่ T2V-14B, T2V-1.3B, I2V-14B-720P, และ I2V-14B-480P ซึ่งสามารถนำไปใช้งานสร้างสรรค์ภาพหรือวีดีโอได้จากข้อความหรือภาพ โดยพร้อมให้ดาวน์โหลดได้บน Model Scope ชุมชนโมเดล AI ของ Alibaba Cloud หรือว่าบน Hugging Face หรือ GitHub
ที่มา: https://www.alizila.com/alibaba-cloud-open-sources-its-ai-models-for-video-generation/