Alibaba Cloud ปล่อย Open Source โมเดลสร้างวีดีโอ Wan2.1 เคลมเหนือ OpenAI Sora

นอกจาก Qwen ที่ปล่อยออกมาเป็นโมเดลเปิดแล้ว Alibaba Cloud ล่าสุดได้ปล่อยโมเดล Wan2.1 สำหรับสร้างวีดีโอรุ่นล่าสุดออกมาเป็น Open Source และที่สำคัญคือเคลมเหนือกว่าโมเดล Sora ของ OpenAI อีกด้วย

Alibaba Cloud ได้ประกาศปล่อยโมเดลซีรีส์ Wan2.1 รุ่นล่าสุดภายใต้ Tongyi Wanxiang (Wan) โมเดล Foundation Model ของบริษัท ให้เป็น Open Source พร้อมกับโชว์ประสิทธิภาพในการทดสอบผ่าน VBench ที่เคลมว่าเหนือกว่า Sora จากทาง OpenAI แล้วด้วย 

โดย Wan2.1 คือโมเดลสร้างวีดีโอรุ่นแรกของ Alibaba Cloud ที่สามารถสนับสนุนการใช้ข้อความได้ทั้งภาษาจีนและภาษาอังกฤษ ซึ่งสามารถสร้างสรรค์วีดีโออกมาได้อย่างถูกต้องด้วยการเคลื่อนไหวที่ซับซ้อน พร้อมกับเพิ่มคุณภาพพิกเซล ดำเนินการตามหลักฟิสิกส์ และปรับปรุงให้การดำเนินการคำสั่งได้อย่างแม่นยำ ซึ่ง VBench ได้ให้คะแนนสูงถึง 86.22% อีกด้วย

ทาง Alibaba Cloud ได้ปล่อย Wan2.1 ออกมา 4 ขนาดด้วยกัน ได้เแก่ T2V-14B, T2V-1.3B, I2V-14B-720P, และ I2V-14B-480P ซึ่งสามารถนำไปใช้งานสร้างสรรค์ภาพหรือวีดีโอได้จากข้อความหรือภาพ โดยพร้อมให้ดาวน์โหลดได้บน Model Scope ชุมชนโมเดล AI ของ Alibaba Cloud หรือว่าบน Hugging Face หรือ GitHub

ที่มา: https://www.alizila.com/alibaba-cloud-open-sources-its-ai-models-for-video-generation/

About chatchai

Tech Writer แห่ง TechTalk Thai ที่สนใจในทุกนวัตกรรมและเทคโนโลยี

Check Also

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Sonar ผู้ให้บริการแพลตฟอร์มตรวจสอบคุณภาพและความมั่นคงปลอดภัยของโค้ด ประกาศเข้าซื้อกิจการ Gitar สตาร์ตอัปผู้เชี่ยวชาญด้านระบบ AI-native Code Review การเข้าซื้อกิจการครั้งนี้มีเป้าหมายเพื่อผสานความสามารถด้านการคิดวิเคราะห์ของ Gitar เข้ากับเอนจินตรวจสอบโค้ดของ Sonar เพื่อสร้างความมั่นคงปลอดภัยที่รัดกุมยิ่งขึ้นสำหรับทีม DevOps ในยุคที่ …

Huawei เปิดตัวสถาปัตยกรรมชิปใหม่ แก้ปัญหาคว่ำบาตรและข้อจำกัด Moore’s Law

Huawei Technologies ยักษ์ใหญ่ด้านอิเล็กทรอนิกส์จากจีนได้เปิดตัวเฟรมเวิร์กการออกแบบชิปใหม่ ซึ่งบริษัทระบุว่าจะช่วยลดช่องว่างในอุตสาหกรรมเซมิคอนดักเตอร์กับผู้นำระดับโลกอย่าง TSMC และ Nvidia ได้