Midjourney ได้เปิดตัวโมเดลปัญญาประดิษฐ์ใหม่ชื่อ V1 ซึ่งสามารถสร้างวิดีโอได้ความยาวสูงสุดที่ 21 วินาที

Midjourney ซึ่งมีสำนักงานใหญ่อยู่ที่ซานฟรานซิสโก เปิดตัวในปี 2022 โดยมุ่งเน้นการพัฒนาเครื่องมือสร้างรูปภาพด้วย AI เป็นหลัก โดยเชื่อกันว่าอัลกอริธึมของบริษัทมีผู้ใช้งานประมาณ 21 ล้านคน ซึ่งบริษัทมีรายได้จากการให้บริการเข้าถึงโมเดลต่าง ๆ ผ่านระบบคลาวด์แบบสมัครสมาชิก
หนึ่งในฟีเจอร์ของบริการนี้คือแกลเลอรีที่ให้ผู้ใช้สามารถดูภาพที่สร้างจาก AI ได้ในที่เดียว ขณะนี้มีการเพิ่มปุ่มใหม่ใต้แต่ละภาพในแกลเลอรี ซึ่งช่วยให้ผู้ใช้สามารถแปลงภาพให้เป็นวิดีโอเคลื่อนไหวได้ด้วยโมเดล V1 โดยสำหรับค่าเริ่มต้น ระบบจะสร้างคลิปวิดีโอความยาว 5 วินาที และผู้ใช้สามารถปรับแต่งวิดีโอได้ตามต้องการ
หลังจากสร้างวิดีโอเริ่มต้นความยาว 5 วินาทีแล้ว ผู้ใช้สามารถสั่งให้ V1 ขยายความยาวเพิ่มครั้งละ 4 วินาทีได้สูงสุด 4 ครั้ง ซึ่งหมายความว่าความยาวสูงสุดของวิดีโอจะอยู่ที่ 21 วินาที ในขณะที่ปัจจุบัน Veo 3 ของ Google และ Sora ของ OpenAI สามารถสร้างวิดีโอได้ยาวสูงสุด 20 วินาที
ผู้ใช้สามารถให้ V1 สร้างแอนิเมชันจากภาพโดยอัตโนมัติ หรือเลือกใส่คำสั่ง (prompt) เพื่อปรับแต่งขั้นตอนการทำงานได้ หากเลือกปรับแต่ง ผู้ใช้จะสามารถตั้งค่าเพิ่มเติมได้อีกสองแบบ โดยตามข้อมูลจาก Midjourney ผู้ใช้สามารถกำหนดให้วิดีโอสอดคล้องกับคำสั่งที่ระบุไว้มากที่สุด หรือเลือกใช้โหมด “creative flair” ซึ่งเพิ่มองค์ประกอบใหม่ ๆ เข้าไปในวิดีโอ
รูปแบบการเคลื่อนไหวของวิดีโอก็สามารถปรับได้เช่นกัน “การเคลื่อนไหวน้อยเหมาะสำหรับฉากที่กล้องอยู่นิ่งเป็นหลัก และวัตถุเคลื่อนไหวอย่างช้า ๆ หรือเป็นจังหวะที่ตั้งใจ” David Holz ประธานเจ้าหน้าที่บริหารของ Midjourney เขียนในบล็อกโพสต์ “การเคลื่อนไหวสูงเหมาะสำหรับฉากที่ต้องการให้ทุกอย่างเคลื่อนไหว ทั้งตัวแบบและกล้อง”
V1 เปิดตัวหลังจากที่ Midjourney เปิดตัวโมเดลสร้างภาพ AI รุ่นล่าสุดเมื่อสองเดือนก่อน โดยโมเดลดังกล่าวชื่อ V7 มีความเร็วมากกว่ารุ่นก่อนหน้าอย่างมาก และสามารถสร้างภาพได้คุณภาพที่สูงกว่า
เครื่องมือสร้างภาพและวิดีโอด้วย AI มักอิงจากเทคนิคแมชชีนเลิร์นนิงที่เรียกว่า diffusion ซึ่งนักพัฒนาจะรวบรวมชุดภาพจำนวนมาก ใส่สัญญาณรบกวน (noise) ลงไปในแต่ละไฟล์ แล้วให้โมเดล AI พยายามสร้างภาพต้นฉบับขึ้นมาใหม่ การทำเช่นนี้ซ้ำ ๆ จะทำให้โมเดลเรียนรู้วิธีการสร้างภาพใหม่ตั้งแต่ต้นได้
โมเดลสร้างวิดีโอด้วย AI มีฟีเจอร์เพิ่มเติมที่ไม่มีในโมเดลสร้างภาพ เช่น โมดูลเชิงเวลาที่ช่วยรักษาความต่อเนื่องของวัตถุในแต่ละเฟรม และความสามารถในการเรียงลำดับเฟรมให้แสดงอย่างถูกต้อง
ข้อมูลจาก Midjourney ระบุว่าโมเดล V1 เป็นส่วนหนึ่งของแผนพัฒนาในระยะยาวที่มุ่งเน้นการฝึกโมเดล AI ให้สามารถสร้างการจำลอง 3 มิติแบบโต้ตอบได้ “เพื่อทำสิ่งนี้ เราต้องมีส่วนประกอบพื้นฐาน” Holz เขียน “เราต้องมีภาพ (จากโมเดลสร้างภาพของเรา) ต้องทำให้ภาพเหล่านั้นเคลื่อนไหวได้ (โมเดลวิดีโอ) ต้องสามารถเคลื่อนที่ในพื้นที่สามมิติ (โมเดล 3D) และต้องทำทุกอย่างได้อย่างรวดเร็ว (โมเดลแบบเรียลไทม์)”
ที่มา: https://siliconangle.com/2025/06/18/midjourney-debuts-new-v1-video-generation-model/