IBM Flashsystem

Midjourney เปิดตัว V1 โมเดลสร้างวิดีโอตัวใหม่ 

Midjourney ได้เปิดตัวโมเดลปัญญาประดิษฐ์ใหม่ชื่อ V1 ซึ่งสามารถสร้างวิดีโอได้ความยาวสูงสุดที่ 21 วินาที

Credit: Midjourney

Midjourney ซึ่งมีสำนักงานใหญ่อยู่ที่ซานฟรานซิสโก เปิดตัวในปี 2022 โดยมุ่งเน้นการพัฒนาเครื่องมือสร้างรูปภาพด้วย AI เป็นหลัก โดยเชื่อกันว่าอัลกอริธึมของบริษัทมีผู้ใช้งานประมาณ 21 ล้านคน ซึ่งบริษัทมีรายได้จากการให้บริการเข้าถึงโมเดลต่าง ๆ ผ่านระบบคลาวด์แบบสมัครสมาชิก

หนึ่งในฟีเจอร์ของบริการนี้คือแกลเลอรีที่ให้ผู้ใช้สามารถดูภาพที่สร้างจาก AI ได้ในที่เดียว ขณะนี้มีการเพิ่มปุ่มใหม่ใต้แต่ละภาพในแกลเลอรี ซึ่งช่วยให้ผู้ใช้สามารถแปลงภาพให้เป็นวิดีโอเคลื่อนไหวได้ด้วยโมเดล V1 โดยสำหรับค่าเริ่มต้น ระบบจะสร้างคลิปวิดีโอความยาว 5 วินาที และผู้ใช้สามารถปรับแต่งวิดีโอได้ตามต้องการ

หลังจากสร้างวิดีโอเริ่มต้นความยาว 5 วินาทีแล้ว ผู้ใช้สามารถสั่งให้ V1 ขยายความยาวเพิ่มครั้งละ 4 วินาทีได้สูงสุด 4 ครั้ง ซึ่งหมายความว่าความยาวสูงสุดของวิดีโอจะอยู่ที่ 21 วินาที ในขณะที่ปัจจุบัน Veo 3 ของ Google และ Sora ของ OpenAI สามารถสร้างวิดีโอได้ยาวสูงสุด 20 วินาที

ผู้ใช้สามารถให้ V1 สร้างแอนิเมชันจากภาพโดยอัตโนมัติ หรือเลือกใส่คำสั่ง (prompt) เพื่อปรับแต่งขั้นตอนการทำงานได้ หากเลือกปรับแต่ง ผู้ใช้จะสามารถตั้งค่าเพิ่มเติมได้อีกสองแบบ โดยตามข้อมูลจาก Midjourney ผู้ใช้สามารถกำหนดให้วิดีโอสอดคล้องกับคำสั่งที่ระบุไว้มากที่สุด หรือเลือกใช้โหมด “creative flair” ซึ่งเพิ่มองค์ประกอบใหม่ ๆ เข้าไปในวิดีโอ

รูปแบบการเคลื่อนไหวของวิดีโอก็สามารถปรับได้เช่นกัน “การเคลื่อนไหวน้อยเหมาะสำหรับฉากที่กล้องอยู่นิ่งเป็นหลัก และวัตถุเคลื่อนไหวอย่างช้า ๆ หรือเป็นจังหวะที่ตั้งใจ” David Holz ประธานเจ้าหน้าที่บริหารของ Midjourney เขียนในบล็อกโพสต์ “การเคลื่อนไหวสูงเหมาะสำหรับฉากที่ต้องการให้ทุกอย่างเคลื่อนไหว ทั้งตัวแบบและกล้อง”

V1 เปิดตัวหลังจากที่ Midjourney เปิดตัวโมเดลสร้างภาพ AI รุ่นล่าสุดเมื่อสองเดือนก่อน โดยโมเดลดังกล่าวชื่อ V7 มีความเร็วมากกว่ารุ่นก่อนหน้าอย่างมาก และสามารถสร้างภาพได้คุณภาพที่สูงกว่า

เครื่องมือสร้างภาพและวิดีโอด้วย AI มักอิงจากเทคนิคแมชชีนเลิร์นนิงที่เรียกว่า diffusion ซึ่งนักพัฒนาจะรวบรวมชุดภาพจำนวนมาก ใส่สัญญาณรบกวน (noise) ลงไปในแต่ละไฟล์ แล้วให้โมเดล AI พยายามสร้างภาพต้นฉบับขึ้นมาใหม่ การทำเช่นนี้ซ้ำ ๆ จะทำให้โมเดลเรียนรู้วิธีการสร้างภาพใหม่ตั้งแต่ต้นได้

โมเดลสร้างวิดีโอด้วย AI มีฟีเจอร์เพิ่มเติมที่ไม่มีในโมเดลสร้างภาพ เช่น โมดูลเชิงเวลาที่ช่วยรักษาความต่อเนื่องของวัตถุในแต่ละเฟรม และความสามารถในการเรียงลำดับเฟรมให้แสดงอย่างถูกต้อง

ข้อมูลจาก Midjourney ระบุว่าโมเดล V1 เป็นส่วนหนึ่งของแผนพัฒนาในระยะยาวที่มุ่งเน้นการฝึกโมเดล AI ให้สามารถสร้างการจำลอง 3 มิติแบบโต้ตอบได้ “เพื่อทำสิ่งนี้ เราต้องมีส่วนประกอบพื้นฐาน” Holz เขียน “เราต้องมีภาพ (จากโมเดลสร้างภาพของเรา) ต้องทำให้ภาพเหล่านั้นเคลื่อนไหวได้ (โมเดลวิดีโอ) ต้องสามารถเคลื่อนที่ในพื้นที่สามมิติ (โมเดล 3D) และต้องทำทุกอย่างได้อย่างรวดเร็ว (โมเดลแบบเรียลไทม์)”

ที่มา: https://siliconangle.com/2025/06/18/midjourney-debuts-new-v1-video-generation-model/

About นักเขียนฝึกหัดหมายเลขเก้า

Check Also

AWS เตรียมเปิดตลาดเอเจนต์ AI ร่วมกับ Anthropic ในสัปดาห์หน้า

มีรายงานว่า Amazon Web Services เตรียมเดินตามรอย Microsoft และ Google Cloud ด้วยการเปิดตัวตลาดเฉพาะสำหรับเอเจนต์ปัญญาประดิษฐ์ และนักพัฒนา AI รายโปรดอย่าง Anthropic ก็จะเป็นหนึ่งในพันธมิตรร่วมเปิดตัวด้วย

Docker อัปเดต Compose รองรับ Agentic Apps พร้อม เปิดตัว Docker Offload

Docker ประกาศความสามารถใหม่ที่ช่วยให้นักพัฒนาสร้างและรันแอปพลิเคชัน AI Agent ได้ง่ายเทียบเท่ากับการพัฒนา Microservices ผ่านการขยายความสามารถของ Docker Compose พร้อมเปิดตัว Docker Offload สำหรับรันงาน GPU บน …