Google เปิดตัวโมเดลสร้างเสียงดนตรี Lyria 3

Google เปิดตัวโมเดลปัญญาประดิษฐ์ชื่อ Lyria 3 ที่ผู้บริโภคสามารถใช้สร้างแทร็กเพลงขนาดสั้นได้แล้ว

Credit: Google

อัลกอริทึมดังกล่าวเริ่มทยอยเปิดให้ใช้งานในแอป Gemini ของบริษัท และ Dream Track ฟีเจอร์สร้างเสียงดนตรีในชุดเครื่องมือครีเอเตอร์ของ YouTube ไฟล์ที่สร้างด้วย Lyria 3 จะมีลายน้ำที่ไม่สามารถสังเกตได้ด้วยหูเปล่า ซึ่งสร้างขึ้นด้วยเทคโนโลยีของ Google ที่ชื่อว่า SynthID ผู้ใช้สามารถตรวจสอบได้ว่าแทร็กมีลายน้ำดังกล่าวหรือไม่ โดยอัปโหลดไฟล์ไปยังแอป Gemini

Lyria 3 สามารถสร้างแทร็กความยาว 30 วินาทีจากพรอมต์ภาษาธรรมชาติ ผู้ใช้สามารถระบุรายละเอียด เช่น แนวดนตรีที่ต้องการสร้าง จังหวะ และภาษาของเนื้อเพลงได้ นอกจากนี้ยังสามารถอัปโหลดภาพหรือวิดีโอ เพื่อให้ Lyria 3 สร้างทำนองที่สอดคล้องกันโดยอัตโนมัติ

โมเดลใหม่นี้มีการปรับปรุงหลายด้านจากอัลกอริทึม Lyria 2 รุ่นก่อนหน้าของ Google ที่เปิดตัวเมื่อเดือนพฤษภาคมปีที่แล้ว ผู้ใช้ไม่จำเป็นต้องเตรียมเนื้อเพลงเองอีกต่อไป เพราะระบบจะสร้างให้อัตโนมัติ อีกทั้ง Google ยังยกระดับคุณภาพและความซับซ้อนของดนตรีที่สร้างขึ้น

วิธีที่โมเดล AI สร้างเสียงดนตรีขึ้นมานั้นขึ้นอยู่กับสถาปัตยกรรมของแต่ละระบบ บางอัลกอริทึมไม่ได้สร้างเสียงโดยตรงจากพรอมต์ แต่จะสร้างตัวแทนข้อมูลขั้นกลางที่เรียกว่าสเปกโตรแกรมก่อน ซึ่งเป็นการแสดงภาพข้อมูลที่แทนโทนเสียงด้วยเส้นต่าง ๆ ขณะที่โมเดลอื่น เช่น อัลกอริทึม MusicML แบบโอเพนซอร์สของ Google จะแทนดนตรีเป็นหน่วยข้อมูลบีบอัดที่เรียกว่าโทเคนออดิโอ

แอป Gemini ยังช่วยให้ผู้ใช้สร้างภาพปกสำหรับแต่ละแทร็กที่สร้างขึ้นได้ ฟีเจอร์นี้ขับเคลื่อนด้วย Nano Banana เครื่องมือสร้างภาพด้วย AI ที่ Google เปิดตัวเมื่อปีที่แล้ว ซึ่งนอกจากจะใช้งานผ่าน Gemini ได้แล้ว ยังมี API ให้นักพัฒนานำไปผสานเข้ากับซอฟต์แวร์ของตนเองด้วย ทั้งนี้ มีความเป็นไปได้ว่า Lyria 3 จะเปิดให้เข้าถึงผ่าน API ในอนาคตเช่นกัน

ในระหว่างนี้ โมเดลดังกล่าวเปิดให้ใช้งานสำหรับผู้ใช้ Gemini เวอร์ชันมือถือที่เป็นผู้ใหญ่ โดย Google มีแผนจะนำ Lyria 3 ไปยังเวอร์ชันเดสก์ท็อปในอีกไม่กี่วันข้างหน้า ลูกค้าที่สมัครแพ็กเกจ Google AI Plus, Pro และ Ultra จะมีขีดจำกัดการใช้งานที่สูงกว่า

การเปิดตัวครั้งนี้อาจเพิ่มการแข่งขันให้กับสตาร์ทอัพด้านดนตรี AI อย่าง Suno ซึ่งระดมทุนได้ 250 ล้านดอลลาร์ในเดือนพฤศจิกายน บริษัทให้บริการแบบฟรีเมียมที่ช่วยให้สามารถสร้างเสียงจากพรอมต์ภาษาธรรมชาติได้ โดยแพ็กเกจแบบชำระเงินจะมีฟีเจอร์เพิ่มเติม เช่น เวิร์กสเตชันเสียงเสมือนที่ช่วยให้ผู้ใช้ปรับแต่งแทร็กที่ AI สร้างขึ้นได้ด้วยตนเอง

ในอนาคต Google อาจพัฒนาฟีเจอร์ด้านดนตรีของ Gemini เพิ่มเติมได้หลายทาง เช่น ขยายข้อจำกัดความยาวแทร็ก 30 วินาที และเพิ่มความสามารถในการแก้ไขคล้ายกับที่ Suno มีให้บริการ บริษัทยังอาจผสาน Lyria 3 เข้ากับบริการผู้บริโภคอื่น ๆ มากขึ้น เช่น นำเสียงที่สร้างด้วย AI ไปใช้ในโลกเสมือนที่ผู้ใช้สร้างผ่าน Project Genie

ที่มา: https://siliconangle.com/2026/02/18/google-launches-lyria-3-music-generation-model/

About นักเขียนฝึกหัดหมายเลขเก้า

Check Also

Salesforce เข้าซื้อกิจการ Fin มูลค่าราว 3,600 ล้านดอลลาร์ เสริมแกร่ง AI Agent งานบริการลูกค้า

Salesforce ประกาศลงนามข้อตกลงขั้นสุดท้ายเข้าซื้อกิจการ Fin ผู้ให้บริการแพลตฟอร์ม customer agent ในมูลค่าราว 3,600 ล้านดอลลาร์สหรัฐ เพื่อนำเทคโนโลยี AI Agent สำหรับงานบริการลูกค้ามาเสริมความสามารถให้กับ Agentforce

Cisco ออกแพตช์แก้ช่องโหว่ Zero-day บน Catalyst SD-WAN Manager ที่ถูกใช้โจมตียกระดับสิทธิ์เป็น root

Cisco ปล่อยอัปเดตด้านความปลอดภัยแก้ช่องโหว่บน Catalyst SD-WAN Manager (เดิมคือ SD-WAN vManage) หลังพบว่าถูกใช้โจมตีจริงในลักษณะ Zero-day เพื่อยกระดับสิทธิ์เป็น root บนระบบที่ได้รับผลกระทบ