Google เปิดตัวโมเดลปัญญาประดิษฐ์ชื่อ Lyria 3 ที่ผู้บริโภคสามารถใช้สร้างแทร็กเพลงขนาดสั้นได้แล้ว

อัลกอริทึมดังกล่าวเริ่มทยอยเปิดให้ใช้งานในแอป Gemini ของบริษัท และ Dream Track ฟีเจอร์สร้างเสียงดนตรีในชุดเครื่องมือครีเอเตอร์ของ YouTube ไฟล์ที่สร้างด้วย Lyria 3 จะมีลายน้ำที่ไม่สามารถสังเกตได้ด้วยหูเปล่า ซึ่งสร้างขึ้นด้วยเทคโนโลยีของ Google ที่ชื่อว่า SynthID ผู้ใช้สามารถตรวจสอบได้ว่าแทร็กมีลายน้ำดังกล่าวหรือไม่ โดยอัปโหลดไฟล์ไปยังแอป Gemini
Lyria 3 สามารถสร้างแทร็กความยาว 30 วินาทีจากพรอมต์ภาษาธรรมชาติ ผู้ใช้สามารถระบุรายละเอียด เช่น แนวดนตรีที่ต้องการสร้าง จังหวะ และภาษาของเนื้อเพลงได้ นอกจากนี้ยังสามารถอัปโหลดภาพหรือวิดีโอ เพื่อให้ Lyria 3 สร้างทำนองที่สอดคล้องกันโดยอัตโนมัติ
โมเดลใหม่นี้มีการปรับปรุงหลายด้านจากอัลกอริทึม Lyria 2 รุ่นก่อนหน้าของ Google ที่เปิดตัวเมื่อเดือนพฤษภาคมปีที่แล้ว ผู้ใช้ไม่จำเป็นต้องเตรียมเนื้อเพลงเองอีกต่อไป เพราะระบบจะสร้างให้อัตโนมัติ อีกทั้ง Google ยังยกระดับคุณภาพและความซับซ้อนของดนตรีที่สร้างขึ้น
วิธีที่โมเดล AI สร้างเสียงดนตรีขึ้นมานั้นขึ้นอยู่กับสถาปัตยกรรมของแต่ละระบบ บางอัลกอริทึมไม่ได้สร้างเสียงโดยตรงจากพรอมต์ แต่จะสร้างตัวแทนข้อมูลขั้นกลางที่เรียกว่าสเปกโตรแกรมก่อน ซึ่งเป็นการแสดงภาพข้อมูลที่แทนโทนเสียงด้วยเส้นต่าง ๆ ขณะที่โมเดลอื่น เช่น อัลกอริทึม MusicML แบบโอเพนซอร์สของ Google จะแทนดนตรีเป็นหน่วยข้อมูลบีบอัดที่เรียกว่าโทเคนออดิโอ
แอป Gemini ยังช่วยให้ผู้ใช้สร้างภาพปกสำหรับแต่ละแทร็กที่สร้างขึ้นได้ ฟีเจอร์นี้ขับเคลื่อนด้วย Nano Banana เครื่องมือสร้างภาพด้วย AI ที่ Google เปิดตัวเมื่อปีที่แล้ว ซึ่งนอกจากจะใช้งานผ่าน Gemini ได้แล้ว ยังมี API ให้นักพัฒนานำไปผสานเข้ากับซอฟต์แวร์ของตนเองด้วย ทั้งนี้ มีความเป็นไปได้ว่า Lyria 3 จะเปิดให้เข้าถึงผ่าน API ในอนาคตเช่นกัน
ในระหว่างนี้ โมเดลดังกล่าวเปิดให้ใช้งานสำหรับผู้ใช้ Gemini เวอร์ชันมือถือที่เป็นผู้ใหญ่ โดย Google มีแผนจะนำ Lyria 3 ไปยังเวอร์ชันเดสก์ท็อปในอีกไม่กี่วันข้างหน้า ลูกค้าที่สมัครแพ็กเกจ Google AI Plus, Pro และ Ultra จะมีขีดจำกัดการใช้งานที่สูงกว่า
การเปิดตัวครั้งนี้อาจเพิ่มการแข่งขันให้กับสตาร์ทอัพด้านดนตรี AI อย่าง Suno ซึ่งระดมทุนได้ 250 ล้านดอลลาร์ในเดือนพฤศจิกายน บริษัทให้บริการแบบฟรีเมียมที่ช่วยให้สามารถสร้างเสียงจากพรอมต์ภาษาธรรมชาติได้ โดยแพ็กเกจแบบชำระเงินจะมีฟีเจอร์เพิ่มเติม เช่น เวิร์กสเตชันเสียงเสมือนที่ช่วยให้ผู้ใช้ปรับแต่งแทร็กที่ AI สร้างขึ้นได้ด้วยตนเอง
ในอนาคต Google อาจพัฒนาฟีเจอร์ด้านดนตรีของ Gemini เพิ่มเติมได้หลายทาง เช่น ขยายข้อจำกัดความยาวแทร็ก 30 วินาที และเพิ่มความสามารถในการแก้ไขคล้ายกับที่ Suno มีให้บริการ บริษัทยังอาจผสาน Lyria 3 เข้ากับบริการผู้บริโภคอื่น ๆ มากขึ้น เช่น นำเสียงที่สร้างด้วย AI ไปใช้ในโลกเสมือนที่ผู้ใช้สร้างผ่าน Project Genie
ที่มา: https://siliconangle.com/2026/02/18/google-launches-lyria-3-music-generation-model/
TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย






