NVIDIA ได้ตบเท้าวงการสร้างเสียงหรือเพลงด้วย Generative AI กับโมเดลใหม่ในชื่อ Fugatto โมเดลเสียงที่จะทำให้งานสร้างสรรค์เกี่ยวกับเสียงเพลงหรือเสียงพูดที่ต้องการ เป็นไปได้อย่างง่ายดาย
โดย Fugatto นั้นเป็นคำที่ย่อมาจาก Foundational Generative Audio Transformer Opus 1 ที่สามารถสังเคราะห์ สร้าง แปลง หรือผสมเสียงพูดหรือเพลงขึ้นมาได้ตาม Prompt ที่ส่งเข้าไป
หรือกล่าวคือ Fugatto ของ NVIDIA สามารถสร้างเสียงพูด หรือว่าเสียงเพลงได้ผ่านข้อความ Prompt หรือว่าจะนำเข้าเสียงตัวอย่างเข้ามาประกอบในการสร้างสรรค์งานเสียงบน Fugatto ได้ด้วย
และที่น่าทึ่งอย่างมาก Fugatto ยังสามารถนำเอาเสียงเพลงเข้ามาใส่เสียงจากเครื่องดนตรีใหม่มาประกอบเพลงได้อย่างไหลลื่น รวมทั้งยังสามารถเปลี่ยนสไตล์ของเสียงเพลงกลายเป็นอีกแนวหนึ่งได้อย่างรวดเร็ว หรือว่าจะให้สร้างเสียงเพลงใหม่ขึ้นมาก็สามารถดำเนินการได้ทันที
อนาคตไม่แน่ว่างานด้านเสียงต่าง ๆ หรือว่างานด้าน Sound Engineer เช่น การปรับโทนเพลง แต่งเพลงประกอบภาพยนตร์ การเปลี่ยนสไตล์เพลง เปลี่ยนเครื่องดนตรีในทำนองที่ต้องการ หรือว่าสร้างเสียงร้องที่ Cover เพลงที่ต้องการอาจจะทำได้ง่ายขึ้น ด้วยขีดความสามารถจากโมเดล Generative AI อย่าง Fugatto ของ NVIDIA ก็เป็นได้
รายละเอียดอื่น ๆ สามารถอ่านเพิ่มเติมได้ที่งานตีพิมพ์ของทาง NVIDIA และบล็อกของ NVIDIA
ที่มา: https://blogs.nvidia.com/blog/fugatto-gen-ai-sound-model/