NVIDIA เปิดตัว Fugatto โมเดลสร้างเสียงเพลงด้วย Prompt 

NVIDIA ได้ตบเท้าวงการสร้างเสียงหรือเพลงด้วย Generative AI กับโมเดลใหม่ในชื่อ Fugatto โมเดลเสียงที่จะทำให้งานสร้างสรรค์เกี่ยวกับเสียงเพลงหรือเสียงพูดที่ต้องการ เป็นไปได้อย่างง่ายดาย

โดย Fugatto นั้นเป็นคำที่ย่อมาจาก Foundational Generative Audio Transformer Opus 1 ที่สามารถสังเคราะห์ สร้าง แปลง หรือผสมเสียงพูดหรือเพลงขึ้นมาได้ตาม Prompt ที่ส่งเข้าไป 

หรือกล่าวคือ Fugatto ของ NVIDIA สามารถสร้างเสียงพูด หรือว่าเสียงเพลงได้ผ่านข้อความ Prompt หรือว่าจะนำเข้าเสียงตัวอย่างเข้ามาประกอบในการสร้างสรรค์งานเสียงบน Fugatto ได้ด้วย 

และที่น่าทึ่งอย่างมาก Fugatto ยังสามารถนำเอาเสียงเพลงเข้ามาใส่เสียงจากเครื่องดนตรีใหม่มาประกอบเพลงได้อย่างไหลลื่น รวมทั้งยังสามารถเปลี่ยนสไตล์ของเสียงเพลงกลายเป็นอีกแนวหนึ่งได้อย่างรวดเร็ว หรือว่าจะให้สร้างเสียงเพลงใหม่ขึ้นมาก็สามารถดำเนินการได้ทันที

อนาคตไม่แน่ว่างานด้านเสียงต่าง ๆ หรือว่างานด้าน Sound Engineer เช่น การปรับโทนเพลง แต่งเพลงประกอบภาพยนตร์ การเปลี่ยนสไตล์เพลง เปลี่ยนเครื่องดนตรีในทำนองที่ต้องการ หรือว่าสร้างเสียงร้องที่ Cover เพลงที่ต้องการอาจจะทำได้ง่ายขึ้น ด้วยขีดความสามารถจากโมเดล Generative AI อย่าง Fugatto ของ NVIDIA ก็เป็นได้

รายละเอียดอื่น ๆ สามารถอ่านเพิ่มเติมได้ที่งานตีพิมพ์ของทาง NVIDIA และบล็อกของ NVIDIA

ที่มา: https://blogs.nvidia.com/blog/fugatto-gen-ai-sound-model/

About chatchai

Tech Writer แห่ง TechTalk Thai ที่สนใจในทุกนวัตกรรมและเทคโนโลยี

Check Also

Salesforce เข้าซื้อกิจการ Fin มูลค่าราว 3,600 ล้านดอลลาร์ เสริมแกร่ง AI Agent งานบริการลูกค้า

Salesforce ประกาศลงนามข้อตกลงขั้นสุดท้ายเข้าซื้อกิจการ Fin ผู้ให้บริการแพลตฟอร์ม customer agent ในมูลค่าราว 3,600 ล้านดอลลาร์สหรัฐ เพื่อนำเทคโนโลยี AI Agent สำหรับงานบริการลูกค้ามาเสริมความสามารถให้กับ Agentforce

Cisco ออกแพตช์แก้ช่องโหว่ Zero-day บน Catalyst SD-WAN Manager ที่ถูกใช้โจมตียกระดับสิทธิ์เป็น root

Cisco ปล่อยอัปเดตด้านความปลอดภัยแก้ช่องโหว่บน Catalyst SD-WAN Manager (เดิมคือ SD-WAN vManage) หลังพบว่าถูกใช้โจมตีจริงในลักษณะ Zero-day เพื่อยกระดับสิทธิ์เป็น root บนระบบที่ได้รับผลกระทบ