ช่วงสัปดาห์ที่ผ่านมา NVIDIA ได้ปล่อยโมเดล LLaMA-Mesh โมเดล LLM ใหม่ที่จะช่วยสนับสนุนให้ผู้ใช้งานสามารถสร้างโมเดลวัตถุสามมิติ (3D Mesh) ได้จาก Prompt ที่ส่งเข้าไปเป็นข้อความเท่านั้น
โดย LLaMA-Mesh ของทาง NVIDIA นั้นถือได้ว่าเป็นวิธีการแบบใหม่ในการใช้งานโมเดลภาษา LLM เพื่อสร้างเป็นวัตถุสามมิติได้ทันทีจากข้อความ Prompt ซึ่งเป็นการผสมผสานการสร้าง 3D Mesh ด้วยการใช้ความเข้าใจทางภาษาไว้ในโมเดลเดียว

Credit : LLaMA-Mesh
LLaMA-Mesh นี้เกิดขึ้นจากความร่วมมือระหว่าง NVIDIA กับทีมนักวิจัย Tsinghua University ซึ่งถูกสร้างต่อยอดมาจากโมเดลภาษา LLaMA ด้วยการ Fine-Tune กับชุดข้อมูล 3D ที่คัดสรรมาแล้ว โดยทั้งสองออกแบบวิธีการที่จะทำให้โมเดลยังคงรักษาขีดความสามารถทางด้านภาษาไว้ในขณะที่ยังคงสามารถสร้างวัตถุสามมิติและเข้าใจในวัตถุสามมิติได้ด้วย

Credit : LLaMA-Mesh
สำหรับผู้ที่สนใจโมเดล LLaMA-Mesh สามารถเข้าไปดูรายละเอียดเพิ่มเติมได้ที่ GitHub นี้ และสามารถอ่านรายละเอียดงานวิจัยเพิ่มเติมได้ที่นี่