
IBM ได้ประกาศเปิดตัว IBM Granite 3.3 โมเดล Multimodal ใหม่ออกมาแล้ววันนี้ พร้อมชูโรงด้วยโมเดล Granite Speech 8B โมเดลแปลงเสียงเป็นข้อความ (Speech-To-Text หรือ STT) ตัวแรกของบริษัทอย่างเป็นทางการที่เตรียมเป็นฐานเพื่อพัฒนาเข้าสู่วงการ AI ด้านเสียงต่อไปในอนาคต
โดย Granite Speech 3.3 8B คือโมเดล STT ตัวแรกอย่างเป็นทางการของ IBM ที่ต่อยอดมาจาก IBM Granite 3.3 Instruct ที่อัปเดตล่าสุดเพิ่มขีดความสามารถด้านการให้เหตุผล พร้อมกับมีขีดความสามารถ Fill-in-the-middle (FIM) ที่ปรับปรุงการทำนายโทเคน (Token) ถัดไปได้ดีขึ้น
นอกจากนี้ IBM ยังได้ปล่อยชุด Retrieval Augmented Generation (RAG)-focused LoRA adapter สำหรับ Granite 3.2 ออกมาใหม่ เพื่อช่วยปรับปรุงแอปพลิเคชันที่ขับเคลื่อนด้วย Granite ให้มีประสิทธิภาพและคุณภาพที่ดีขึ้นด้วย
IBM Granite 3.3 Instruct พร้อมให้บริการบน IBM watsonx.ai แล้ว สำหรับผู้ที่สนใจใช้งาน IBM Granite 3.3 ทั้งในส่วนของ Granite Speech และ LoRA adapter สามารถดูรายละเอียดเพิ่มเติมได้ที่ Hugging Face, Ollama, Replicate หรือเว็บไซต์ของ IBM
ที่มา: https://www.ibm.com/new/announcements/ibm-granite-3-3-speech-recognition-refined-reasoning-rag-loras