IBM ปล่อย Granite 3.3 โมเดล Speech-To-Text ของบริษัทตัวแรกอย่างเป็นทางการ

IBM ได้ประกาศเปิดตัว IBM Granite 3.3 โมเดล Multimodal ใหม่ออกมาแล้ววันนี้ พร้อมชูโรงด้วยโมเดล Granite Speech 8B โมเดลแปลงเสียงเป็นข้อความ (Speech-To-Text หรือ STT) ตัวแรกของบริษัทอย่างเป็นทางการที่เตรียมเป็นฐานเพื่อพัฒนาเข้าสู่วงการ AI ด้านเสียงต่อไปในอนาคต

โดย Granite Speech 3.3 8B คือโมเดล STT ตัวแรกอย่างเป็นทางการของ IBM ที่ต่อยอดมาจาก IBM Granite 3.3 Instruct ที่อัปเดตล่าสุดเพิ่มขีดความสามารถด้านการให้เหตุผล พร้อมกับมีขีดความสามารถ Fill-in-the-middle (FIM) ที่ปรับปรุงการทำนายโทเคน (Token) ถัดไปได้ดีขึ้น

นอกจากนี้ IBM ยังได้ปล่อยชุด Retrieval Augmented Generation (RAG)-focused LoRA adapter สำหรับ Granite 3.2 ออกมาใหม่ เพื่อช่วยปรับปรุงแอปพลิเคชันที่ขับเคลื่อนด้วย Granite ให้มีประสิทธิภาพและคุณภาพที่ดีขึ้นด้วย 

IBM Granite 3.3 Instruct พร้อมให้บริการบน IBM watsonx.ai แล้ว สำหรับผู้ที่สนใจใช้งาน IBM Granite 3.3 ทั้งในส่วนของ Granite Speech และ LoRA adapter สามารถดูรายละเอียดเพิ่มเติมได้ที่ Hugging Face, Ollama, Replicate หรือเว็บไซต์ของ IBM  

ที่มา: https://www.ibm.com/new/announcements/ibm-granite-3-3-speech-recognition-refined-reasoning-rag-loras

About chatchai

Tech Writer แห่ง TechTalk Thai ที่สนใจในทุกนวัตกรรมและเทคโนโลยี

Check Also

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Sonar ผู้ให้บริการแพลตฟอร์มตรวจสอบคุณภาพและความมั่นคงปลอดภัยของโค้ด ประกาศเข้าซื้อกิจการ Gitar สตาร์ตอัปผู้เชี่ยวชาญด้านระบบ AI-native Code Review การเข้าซื้อกิจการครั้งนี้มีเป้าหมายเพื่อผสานความสามารถด้านการคิดวิเคราะห์ของ Gitar เข้ากับเอนจินตรวจสอบโค้ดของ Sonar เพื่อสร้างความมั่นคงปลอดภัยที่รัดกุมยิ่งขึ้นสำหรับทีม DevOps ในยุคที่ …

Huawei เปิดตัวสถาปัตยกรรมชิปใหม่ แก้ปัญหาคว่ำบาตรและข้อจำกัด Moore’s Law

Huawei Technologies ยักษ์ใหญ่ด้านอิเล็กทรอนิกส์จากจีนได้เปิดตัวเฟรมเวิร์กการออกแบบชิปใหม่ ซึ่งบริษัทระบุว่าจะช่วยลดช่องว่างในอุตสาหกรรมเซมิคอนดักเตอร์กับผู้นำระดับโลกอย่าง TSMC และ Nvidia ได้