IBM ประกาศเปิดตัวโมเดล Granite 3.2 ใหม่ มาพร้อมความสามารถด้านการให้เหตุผล, การประมวลผลภาพ, และการพยากรณ์ พร้อมเปิดให้ใช้งานแบบโอเพนซอร์สภายใต้ใบอนุญาต Apache 2.0
p
IBM ได้เปิดตัวโมเดล AI Granite 3.2 ใหม่ โดยมีเวอร์ชัน Instruct ขนาด 8B และ 2B ที่สามารถทำงานด้านการสรุปความ, การแก้ปัญหา, และการสร้างโค้ด จุดเด่นของโมเดลนี้คือความสามารถด้านการให้เหตุผล “chain of thought” ที่สามารถเปิด-ปิดได้ตามต้องการผ่านการเขียนโปรแกรม แทนที่จะต้องใช้โมเดลแยกสำหรับการให้เหตุผล ช่วยประหยัดพลังงานเมื่อไม่จำเป็นต้องใช้งานฟีเจอร์นี้ ทีมวิศวกรของ IBM ได้พัฒนาเทคนิค inference scaling ใหม่ที่ช่วยลดต้นทุนการประมวลผลสำหรับงานการให้เหตุผล โดยเพิ่มระบบที่คอยตรวจสอบและปรับเส้นทางการให้เหตุผลไปยังผลลัพธ์ที่มีความเชื่อมั่นสูงกว่า
นอกจากนี้ IBM ยังเปิดตัว Granite Vision 3.2 2B โมเดล multimodal ที่มีความสามารถด้านการมองเห็น ออกแบบมาเพื่อช่วยองค์กรในการทำความเข้าใจเอกสารที่มีภาพประกอบ และ Granite Guardian 3.2 โมเดลสำหรับตรวจจับและระบุความเสี่ยงใน prompt และการตอบสนอง โดยให้ระดับความเชื่อมั่นแบบ “สูง” หรือ “ต่ำ” แทนที่จะเป็นแค่ “ใช่” หรือ “ไม่” IBM ยังเปิดตัวรุ่น 5 พันล้านพารามิเตอร์ที่รักษาประสิทธิภาพใกล้เคียงกับรุ่นต้นฉบับ และรุ่น 3B-A800M ที่ใช้เทคนิค Mixture-of-Experts ทำงานโดยเปิดใช้งานเพียง 800 ล้านพารามิเตอร์จากทั้งหมด 3 พันล้านในแต่ละครั้ง