IBM เปิดตัวโมเดล Granite 3.2 พร้อมความสามารถด้านการให้เหตุผลแบบเปิด-ปิดได้

IBM ประกาศเปิดตัวโมเดล Granite 3.2 ใหม่ มาพร้อมความสามารถด้านการให้เหตุผล, การประมวลผลภาพ, และการพยากรณ์ พร้อมเปิดให้ใช้งานแบบโอเพนซอร์สภายใต้ใบอนุญาต Apache 2.0

p

IBM ได้เปิดตัวโมเดล AI Granite 3.2 ใหม่ โดยมีเวอร์ชัน Instruct ขนาด 8B และ 2B ที่สามารถทำงานด้านการสรุปความ, การแก้ปัญหา, และการสร้างโค้ด จุดเด่นของโมเดลนี้คือความสามารถด้านการให้เหตุผล “chain of thought” ที่สามารถเปิด-ปิดได้ตามต้องการผ่านการเขียนโปรแกรม แทนที่จะต้องใช้โมเดลแยกสำหรับการให้เหตุผล ช่วยประหยัดพลังงานเมื่อไม่จำเป็นต้องใช้งานฟีเจอร์นี้ ทีมวิศวกรของ IBM ได้พัฒนาเทคนิค inference scaling ใหม่ที่ช่วยลดต้นทุนการประมวลผลสำหรับงานการให้เหตุผล โดยเพิ่มระบบที่คอยตรวจสอบและปรับเส้นทางการให้เหตุผลไปยังผลลัพธ์ที่มีความเชื่อมั่นสูงกว่า

นอกจากนี้ IBM ยังเปิดตัว Granite Vision 3.2 2B โมเดล multimodal ที่มีความสามารถด้านการมองเห็น ออกแบบมาเพื่อช่วยองค์กรในการทำความเข้าใจเอกสารที่มีภาพประกอบ และ Granite Guardian 3.2 โมเดลสำหรับตรวจจับและระบุความเสี่ยงใน prompt และการตอบสนอง โดยให้ระดับความเชื่อมั่นแบบ “สูง” หรือ “ต่ำ” แทนที่จะเป็นแค่ “ใช่” หรือ “ไม่” IBM ยังเปิดตัวรุ่น 5 พันล้านพารามิเตอร์ที่รักษาประสิทธิภาพใกล้เคียงกับรุ่นต้นฉบับ และรุ่น 3B-A800M ที่ใช้เทคนิค Mixture-of-Experts ทำงานโดยเปิดใช้งานเพียง 800 ล้านพารามิเตอร์จากทั้งหมด 3 พันล้านในแต่ละครั้ง

ที่มา: https://siliconangle.com/2025/02/26/ibm-releases-new-granite-3-2-family-models-include-reasoning-want/

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่ Cupertino, CA แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

Ubuntu 25.04 “Plucky Puffin” พร้อมให้ดาวน์โหลดแล้ว

ปลายสัปดาห์ที่ผ่านมา Canonical ได้ปล่อย Ubuntu 25.04 “Plucky Puffin” เวอร์ชัน Stable ออกมาอย่างเป็นทางการแล้ว ที่มาพร้อมกับ Linux 6.14 Kernel, GNOME …

AWS Security Incident Response พร้อมสนับสนุนการเชื่อมต่อกับ AWS Private Link แล้ว

AWS ได้ประกาศการเชื่อมโยง AWS Security Incident Response กับ AWS PrivateLink ได้แล้ว ทำให้ผู้ใช้งานสามารถปรับปรุงกระบวนการตอบสนองต่อเหตุการณ์ ให้สามารถรักษาข้อมูล Traffic ทั้งหมดไว้อยู่ภายใน Private …