Google ยังคงเดินหน้าทำให้โมเดลปัญญาประดิษฐ์ของตนเข้าถึงได้ง่ายขึ้น และได้ประกาศเปิดตัวเจเนอเรชันถัดไปของตระกูลโมเดลภาษาขนาดใหญ่แบบโอเพ่นซอร์สที่มีน้ำหนักเบาในชื่อ Gemma 3 ซึ่งสามารถรันบนหน่วยประมวลผลกราฟิก (GPU) เพียงตัวเดียว

โมเดล Gemma 3 รุ่นใหม่มีขนาดที่หลากหลาย ให้ทางเลือกแก่นักพัฒนาในการเลือกใช้โมเดลที่มีพารามิเตอร์ 1 พันล้าน, 4 พันล้าน, 12 พันล้าน และ 27 พันล้านพารามิเตอร์ ซึ่งช่วยให้วิศวกร AI และนักพัฒนาสามารถเลือกโมเดลที่เหมาะสมกับความต้องการด้านฮาร์ดแวร์และประสิทธิภาพได้ เช่น การรันบน GPU หรือหน่วยประมวลผลเทนเซอร์ (TPU) เพื่อรองรับโมเดลที่ซับซ้อนขึ้น หรือการใช้งานบนสมาร์ทโฟนที่ต้องการโมเดลขนาดเล็ก
เทคโนโลยีเบื้องหลัง Gemma ใช้การวิจัยทางเทคนิคเดียวกันกับโมเดล Gemini ของ Google ซึ่งเป็นโมเดลที่ซับซ้อนและทรงพลังที่สุดของบริษัทในปัจจุบัน Gemini เป็นขุมพลังของแชตบอต AI ภายใต้ชื่อเดียวกันซึ่งสามารถใช้งานได้ทั้งบนเว็บและอุปกรณ์มือถือ และยังถูกนำไปใช้ในบริการ AI อื่น ๆ ของ Google อีกด้วย
ด้วยการออกแบบทางเทคนิคนี้ Google ระบุว่า Gemma 3 สามารถให้ประสิทธิภาพสูงเมื่อเทียบกับขนาดของมัน โดยสามารถทำงานได้ดีกว่าโมเดลขนาดใหญ่กว่า เช่น Llama-405B, DeepSeek-V3 และ o3-mini ของ OpenAI ในการประเมินความพึงพอใจของมนุษย์เบื้องต้นบนกระดานคะแนน LMArena
แม้จะรันบนอุปกรณ์หรือ GPU เพียงตัวเดียว Gemma 3 ยังคงมอบพลังประมวลผลเพียงพอสำหรับนักพัฒนาในการสร้างแอปพลิเคชัน AI ที่มีความสามารถแบบมัลติโมดอล พร้อมการวิเคราะห์ข้อความและภาพขั้นสูง นอกจากนี้ยังรองรับ context window ขนาด 128,000 โทเคน ซึ่งหมายความว่าสามารถจัดการกับภาพความละเอียดสูงประมาณ 30 ภาพ หนังสือ 300 หน้า หรือวิดีโอนานกว่า 1 ชั่วโมง ซึ่งเทียบได้กับ context length ของ GPT-4o ของ OpenAI
Google ยังระบุว่า ตระกูลโมเดลนี้รองรับความสามารถเรียกฟังก์ชัน และ การใช้งานเครื่องมือ ซึ่งช่วยให้นักพัฒนาสามารถทำงานอัตโนมัติและสร้างเอเจนต์ AI ได้ เมื่อรวมกับ context window ขนาดใหญ่ Gemma 3 จะสามารถประมวลผลข้อมูลจำนวนมากและทำงานที่ซับซ้อนตามลำดับขั้นได้
นอกเหนือจาก Gemma 3 แล้ว Google ยังได้เปิดตัว ShieldGemma 2 ซึ่งเป็นโมเดลขนาด 4 พันล้านพารามิเตอร์ ที่สามารถตรวจสอบภาพเพื่อประเมินความมั่นคงปลอดภัย และระบุว่าภาพนั้นปลอดภัยหรือเป็นอันตราย
ShieldGemma ช่วยให้นักพัฒนาสร้างแอปพลิเคชันที่สามารถตรวจสอบภาพที่อัปโหลดเพื่อหาว่ามีเนื้อหาที่อาจเป็นอันตรายหรือไม่ โดยระบบจะให้ป้ายกำกับความมั่นคงปลอดภัยใน 3 หมวดหมู่หลัก ได้แก่ “เนื้อหาที่เป็นอันตราย”, “เนื้อหาเกี่ยวกับเรื่องเพศ” และ “ความรุนแรง”
นักพัฒนาที่นำ ShieldGemma ไปใช้สามารถปรับแต่งโมเดลให้เหมาะสมกับความต้องการเฉพาะของตนเองได้ โดยสามารถระบุเนื้อหาที่ต้องการตรวจสอบและให้ป้ายกำกับ นอกจากนี้ โมเดลนี้ยังเป็น โอเพนซอร์ส ทำให้สามารถฝึกโมเดลให้รองรับความต้องการเฉพาะของอุตสาหกรรมต่าง ๆ ได้
ที่มา: https://siliconangle.com/2025/03/12/google-introduces-gemma-3-family-accessible-lightweight-models/