Google ประกาศพร้อมให้บริการ Gemini 1.5 Flash-8B แบบ General Availability โมเดล AI ขนาดเล็กที่มีประสิทธิภาพสูง พร้อมเพิ่ม Rate limit 2 เท่า

Google ได้ประกาศเปิดตัว Gemini 1.5 Flash-8B ให้ใช้งานแบบ General Availability (GA) แล้ว โดยเป็นเวอร์ชันที่มีขนาดเล็กลงและเร็วขึ้นของโมเดล Gemini 1.5 Flash เดิม Gemini 1.5 Flash-8B นี้มีราคาถูกลงครึ่งหนึ่งและมีประสิทธิภาพใกล้เคียงกับรุ่นต้นฉบับในหลายด้าน โดยเฉพาะอย่างยิ่งในงานประเภทการแชท, การถอดความเสียง, และการแปลภาษาที่มีบริบทยาว
โมเดลใหม่นี้ได้รับการปรับแต่งให้เหมาะสมกับการใช้งานในอุปกรณ์ที่มีทรัพยากรจำกัด เช่น สมาร์ทโฟนและ Sensor ด้วย Latency ที่ต่ำลงสำหรับคำสั่งขนาดเล็ก ทำให้สามารถตอบสนองได้รวดเร็วยิ่งขึ้น นอกจากนี้ Google ยังได้เพิ่ม Rate limit การใช้งานเป็นสองเท่า โดยนักพัฒนาสามารถส่ง request ได้สูงสุด 4,000 ครั้งต่อนาที ซึ่งเหมาะอย่างยิ่งสำหรับงานที่มีปริมาณสูงและต้องการการประมวลผลที่รวดเร็ว
ที่สำคัญ Gemini 1.5 Flash-8B ถือเป็นโมเดล Gemini ที่มีต้นทุนต่อประสิทธิภาพต่ำที่สุดเท่าที่เคยเปิดตัวมา ทำให้เป็นทางเลือกที่น่าสนใจสำหรับองค์กรที่ต้องการใช้ประโยชน์จาก AI แต่มีข้อจำกัดด้านงบประมาณ นักพัฒนาสามารถเข้าถึง Gemini 1.5 Flash-8B ได้ฟรีผ่าน Gemini API และ Google AI Studio ซึ่งเป็นเครื่องมือที่ช่วยให้การพัฒนาและทดสอบแอปพลิเคชัน AI เป็นไปได้อย่างสะดวกและรวดเร็ว