Google เปิดตัวพรีวิวโมเดลเน้นความเร็ว Gemini 3.1 Flash-Lite 

Google ได้เปิดตัว Gemini 3.1 Flash-Lite ซึ่งเป็นสมาชิกใหม่ล่าสุดในซีรีส์โมเดลปัญญาประดิษฐ์แบบมัลติโหมด Gemini

Credit: Google

วิศวกรของบริษัทได้พัฒนาอัลกอริทึมนี้โดยคำนึงถึงความคุ้มค่าด้านต้นทุนเป็นหลัก โดย Gemini 3.1 Pro ซึ่งเป็นโมเดลที่มีความสามารถสูงสุดของ Google มีราคาเริ่มต้นที่ 2 ดอลลาร์ต่อ 1 ล้านโทเค็นอินพุต และ 18 ดอลลาร์ต่อหนึ่งล้านโทเค็นเอาต์พุต ซึ่งอัตราเหล่านี้จะเพิ่มขึ้นอย่างมากสำหรับภาระงานที่ซับซ้อน ในขณะที่ Gemini 3.1 Flash-Lite มีราคาเพียง 0.25 ดอลลาร์ต่อ 1 ล้านโทเค็นอินพุต และมีค่าใช้จ่ายในการสร้างโทเค็นเอาต์พุต อยู่ที่ 1.50 ดอลลาร์ต่อ 1 ล้านโทเค็น

Google ระบุว่าอัลกอริทึมนี้ยังมีความเร็วที่เหนือกว่าโมเดล Gemini อื่น ๆ โดยในการทดสอบภายใน บริษัทได้เปรียบเทียบกับ Gemini 2.5 Flash ซึ่งเป็น AI รุ่นก่อนหน้าที่มีการปรับแต่งเพื่อความคุ้มค่าเช่นเดียวกัน ผลปรากฏว่า Gemini 3.1 Flash-Lite มีความเร็วในการสร้างคำตอบโดยรวมสูงกว่าถึง 45% ในขณะที่ระยะเวลาที่ผู้ใช้ต้องรอจนกว่าโทเค็นแรกจะปรากฏนั้นสั้นลงถึง 2.5 เท่า

โมเดลนี้สามารถประมวลผลพรอมต์แบบมัลติโหมดที่มีข้อมูลสูงสุดถึง 1 ล้านโทเค็นและสร้างคำตอบที่เป็นข้อความได้สูงสุด 64,000 โทเค็น ซึ่งข้อความดังกล่าวสามารถรวมถึงโค้ดซอฟต์แวร์ที่ช่วยให้ Gemini 3.1 Flash-Lite สร้างสินทรัพย์ในลักษณะภาพ เช่น แดชบอร์ดสำหรับระบบธุรกิจอัจฉริยะ จากโค้ดได้

Google ได้ทำการทดสอบเบนช์มาร์กจำนวน 11 รายการเพื่อประเมินคุณภาพของผลลัพธ์โดย Gemini 3.1 Flash-Lite สามารถทำคะแนนสูงสุดได้ใน 6 การทดสอบ เอาชนะ GPT-5 mini และ Claude 4.5 Haiku ของ Anthropic หนึ่งในเบนช์มาร์กที่โมเดลนี้ทำคะแนนได้แม่นยำกว่าคือ GPAQ Diamond ซึ่งประกอบด้วยคำถามทางวิทยาศาสตร์ระดับปริญญาเอกเกือบ 200 ข้อ

โมเดลนี้ทำคะแนนได้ 16% ใน HLA ซึ่งเป็นหนึ่งในเบนช์มาร์กของ AI ที่ยากที่สุดในโลก ส่วน Gemini 3.1 Pro ซึ่งเป็นรุ่นสูงสุดของ Google ทำคะแนนได้ 44.4%

บริษัทมองเห็นว่าเหล่านักพัฒนาจะใช้ Gemini 3.1 Flash-Lite สำหรับงานที่มีปริมาณมากและไม่ต้องการความสามารถในการใช้เหตุผลที่ซับซ้อนมากนัก ยกตัวอย่างเช่น ผู้ให้บริการตลาดอีคอมเมิร์ซสามารถใช้โมเดลนี้เพื่อแปลรายการสินค้าจากบุคคลที่สาม และบล็อกรายการสินค้าที่ละเมิดข้อกำหนดการให้บริการ นอกจากนี้โมเดลยังเหมาะกับงานเฉพาะทางอื่น ๆ โดยวิดีโอสาธิตที่ Google โพสต์แสดงให้เห็นถึงนักพัฒนาที่ใช้ Gemini 3.1 Flash-Lite เพื่อสร้างแดชบอร์ดติดตามสภาพอากาศด้วยพรอมต์ภาษาธรรมชาติ และในการสาธิตอีกชุด โมเดลได้เพิ่มรายการสินค้าจำลองหลายร้อยรายการลงในต้นแบบเว็บไซต์อีคอมเมิร์ซ

โมเดลใหม่นี้มีพื้นฐานมาจาก Gemini 3 Pro ซึ่งเคยเป็นโมเดลหลักด้านการใช้เหตุผลของ Google จนถึงเมื่อไม่นานมานี้ โดยอัลกอริทึมหลังนี้ใช้สถาปัตยกรรมแบบ mixture-of-experts ซึ่งหมายความว่ามันจะเปิดใช้งานพารามิเตอร์เพียงบางส่วนเพื่อตอบคำถามเท่านั้น วิธีการนี้ช่วยลดต้นทุนของอินเฟอเรนซ์ลง

Gemini 3.1 Flash-Lite เปิดให้ใช้งานแล้วในเวอร์ชันพรีวิวผ่านชุดบริการ AI ที่ชื่อว่า Vertex AI บน Google Cloud นอกจากนี้ยังสามารถเข้าถึงได้ผ่านเครื่องมือสร้างโค้ด Google AI Studio ซึ่งช่วยให้นักพัฒนาสามารถสร้างแอปพลิเคชันแบบง่ายๆ ด้วยพรอมต์ภาษาธรรมชาติได้

ที่มา: https://siliconangle.com/2026/03/03/google-launches-speedy-gemini-3-1-flash-lite-model-preview/

About นักเขียนฝึกหัดหมายเลขเก้า

Check Also

เลือก Cloud Infrastructure ที่เหมาะกับการใช้งาน AI ระดับองค์กร [PR]

เมื่อองค์กรเริ่มนำ AI เข้ามาเป็นส่วนสำคัญในการขับเคลื่อนธุรกิจ ความพร้อมของโครงสร้างพื้นฐานจึงกลายเป็นอีกหนึ่งปัจจัยที่ไม่อาจมองข้าม จากรายงานของ McKinsey & Company (2025) ระบุว่า สัดส่วนองค์กรที่นำ AI มาใช้ในการทำงานเพิ่มขึ้นเป็น 88 เปอร์เซ็นต์ …

HPE อัดยาแรง! แจกฟรี VM Essentials 1 ปี พร้อม Zerto 1 ดอลลาร์ ดึงลูกค้า VMware

HPE ใช้จังหวะที่ VMware ปรับขึ้นค่าไลเซนส์ นำเสนอสิทธิพิเศษให้ลูกค้าใช้งานระบบ VM Essentials ฟรี 1 ปีเต็ม พร้อมสิทธิ์ใช้งานซอฟต์แวร์ปกป้องข้อมูล Zerto ในราคาเพียง 1 ดอลลาร์ …