Google เปิดตัว AI โมเดลในตระกูล Gemma ใหม่อีก 2 ตัว ใช้สำหรับงานช่วยเขียนโค้ดและงานวิจัย

เมื่อช่วงเดือนกุมภาพันธ์ที่ผ่านมา Google ได้ประกาศเปิดตัว Gemma โมเดล AI ใหม่เป็นครั้งแรก โดยเป็นโมเดลแบบเปิดซึ่งใช้งานวิจัยและเทคโนโลยีเดียวกันกับโมเดล Gemini ล่าสุด Google ได้เปิดตัวโมเดลใหม่ในตระกูล Gemma อีก 2 ตัว ได้แก่ CodeGemma และ RecurrentGemma
CodeGemma นั้นมีโมเดลให้เลือกใช้งานด้วยกัน 2 ตัว ได้แก่ 7B ทั้งแบบ Pretrained และ Instuction-tuned ซึ่งเหมาะสำหรับการทำ Code Completion และ Code Generation และ 2B เหมาะสำหรับการทำ Code Completion ที่เน้นความเร็ว ตอบโจทย์การนำมาใช้งานแบบ Local จุดเด่นคือการเทรนผ่านโทเคนขนาด 500 พันล้านโทเคน โดยใช้ภาษาอังกฤษ, ข้อมูลด้านคณิตศาตร์และซอร์สโค้ด ทำให้สามารถช่วยสร้างโค้ดที่ทำความเข้าใจได้ง่าย ช่วยลดข้อผิดพลาดลง รองรับภาษาหลักหลายตัว เช่น Python, JavaScript และ Java

Credit: Google
ในด้าน RecurrentGemma นั้นถูกพัฒนาขึ้นมาสำหรับนักวิจัยโดยเฉพาะ มีการใช้งาน Recurrent Neural Networks และ Local Attention เพื่อช่วยปรับปรุงการใช้งานหน่วยความจำให้มีประสิทธิภาพ ในขณะเดียวกันให้ประสิทธิภาพที่ใกล้เคียงกับโมเดล Gemma 2B จุดเด่นคือรองรับการนำไปใช้งานในอุปกรณ์หรือระบบที่มีหน่วยความจำจำกัด และให้ Throughput ของ Tokens per second ที่สูงกว่าโมเดลทั่วไป แสดงให้เห็นถึงความก้าวหน้าของงานวิจัยด้าน Deep learning ที่ใช้โมเดลแบบ non-transformer
นอกจากนี้ Google ยังออกอัปเดตโมเดล Gemma 1.1 เน้นการเพิ่มประสิทธิภาพและแก้ไขบั๊ก ผู้ที่สนใจสามารถใช้งาน Gemma และโมเดลใหม่ได้แล้วผ่านทาง Kaggle, Hugging Face และ Vertex AI Model Garden
ที่มา: https://developers.googleblog.com/2024/04/gemma-family-expands.html